诊断结核病的化合物和方法

文档序号:6141823阅读:407来源:国知局
专利名称:诊断结核病的化合物和方法
技术领域
本发明总地涉及结核分枝杆菌(Mycobacterium tuberculosis)感染的检测。本发明更具体地涉及包含结核分枝杆菌抗原、其一部分或其它变体的多肽,以及这些多肽用来血清诊断结核分枝杆菌感染的用途。
背景技术
结核病是一种慢性传染性疾病,它通常由结核分枝杆菌感染引起。它在发展中国家中是主要的疾病,对于世界上的发达地区也是正增加的问题,每年有大约800万新的病例和300万死者。尽管感染可能在相当长的时间内没有症状,但是该病最常见的表现为肺部急性炎症,导致发热和干咳。若不治疗,通常会导致严重的并发症和死亡。
虽然结核病通常可用长期抗生素治疗来控制,但是这些治疗却不足以防止疾病的传播。受感染的个体可能没有症状,但有时有传染性。另外,虽然遵从治疗方案很关键,但是患者的行为很难监控。一些患者没有完成疗程,这样会导致治疗没有效果并产生抗药性。
抑制结核病的传播需要有效的疫苗接种和准确地早期诊断该疾病。当前,用活细菌免疫接种是诱导保护性免疫力最有效的方法。用于此目的的最常用的分枝杆菌是Bacillus Calmette-Guerin(BCG)卡介苗,一种牛分枝杆菌的无毒菌株。然而,BCG的安全性和有效性引起了争论,一些国家(如美国)不对一般公众接种该疫苗。诊断通常用皮肤试验来实现,该试验涉及真皮内接触结核菌素PPD(纯化的蛋白衍生物)。抗原特异性T细胞应答在注射后48-72小时在注射部位导致可测定的培育,表明接触过分枝杆菌抗原。然而,该试验的问题是敏感性和特异性,且不能区别接种过BCG疫苗的个体和感染的个体。
尽管已证明巨噬细胞起结核分枝杆菌免疫力的主要效应物的作用,但T细胞却是该免疫力的主要诱导物。T细胞在抵抗结核分枝杆菌感染的保护中所起的基本作用AIDS患者中通过结核分枝杆菌的发病频繁而得以阐明,这是由于人免疫缺陷病毒(HIV)感染伴有CD4 T细胞损耗。已经证明分枝杆菌反应性CD4 T细胞是γ干扰素(IFN-γ)的强效生产者,进而证明γ干扰素引发了小鼠体内巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人体内的作用尚不清楚,但是研究已经表明,单用1,25-二羟基-维生素D3或与IFN-γ或肿瘤坏死因子α合用激活了人巨噬细胞,从而抑制了结核分枝杆菌感染。另外,已知IFN-γ刺激人巨噬细胞产生1,25-二羟基-维生素D3。类似地,业已证明IL-12在刺激对结核分枝杆菌感染的抵抗力中起作用。关于结核分枝杆菌感染的免疫学的综述参见Chan和Kaufmann在《结核病发病机理、保护和控制》,Bloom编辑,ASM出版社,Washington,DC,1994。
因此,本领域中需要有改进的诊断方法来检测结核病。本发明实现了这一需求并且还提供了其它有关的优点。
发明概述简言之,本发明提供了诊断结核病的组合物和方法。一方面,本发明提供了多肽,该多肽含有可溶性结核分枝杆菌抗原的抗原性部分、或仅仅在保守性置换和/或修饰中有所不同的该抗原的变体。在该方面的一个实施方案中,可溶性抗原具有下列N-端序列中的一个序列
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID NO:115);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO:116);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID NO:117);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID NO:118);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID NO:119);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ IDNO:120);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser(SEQ ID NO:121);(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID NO:122);(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID NO:123);(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser,(SEQ ID NO:129)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;(SEQ ID NO:130)或(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID NO:131)其中Xaa可以是任何氨基酸。
在一个相关的方面,提供了多肽,该多肽含有结核分枝杆菌抗原的免疫原性部分、或仅仅在保守性置换和/或修饰中有所不同的该抗原的变体,该抗原具有下列N-端序列之一(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID NO:132)或(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID NO:124)其中Xaa可以是任何氨基酸。
在另一个实施方案中,可溶性结核分枝杆菌抗原包含由DNA序列编码的氨基酸序列,该DNA序列选自SEQ ID NO:1、2、4-10、13-25、52、94和96中描述的序列、所述序列的互补序列、以及在中等严谨条件下与SEQ ID NO:1、2、4-10、13-25、52、94和96中描述的序列或其互补序列杂交的DNA序列。
在一个相关的方面,多肽包含结核分枝杆菌抗原的抗原性部分,或仅仅在保守性置换和/或修饰中有所不同的该抗原的变体,其中抗原包含的氨基酸序列由DNA序列编码,该DNA序列选自SEQ ID NO:26-51、133、134、158-178、184-188、194-196、198、210-220、232、234、235、237-242、248-251、256-271、287、288、290-293和298-337中描述的序列、所述序列的互补序列、以及在中等严谨条件下与SEQ ID NO:26-51、133、134、158-178、184-188、194-196、198、210-220、232、234、235、237-242、248-251、256-271、287、288、290-293和298-337中描述的序列或其互补序列杂交的DNA序列。
在相关方面,还提供了编码上述多肽的DNA序列、含有这些DNA序列的重组表达载体以及转化或转染了这些表达载体的宿主细胞。
另一方面,本发明提供了融合蛋白,该蛋白含有第一种和第二种本发明的多肽,或者本发明的多肽与一种已知的结核分枝杆菌抗原。
在本发明的另一方面,提供了检测患者结核病的方法和诊断试剂盒。该方法包括(a)使生物样品与至少一种上述多肽接触;和(b)检测样品中结合上述多肽的抗体是否存在,从而检测生物样品中结核分枝杆菌的感染。合适的生物样品包括全血、痰液、血清、血浆、唾液、脑脊液和尿液。诊断试剂盒包含一种或多种上述多肽与检测试剂联合使用。
本发明还提供检测结核分枝杆菌感染的方法,该方法包括(a)从患者获得生物样品;(b)使样品在聚合酶链反应中与至少一个寡核苷酸引物接触,该寡核苷酸引物对编码上述多肽的DNA序列有特异性;和(c)检测样品中在第一和第二寡核苷酸引物存在下扩增的DNA序列。在一个实施方案中,寡核苷酸引物含有该DNA序列的至少大约10个连续的核苷酸。
另一方面,本发明提供了检测患者结核分枝杆菌感染的方法,该方法包括(a)获得患者的生物样品;(b)使样品与对编码上述多肽的DNA序列有特异性的寡核苷酸探针接触;和(c)检测样品中与寡核苷酸探针杂交的DNA序列。在一个实施方案中,寡核苷酸探针包含该DNA序列的至少约15个连续的核苷酸。
另一方面,本发明提供了与上述多肽结合抗体(单克隆抗体和多克隆抗体),以及它们在检测结核分枝杆菌感染中的用途。
在参看了下列详细描述和所附附图后,本发明的这些方面和其它方面将是显而易见的。本文公开的所有文献均全部纳入本文作参考,正如每一份文献单独纳入本文一样。
附图简述和序列说明

图1A和B说明了实施例1中描述的14Kd,20Kd和26Kd抗原分别刺激第一和第二结核分枝杆菌免疫供体T细胞的增殖和干扰素γ产生情况。
图2A-D描述了针对分泌型结核分枝杆菌蛋白(已知的结核分枝杆菌抗原85b)以及本发明抗原Tb38-1和TbH-9产生的抗血清,分别与结核分枝杆菌裂解液(泳道2)、结核分枝杆菌分泌性蛋白(泳道3)、重组Tb38-1(泳道4)、重组TbH-9(泳道5)以及重组85b(泳道5)的反应性。
图3A描述了分泌型结核分枝杆菌蛋白、重组TbH-9以及对照抗原TbRa11刺激TbH-9特异性T细胞克隆增殖。
图3B描述了分泌型结核分枝杆菌蛋白、PPD和重组TbH-9刺激TbH-9-特异性T细胞克隆产生干扰素γ。
图4描述了两种典型的多肽与感染了结核分枝杆菌的个体以及未感染个体的血清的反应性与细菌裂解液反应性的比较。
图5显示了四种典型的多肽与感染及未感染结核分枝杆菌的个体的血清的反应性,与38kD抗原反应性的比较。
图6显示了重组38kD和TbRa11抗原与结核分枝杆菌患者、PPD阳性献血员以及正常献血员的血清的反应性。
图7显示了抗原TbRa2A与38kD阴性血清的反应性。
图8显示了SEQ ID NO:60的抗原与结核分枝杆菌患者以及正常献血员的血清的反应性。
图9描述了重组抗原TbH-29(SEQ ID NO:137)与结核分枝杆菌患者、PPD阳性献血员和正常献血员的血清经间接ELISA测得的反应性。
图10描述了重组抗原TbH-33(SEQ ID NO:140)与结核分枝杆菌患者以及正常献血员的血清、以及与结核分枝杆菌患者合并血清的直接和间接ELISA测得的反应性。
图11描述了浓度增加的重组抗原TbH-33(SEQ ID NO:140)与结核分枝杆菌患者以及正常献血员的血清经ELISA测得的反应性。
图12A-E分别描述了重组抗原MO-1、MO-2、MO-4、MO-28和MO-29分别与结核分枝杆菌患者以及正常献血员的血清经ELISA测得的反应性。
SEQ ID NO:1是TbRa1的DNA序列。
SEQ ID NO:2是TbRa10的DNA序列。
SEQ ID NO:3是TbRa11的DNA序列。
SEQ ID NO:4是TbRa12的DNA序列。
SEQ ID NO:5是TbRa13的DNA序列。
SEQ ID NO:6是TbRa16的DNA序列。
SEQ ID NO:7是TbRa17的DNA序列。
SEQ ID NO:8是TbRa18的DNA序列。
SEQ ID NO:9是TbRa19的DNA序列。
SEQ ID NO:10是TbRa24的DNA序列。
SEQ ID NO:11是TbRa26的DNA序列。
SEQ ID NO:12是TbRa28的DNA序列。
SEQ ID NO:13是TbRa29的DNA序列。
SEQ ID NO:14是TbRa2A的DNA序列。
SEQ ID NO:15是TbRa3的DNA序列。
SEQ ID NO:16是TbRa32的DNA序列。
SEQ ID NO:17是TbRa35的DNA序列。
SEQ ID NO:18是TbRa36的DNA序列。
SEQ ID NO:19是TbRa4的DNA序列。
SEQ ID NO:20是TbRa9的DNA序列。
SEQ ID NO:21是TbRaB的DNA序列。
SEQ ID NO:22是TbRaC的DNA序列。
SEQ ID NO:23是TbRaD的DNA序列。
SEQ ID NO:24是YYWCPG的DNA序列。
SEQ ID NO:25是AAMK的DNA序列。
SEQ ID NO:26是TbL-23的DNA序列。
SEQ ID NO:27是TbL-24的DNA序列。
SEQ ID NO:28是TbL-25的DNA序列。
SEQ ID NO:29是TbL-28的DNA序列。
SEQ ID NO:30是TbL-29的DNA序列。
SEQ ID NO:31是TbH-5的DNA序列。
SEQ ID NO:32是TbH-8的DNA序列。
SEQ ID NO:33是TbH-9的DNA序列。
SEQ ID NO:34是TbM-1的DNA序列。
SEQ ID NO:35是TbM-3的DNA序列。
SEQ ID NO:36是TbM-6的DNA序列。
SEQ ID NO:37是TbM-7的DNA序列。
SEQ ID NO:38是TbM-8的DNA序列。
SEQ ID NO:39是TbM-9的DNA序列。
SEQ ID NO:40是TbM-12的DNA序列。
SEQ ID NO:41是TbM-13的DNA序列。
SEQ ID NO:42是TbM-15的DNA序列。
SEQ ID NO:43是TbH-4的DNA序列。
SEQ ID NO:44是TbH-4-FWD的DNA序列。
SEQ ID NO:45是TbH-12的DNA序列。
SEQ ID NO:46是Tb38-1的DNA序列。
SEQ ID NO:47是Tb38-4的DNA序列。
SEQ ID NO:48是TbL-17的DNA序列。
SEQ ID NO:49是TbL-20的DNA序列。
SEQ ID NO:50是TbL-21的DNA序列。
SEQ ID NO:51是TbH-16的DNA序列。
SEQ ID NO:52是DPEP的DNA序列。
SEQ ID NO:53是DPEP的推导的氨基酸序列。
SEQ ID NO:54是DPV N-端抗原的蛋白质序列。
SEQ ID NO:55是AVGS N-端抗原的蛋白质序列。
SEQ ID NO:56是AAMK N-端抗原的蛋白质序列。
SEQ ID NO:57是YYWC N-端抗原的蛋白质序列。
SEQ ID NO:58是DIGS N-端抗原的蛋白质序列。
SEQ ID NO:59是AEES N-端抗原的蛋白质序列。
SEQ ID NO:60是DPEP N-端抗原的蛋白质序列。
SEQ ID NO:61是APKT N-端抗原的蛋白质序列。
SEQ ID NO:62是DPAS N-端抗原的蛋白质序列。
SEQ ID NO:63是TbM-1肽的推导的氨基酸序列。
SEQ ID NO:64是TbRa1的推导的氨基酸序列。
SEQ ID NO:65是TbRa10的推导的氨基酸序列。
SEQ ID NO:66是TbRa11的推导的氨基酸序列。
SEQ ID NO:67是TbRa12的推导的氨基酸序列。
SEQ ID NO:68是TbRa13的推导的氨基酸序列。
SEQ ID NO:69是TbRa16的推导的氨基酸序列。
SEQ ID NO:70是TbRa17的推导的氨基酸序列。
SEQ ID NO:71是TbRa18的推导的氨基酸序列。
SEQ ID NO:72是TbRa19的推导的氨基酸序列。
SEQ ID NO:73是TbRa24的推导的氨基酸序列。
SEQ ID NO:74是TbRa26的推导的氨基酸序列。
SEQ ID NO:75是TbRa28的推导的氨基酸序列。
SEQ ID NO:76是TbRa29的推导的氨基酸序列。
SEQ ID NO:77是TbRa2A的推导的氨基酸序列。
SEQ ID NO:78是TbRa3的推导的氨基酸序列。
SEQ ID NO:79是TbRa32的推导的氨基酸序列。
SEQ ID NO:80是TbRa35的推导的氨基酸序列。
SEQ ID NO:81是TbRa36的推导的氨基酸序列。
SEQ ID NO:82是TbRa4的推导的氨基酸序列。
SEQ ID NO:83是TbRa9的推导的氨基酸序列。
SEQ ID NO:84是TbRaB的推导的氨基酸序列。
SEQ ID NO:85是TbRaC的推导的氨基酸序列。
SEQ ID NO:86是TbRaD的推导的氨基酸序列。
SEQ ID NO:87是YYWCPG的推导的氨基酸序列。
SEQ ID NO:88是TbAAMK的推导的氨基酸序列。
SEQ ID NO:89是Tb38-1的推导的氨基酸序列。
SEQ ID NO:90是TbH-4的推导的氨基酸序列。
SEQ ID NO:91是TbH-8的推导的氨基酸序列。
SEQ ID NO:92是TbH-9的推导的氨基酸序列。
SEQ ID NO:93是TbH-12的推导的氨基酸序列。
SEQ ID NO:94是DPAS的DNA序列。
SEQ ID NO:95是DPAS的推导的氨基酸序列。
SEQ ID NO:96是DPV的DNA序列。
SEQ ID NO:97是DPV的推导的氨基酸序列。
SEQ ID NO:98是ESAT-6的DNA序列。
SEQ ID NO:99是ESAT-6的推导的氨基酸序列。
SEQ ID NO:100是TbH-8-2的DNA序列。
SEQ ID NO:101是TbH-9FL的DNA序列。
SEQ ID NO:102是TbH-9FL的推导的氨基酸序列。
SEQ ID NO:103是TbH-9-1的DNA序列。
SEQ ID NO:104是TbH-9-1的推导的氨基酸序列。
SEQ ID NO:105是TbH-9-4的DNA序列。
SEQ ID NO:106是TbH-9-4的推导的氨基酸序列。
SEQ ID NO:107是Tb38-1F2 IN的DNA序列。
SEQ ID NO:108是Tb38-1F2 RP的DNA序列。
SEQ ID NO:109是Tb37-FL的推导的氨基酸序列。
SEQ ID NO:110是Tb38-IN的推导的氨基酸序列。
SEQ ID NO:111是Tb38-1F3的DNA序列。
SEQ ID NO:112是Tb38-1F3的推导的氨基酸序列。
SEQ ID NO:113是Tb38-1F5的DNA序列。
SEQ ID NO:114是Tb38-1F6的DNA序列。
SEQ ID NO:115是DPV的推导的N-端氨基酸序列。
SEQ ID NO:116是AVGS的推导的N-端氨基酸序列。
SEQ ID NO:117是AAMK的推导的N-端氨基酸序列。
SEQ ID NO:118是YYWC的推导的N-端氨基酸序列。
SEQ ID NO:119是DIGS的推导的N-端氨基酸序列。
SEQ ID NO:120是AAES的推导的N-端氨基酸序列。
SEQ ID NO:121是DPEP的推导的N-端氨基酸序列。
SEQ ID NO:122是APKT的推导的N-端氨基酸序列。
SEQ ID NO:123是DPAS的推导的N-端氨基酸序列。
SEQ ID NO:124是DPPD N-端抗原的蛋白质序列。
SEQ ID NO:125-128是四个DPPD溴化氰片段的蛋白质序列。
SEQ ID NO:129是XDS抗原的N-端蛋白质序列。
SEQ ID NO:130是AGD抗原的N-端蛋白质序列。
SEQ ID NO:131是APE抗原的N-端蛋白质序列。
SEQ ID NO:132是XYI抗原的N-端蛋白质序列。
SEQ ID NO:133是TbH-29的DNA序列。
SEQ ID NO:134是TbH-30的DNA序列。
SEQ ID NO:135是TbH-32的DNA序列。
SEQ ID NO:136是TbH-33的DNA序列。
SEQ ID NO:137是TbH-29的预计氨基酸序列。
SEQ ID NO:138是TbH-30的预计氨基酸序列。
SEQ ID NO:139是TbH-32的预计氨基酸序列。
SEQ ID NO:140是TbH-33的预计氨基酸序列。
SEQ ID NO:141-146是用于制备含有TbRa3,38kD和Tb38-1的融合蛋白的PCR引物。
SEQ ID NO:147是含有TbRa3,38kD和Tb38-1的融合蛋白的DNA序列。
SEQ ID NO:148是含有TbRa3,38kD和Tb38-1的融合蛋白的氨基酸序列。
SEQ ID NO:149是结核分枝杆菌抗原38kD的DNA序列。
SEQ ID NO:150是结核分枝杆菌抗原38kD的氨基酸序列。
SEQ IDNO:151是XP14的DNA序列。
SEQ ID NO:152是XP24的DNA序列。
SEQ ID NO:153是XP31的DNA序列。
SEQ ID NO:154是XP32的5'DNA序列。
SEQ ID NO:155是XP32的3'DNA序列。
SEQ ID NO:156是XP14的预计氨基酸序列。
SEQ ID NO:157是XP14反向互补序列编码的预计的氨基酸序列。
SEQ ID NO:158是XP27的DNA序列。
SEQ ID NO:159是XP36的DNA序列。
SEQ ID NO:160是XP4的5'DNA序列。
SEQ ID NO:161是XP5的5'DNA序列。
SEQ ID NO:162是XP17的5'DNA序列。
SEQ ID NO:163是XP30的5'DNA序列。
SEQ ID NO:164是XP2的5'DNA序列。
SEQ ID NO:165是XP2的3'DNA序列。
SEQ ID NO:166是XP3的5'DNA序列。
SEQ ID NO:167是XP3的3'DNA序列。
SEQ ID NO:168是XP6的5'DNA序列。
SEQ ID NO:169是XP6的3'DNA序列。
SEQ ID NO:170是XP18的5'DNA序列。
SEQ ID NO:171是XP18的3'DNA序列。
SEQ ID NO:172是XP19的5'DNA序列。
SEQ ID NO:173是XP19的3'DNA序列。
SEQ ID NO:174是XP22的5'DNA 序列。
SEQ ID NO:175是XP22的3'DNA序列。
SEQ ID NO:176是XP25的5'DNA序列。
SEQ ID NO:177是XP25的3'DNA序列。
SEQ ID NO:178是TbH4-XPI的全长DNA序列。
SEQ ID NO:179是TbH4-XP1的预计氨基酸序列。
SEQ ID NO:180是TbH4-XP1的反向互补序列编码的预计的氨基酸序列。
SEQ ID NO:181是XP36编码的第一个预计的氨基酸序列。
SEQ ID NO:182是XP36编码的第二个预计的氨基酸序列。
SEQ ID NO:183是XP36的反向互补序列编码的预计的氨基酸序列。
SEQ ID NO:184是RDIF2的DNA序列。
SEQ ID NO:185是RDIF5的DNA序列。
SEQ ID NO:186是RDIF8的DNA序列。
SEQ ID NO:187是RDIF10的DNA序列。
SEQ ID NO:188是RDIF11的DNA序列。
SEQ ID NO:189是RDIF2的预计的氨基酸序列。
SEQ ID NO:190是RDIF5的预计的氨基酸序列。
SEQ ID NO:191是RDIF8的预计的氨基酸序列。
SEQ ID NO:192是RDIF10的预计的氨基酸序列。
SEQ ID NO:193是RDIF11的预计的氨基酸序列。
SEQ ID NO:194是RDIF12的5'DNA序列。
SEQ ID NO:195是RDIF12的3'DNA序列。
SEQ ID NO:196是RDIF7的DNA序列。
SEQ ID NO:197是RDIF7的预计的氨基酸序列。
SEQ ID NO:198是DIF2-1的DNA序列。
SEQ ID NO:199是DIF2-1的预计的氨基酸序列。
SEQ ID NO:200-207是用来制备含有TbRa3(38kD)、Tb38-1和DPEP的融合蛋白(后称TbF-2)的PCR引物。
SEQ ID NO:208是融合蛋白TbF-2的DNA序列。
SEQ ID NO:209是融合蛋白TbF-2的氨基酸序列。
SEQ ID NO:210是MO-1的5'DNA序列。
SEQ ID NO:211是MO-2的5'DNA序列。
SEQ ID NO:212是MO-4的5'DNA序列。
SEQ ID NO:213是MO-8的5'DNA序列。
SEQ ID NO:214是MO-9的5'DNA序列。
SEQ ID NO:215是MO-26的5'DNA序列。
SEQ ID NO:216是MO-28的5'DNA序列。
SEQ ID NO:217是MO-29的5'DNA序列。
SEQ ID NO:218是MO-30的5'DNA序列。
SEQ ID NO:219是MO-34的5'DNA序列。
SEQ ID NO:220是MO-35的5'DNA序列。
SEQ ID NO:221是MO-1的预计的氨基酸序列。
SEQ ID NO:222是MO-2的预计的氨基酸序列。
SEQ ID NO:223是MO-4的预计的氨基酸序列。
SEQ ID NO:224是MO-8的预计的氨基酸序列。
SEQ ID NO:225是MO-9的预计的氨基酸序列。
SEQ ID NO:226是MO-26的预计的氨基酸序列。
SEQ ID NO:227是MO-28的预计的氨基酸序列。
SEQ ID NO:228是MO-29的预计的氨基酸序列。
SEQ ID NO:229是MO-30的预计的氨基酸序列。
SEQ ID NO:230是MO-34的预计的氨基酸序列。
SEQ ID NO:231是MO-35的预计的氨基酸序列。
SEQ ID NO:232是MO-10的测定的DNA序列。
SEQ ID NO:233是MO-10的预计的氨基酸序列。
SEQ ID NO:234是MO-27的3'DNA序列。
SEQ ID NO:235是DPPD的全长DNA序列。
SEQ ID NO:236是DPPD的预计全长氨基酸序列。
SEQ ID NO:237是LSER-10的测得的5'cDNA序列。
SEQ ID NO:238是LSER-11的测得的5'cDNA序列。
SEQ ID NO:239是LSER-12的测得的5'cDNA序列。
SEQ ID NO:240是LSER-13的测得的5'cDNA序列。
SEQ ID NO:241是LSER-16的测得的5'cDNA序列。
SEQ ID NO:242是LSER-25的测得的5'cDNA序列。
SEQ ID NO:243是LSER-10的预计的氨基酸序列。
SEQ ID NO:244是LSER-12的预计的氨基酸序列。
SEQ ID NO:245是LSER-13的预计的氨基酸序列。
SEQ ID NO:246是LSER-16的预计的氨基酸序列。
SEQ ID NO:247是LSER-25的预计的氨基酸序列。
SEQ ID NO:248是LSER-18的测得的cDNA序列。
SEQ ID NO:249是LSER-23的测得的cDNA序列。
SEQ ID NO:250是LSER-24的测得的cDNA序列。
SEQ ID NO:251是LSER-27的测得的cDNA序列。
SEQ ID NO:252是LSER-18的预计的氨基酸序列。
SEQ ID NO:253是LSER-23的预计的氨基酸序列。
SEQ ID NO:254是LSER-24的预计的氨基酸序列。
SEQ ID NO:255是LSER-27的预计的氨基酸序列。
SEQ ID NO:256是测得的LSER-1的5'cDNA序列。
SEQ ID NO:257是测得的LSER-3的5'cDNA序列。
SEQ ID NO:258是测得的LSER-4的5'cDNA序列。
SEQ ID NO:259是测得的LSER-5的5'cDNA序列。
SEQ ID NO:260是测得的LSER-6的5'cDNA序列。
SEQ ID NO:261是测得的LSER-8的5'cDNA序列。
SEQ ID NO:262是测得的LSER-14的5'cDNA序列。
SEQ ID NO:263是测得的LSER-15的5'cDNA序列。
SEQ ID NO:264是测得的LSER-17的5'cDNA序列。
SEQ ID NO:265是测得的LSER-19的5'cDNA序列。
SEQ ID NO:266是测得的LSER-20的5'cDNA序列。
SEQ ID NO:267是测得的LSER-22的5'cDNA序列。
SEQ ID NO:268是测得的LSER-26的5'cDNA序列。
SEQ ID NO:269是测得的LSER-28的5'cDNA序列。
SEQ ID NO:270是测得的LSER-29的5'cDNA序列。
SEQ ID NO:271是测得的LSER-30的5'cDNA序列。
SEQ ID NO:272是LSER-1的预计的氨基酸序列。
SEQ ID NO:273是LSER-3的预计的氨基酸序列。
SEQ ID NO:274是LSER-5的预计的氨基酸序列。
SEQ ID NO:275是LSER-6的预计的氨基酸序列。
SEQ ID NO:276是LSER-8的预计的氨基酸序列。
SEQ ID NO:277是LSER-14的预计的氨基酸序列。
SEQ ID NO:278是LSER-15的预计的氨基酸序列。
SEQ ID NO:279是LSER-17的预计的氨基酸序列。
SEQ ID NO:280是LSER-19的预计的氨基酸序列。
SEQ ID NO:281是LSER-20的预计的氨基酸序列。
SEQ ID NO:282是LSER-22的预计的氨基酸序列。
SEQ ID NO:283是LSER-26的预计的氨基酸序列。
SEQ ID NO:284是LSER-28的预计的氨基酸序列。
SEQ ID NO:285是LSER-29的预计的氨基酸序列。
SEQ ID NO:286是LSER-30的预计的氨基酸序列。
SEQ ID NO:287是LSER-9的测得的cDNA序列。
SEQ ID NO:288是LSER-6的反向互补序列的测得的cDNA序列。
SEQ ID NO:289是LSER-6的反向互补序列的预计的氨基酸序列。
SEO ID NO:290是MO-12的测得的5'cDNA序列。
SEQ ID NO:291是MO-13的测得的5'cDNA序列。
SEQ ID NO:292是MO-19的测得的5'cDNA序列。
SEQ ID NO:293是MO-39的测得的5'cDNA序列。
SEQ ID NO:294是MO-12的预计的氨基酸序列。
SEO ID NO:295是MO-13的预计的氨基酸序列。
SEQ ID NO:296是MO-19的预计的氨基酸序列。
SEQ ID NO:297是MO-39的预计的氨基酸序列。
SEQ ID NO:298是Erdsn-1的测得的5'cDNA序列。
SEQ ID NO:299是Erdsn-2的测得的5'cDNA序列。
SEQ ID NO:300是Erdsn-4的测得的5'cDNA序列。
SEQ ID NO:301是Erdsn-5的测得的5'cDNA序列。
SEQ ID NO:302是Erdsn-6的测得的5'cDNA序列。
SEQ ID NO:303是Erdsn-7的测得的5'cDNA序列。
SEQ ID NO:304是Erdsn-8的测得的5'cDNA序列。
SEQ ID NO:305是Erdsn-9的测得的5'cDNA序列。
SEQ ID NO:306是Erdsn-10的测得的5'cDNA序列。
SEQ ID NO:307是Erdsn-12的测得的5'cDNA序列。
SEQ ID NO:308是Erdsn-13的测得的5'cDNA序列。
SEQ ID NO:309是Erdsn-14的测得的5'cDNA序列。
SEQ ID NO:310是Erdsn-15的测得的5'cDNA序列。
SEQ ID NO:311是Erdsn-16的测得的5'cDNA序列。
SEQ ID NO:312是Erdsn-17的测得的5'cDNA序列。
SEQ ID NO:313是Erdsn-18的测得的5'cDNA序列。
SEQ ID NO:314是Erdsn-21的测得的5'cDNA序列。
SEQ ID NO:315是Erdsn-22的测得的5'cDNA序列。
SEQ ID NO:316是Erdsn-23的测得的5'cDNA序列。
SEQ ID NO:317是Erdsn-25的测得的5'cDNA序列。
SEQ ID NO:318是Erdsn-1的测得的3'cDNA序列。
SEQ ID NO:319是Erdsn-2的测得的3'cDNA序列。
SEQ ID NO:320是Erdsn-4的测得的3'cDNA序列。
SEQ ID NO:321是Erdsn-5的测得的3'cDNA序列。
SEQ ID NO:322是Erdsn-7的测得的3'cDNA序列。
SEQ ID NO:323是Erdsn-8的测得的3'cDNA序列。
SEQ ID NO:324是Erdsn-9的测得的3'cDNA序列。
SEQ ID NO:325是Erdsn-10的测得的3'cDNA序列。
SEQ ID NO:326是Erdsn-12的测得的3'cDNA序列。
SEQ ID NO:327是Erdsn-13的测得的3'cDNA序列。
SEQ ID NO:328是Erdsn-14的测得的3'cDNA序列。
SEQ ID NO:329是Erdsn-15的测得的3'cDNA序列。
SEQ ID NO:330是Erdsn-16的测得的3'cDNA序列。
SEQ ID NO:331是Erdsn-17的测得的3'cDNA序列。
SEQ ID NO:332是Erdsn-18的测得的3'cDNA序列。
SEQ ID NO:333是Erdsn-21的测得的3'cDNA序列。
SEQ ID NO:334是Erdsn-22的测得的3'cDNA序列。
SEQ ID NO:335是Erdsn-23的测得的3'cDNA序列。
SEQ ID NO:336是Erdsn-25的测得的3'cDNA序列。
SEQ ID NO:337是Erdsn-24的测得的cDNA序列。
SEQ ID NO:338是结核分枝杆菌85b前体类似物的测得的氨基酸序列。
SEQ ID NO:339是spot1的测得的氨基酸序列。
SEQ ID NO:340是spot2的测得的氨基酸序列。
SEQ ID NO:341是spot2的测得的氨基酸序列。
SEQ ID NO:342是spot4的测得的氨基酸序列。
SEQ ID NO:343是引物PDM-157的序列。
SEQ ID NO:344是引物PDM-160的序列。
SEQ ID NO:345是融合蛋白TbF-6的DNA序列。
SEQ ID NO:346是融合蛋白TbF-6的氨基酸序列。
SEQ ID NO:347是引物PDM-176的序列。
SEQ ID NO:348是引物PDM-175的序列。
SEQ ID NO:349是融合蛋白TbF-8的DNA序列。
SEQ ID NO:350是融合蛋白TbF-8的氨基酸序列。
发明详述如上所述,本发明总地涉及诊断结核病的组合物和方法。本发明的组合物包括多肽,该多肽包含结核分枝杆菌抗原的至少一个抗原性部分,或仅仅在保守性置换和/或修饰中有所不同的该抗原的变体。在本发明范围内的多肽包括,但不局限于,可溶性结核分枝杆菌抗原。“可溶性结核分枝杆菌抗原”是已知结核分枝杆菌来源的蛋白质,它存在于结核分枝杆菌培养物渗滤液中。本文所用的术语“多肽”包括具有任何长度的氨基酸链,包括全长蛋白质(即抗原),其中氨基酸残基通过共价肽键连接。因此,包含上述抗原之一的抗原性部分的多肽可以全部由抗原性部分组成,或可含有附加的序列。附加的序列可以衍生自天然的结核分枝杆菌抗原,或可以是异源的,这些序列可能(但不必)有抗原性。
一个抗原的“抗原性部分”(可能是可溶或不可溶的)是能与结核分枝杆菌感染个体获得的血清反应的部分(即在本文描述的代表性ELISA试验中,用受感染个体的血清获得的吸收值读数比未感染个体获得的血清的吸收值高出至少3个标准差)。“结核分枝杆菌感染的个体”是感染了结核分枝杆菌的人(例如,对PPD的皮内测试反应直径至少为0.5厘米)。受感染的个体可能显示出结核病症状,或可能没有疾病症状。通常可单用或合用含有本文描述的一种或多种结核分枝杆菌抗原的至少抗原部分的多肽来检测患者的结核病。
本发明的组合物和方法还包括上述多肽以及DNA分子的变体。本文所用的多肽“变体”是仅仅在保守性置换和/或修饰中与所述多肽不同的多肽,从而保留了多肽的治疗性、抗原性和/或免疫原性性能。多肽变体宜表现出与鉴定的多肽至少约70%、更佳的约90%、最佳的约95%的相同性。对于具有免疫反应性性能的多肽,可通过修饰上述多肽之一的氨基酸序列并评价修饰后的多肽的免疫反应性来鉴定这些变体。对于用来产生诊断结合试剂的多肽,可通过评价经修饰的多肽产生检测结核病存在与否的抗体的能力来鉴定变体。这些修饰的序列可用例如本文描述的典型程序来制备和测试。
本文所用的“保守性取代”是一个氨基酸被具有相似性质的另一个氨基酸取代,因而肽化学领域技术人员可以预计到该多肽的二级结构和亲水性基本不变。通常,下列氨基酸组代表了保守性变化:(1)ala,pro,gly,glu,asp,gln,asn,set,thr;(2)cys,ser,tyr,thr;(3)val,ile,leu,met,ala,phe;(4)lys,arg,his;和(5)phe,tyr,trp,his。
变体可以另外含有其它修饰,包括对多肽的抗原性、二级结构和亲水性性能影响很小的氨基酸缺失或增加。例如,多肽可以和在共同翻译时或翻译后指导蛋白质转移的蛋白质N端的信号(或前导)序列偶联。多肽还可与接头或为便于合成、纯化或鉴定多肽(例如poly-His)或与增强多肽与固相载体结合的其它序列偶联。例如,多肽可以和免疫球蛋白Fc区偶联。
核苷酸“变体”是与所述核苷酸序列不同的、有一个或多个核苷酸缺失、取代或增加的序列。这种修饰易用标准诱变技术(例如Adelman等人(DNA,2:183,1983)指出的寡核苷酸定点特异性诱变)来导入。核苷酸变体可以是天然存在的等位基因变体或非天然存在的变体。核苷酸序列变体宜表现出与所述序列的相同性至少约为70%,更佳的至少约为80%,最佳的约为90%。这些核苷酸序列变体通常会在严谨条件下与所述的核苷酸序列杂交。本文所用的“严谨条件”指在6×SSC,0.2%SDS的溶液中预洗涤;在65℃、6×SSC、0.2%SDS中杂交过夜;然后在1×SSC、0.1%SDS中65℃洗两次各30分钟,并在0.2×SSC、0.1%SDS中65℃洗涤两次各30分钟。
在一个有关的方面,公开了组合或融合多肽。“融合多肽”是一种多肽,它包含至少一个上述抗原性部分和一个或多个附加的抗原性结核分枝杆菌序列,它们通过肽键连接成一条氨基酸链。序列可以直接连接(即没有介入的氨基酸)或可通过接头序列(例如Gly-Cys-Gly)连接,而接头不会显著减少组分多肽的抗原性。
通常,结核分枝杆菌抗原以及编码这些抗原的DNA序列可以用各种不同方法的任何一种来制备。例如,可以用本领域普通技术人员已知的程序(包括阴离子交换和反相层析)从结核分枝杆菌培养渗滤液中分离出可溶性抗原。然后评价纯化抗原的所需要的性质,例如与结核分枝杆菌感染个体血清反应的能力。这些筛选可用本文描述的代表性方法来进行。然后,可用传统的Edman化学方法对抗原作部分测序。见Edman和Berg,Eur.J.Biochem.80:116-132,1967。
抗原还可用编码该抗原的DNA序列重组产生,将该序列插入表达载体内并在合适的宿主内表达。可用针对可溶性结核分枝杆菌抗原的特异性抗血清(例如家兔)筛选合适的结核分枝杆菌表达文库来分离编码可溶性抗原的DNA分子。编码可能是或不是可溶的抗原的DNA序列可通过这样的方法来鉴定用感染过结核分枝杆菌的患者血清来筛选合适的结核分枝杆菌基因组或cDNA表达文库。这些筛选的进行通常可采用本领域熟知的技术(例如Sambrook等人《分子克隆实验指南》,Cold SpringHarbor Laboratory,Cold Spring Harbor,NY,1989中描述的那些技术)。
编码可溶性抗原的DNA序列还可这样获得在合适的结核分枝杆菌cDNA或基因组DNA文库中,筛选能与衍生自分离的可溶性抗原的部分氨基酸序列的简并寡核苷酸杂交的DNA序列。可以设计并合成用于该筛选的简并寡核苷酸序列,筛选可以如Sambrook等人《分子克隆实验指南》,Cold Spring Harbor Laboratory,Cold SpringHarbor,NY(及其中引用的文献)中描述的那样进行。也可采用聚合酶链反应(PCR),采用本领域熟知方法的上述寡核苷酸,以从cDNA或基因组文库中分离出核酸探针。然后可以用分离的探针来进行文库筛选。
不论制备方法如何,本文描述的抗原均具有“抗原性”。更具体地说,抗原具有与结核分枝杆菌感染个体血清反应的能力。反应性例如可用本文描述的代表性ELISA试验来评价,其中用感染个体血清获得的吸收值读数比用未感染个体的血清获得的吸收值高出至少3个标准偏差方认为是阳性。
结核分枝杆菌抗原的抗原性部分可用熟知的技术(例如在Paul《基础免疫学》第3版,Raven出版社,1993,243-247及其引用的参考文献中归纳的那些技术)来制备和鉴定。这些技术包括筛选天然抗原多肽部分的抗原特性。本文描述的代表性ELISA通常可用于这些筛选。多肽的抗原性部分是在这些代表性试验中产生的信号与全长抗原所产生的信号基本上相似的部分。换句话说,结核分枝杆菌抗原的抗原性部分在本文描述的ELISA模型中产生的信号是全长抗原所诱导的信号的至少大约20%,较佳的大约100%。
结核分枝杆菌抗原的部分和其它变体可用合成或重组方法产生。可以用本领域熟知的技术来产生少于约100个氨基酸、通常少于约50个氨基酸的合成多肽。例如,这些多肽可以用任何市售的固相技术来合成,这些技术例如是Merrifield固相合成方法,其中向生长的氨基酸链依次增加氨基酸。见Merrifield,J.Am.Chem.Soc.85:2149-2146,1963。自动化合成多肽的装置购自供应商如Applied BioSystems,Inc.,Foster City,CA,并可根据生产商说明书来操作。天然抗原的变体通常可用标准的诱变技术(如寡核苷酸定点特异性诱变)来制备。还可用标准技术除去DNA序列的部分,以制备截短的多肽。
含有天然抗原的一部分和/或变体的重组多肽易用本领域普通技术人员熟知的各种技术从编码该多肽的DNA序列制得。例如,可以首先用市售的滤膜来浓缩将重组蛋白分泌入培养基的合适的宿主/载体系统的上清液。浓缩后,可将浓缩液上样于合适的纯化基质如亲和基质或离子交换树脂上。最后,可以采用一步或多步反向HPLC步骤来进一步纯化重组蛋白。
本领域普通技术人员已知的各种表达载体的任何一种可用来如本文所述的那样表达重组多肽。表达可在已经转化或转染了含有编码重组多肽之DNA分子的表达载体的任何合适的宿主细胞中进行。合适的宿主细胞包括原核生物、酵母和较高等真核细胞。较佳的,所用的宿主细胞是大肠杆菌、酵母或哺乳动物细胞系,如COS或CHO。以这种方式表达的DNA序列可编码天然存在的抗原、天然存在的抗原的一部分或它们的其它变体。
通常,不论制备方法如何,本文公开的多肽以基本纯的形式制得。较佳的,多肽至少为大约80%纯,更佳的至少大约90%纯,最佳的至少大约99%纯。然而,为了用于本文描述的方法,这些基本上纯的多肽可以组合。
在某些具体的实施方案中,本发明公开了多肽,该多肽含有可溶性结核分枝杆菌抗原(或该抗原的变体)的至少一个抗原性部分,其中抗原具有下列N-端序列中的一个
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID NO:115);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO:116);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID NO:117);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID NO:118);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID NO:119);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ IDNO:120);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser(SEQ ID NO:121);(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID NO:122);(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID NO:123);(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser,(SEQ ID NO:129)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;(SEQ ID NO:130)或(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID NO:131)其中Xaa可以是任何氨基酸,较佳的是半胱氨酸残基。SEQ ID NO:52中提供了编码上述(g)确定的抗原的DNA序列,它的推导的氨基酸序列提供在SEQ ID NO:53中。编码上述(a)中确定的抗原的DNA序列提供在SEQ ID NO:96中;其推导的氨基酸序列提供在SEQID NO:97中。对应于上述(d)抗原的DNA序列提供在SEQ ID NO:24中,对应于抗原(c)的DNA序列提供在SEQ ID NO:25中,对应于抗原(Ⅰ)的DNA序列公开在SEQ ID NO:94中,其推导的氨基酸序列提供在SEQ ID NO:95中。
在另一个具体的实施方案中,本发明公开了多肽,它包含具有下列N-端序列之一的结核分枝杆菌抗原的至少一个免疫原性部分,或仅仅在保守性置换和/或修饰方面不同的它的变体
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Prp-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID NO:132)或(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID NO:124)其中Xaa可以是任何氨基酸,较佳的是半胱氨酸残基。编码上述(n)抗原的DNA序列提供在SEQ ID NO:235中,其对应的预计的全长氨基酸序列提供在SEQ ID NO:236中。
在其它具体的实施方案中,本发明公开的多肽包含了可溶性结核分枝杆菌抗原(或该抗原的变体)的至少一个抗原性部分,它包含的一个或多个氨基酸序列由(a)SEQID NO:1、2、4-10、13-25、52、94和96的DNA序列、(b)这些DNA序列的互补序列、或(c)与(a)或(b)中序列基本上同源的DNA序列来编码。
在另一个具体的实施方案中,本发明公开的多肽包含结核分枝杆菌抗原(或该抗原的变体)的至少一个抗原性部分,它可以是可溶的或不可溶的,它包含的一个或多个氨基酸序列由(a)SEQ ID NO:26-51、133、134、158-178、184-188、194-196、198、210-220、232、234、235、237-242、248-251、256-271、287、288、290-293和298-337的DNA序列、(b)这些DNA序列的互补序列或(c)与(a)或(b)中的序列基本上同源的DNA序列来编码。
在一个有关的方面,本发明提供了融合蛋白,它包含第一种和第二种本发明多肽,或者,包含本发明的一个多肽以及一种已知的结核分枝杆菌抗原,如Andersen和Hansen,Infect.Immun.57:2481-2488,1989中描述的38kD抗原(Genbank登录号No.M30046)或ESAT-6(SEQ ID NO:98和99),本发明还提供了这些融合蛋白的变体。本发明的融合蛋白还可以包括在第一和第二多肽之间的接头肽。
编码本发明的融合蛋白的DNA序列可用已知的重组DNA技术来构建,将编码第一和第二多肽的分开的DNA序列装配到合适的表达载体中。编码第一多肽的DNA序列的3'端可通过或不通过接头肽与编码第二多肽的DNA序列的5'端连接,从而使序列的读框同相,使两个DNA序列的mRNA翻译成一个融合蛋白,它保留了第一和第二多肽生物学活性。
可用肽接头序列来使第一和第二多肽分开足够的距离,以确保每个多肽折叠成其二级和三级结构。这样的肽接头序列可用本领域熟知的标准技术插入融合蛋白内。合适的肽接头序列可根据下列因素来选择(1)它们适应灵活伸展构型的能力;(2)它们不能采用与第一和第二多肽上的功能性表位相互作用的二级结构;以及(3)缺少可能会与多肽功能性表位反应的疏水性或带电残基。较佳的肽接头序列含有Gly,Asn和Ser残基。接头序列中也可采用其它接近中性的氨基酸,如Thr和Ala。可用作接头的氨基酸序列包括在Maratea等人Gene 40:39-46,1985;Murphy等人Proc.Natl.Acad.Sci.USA 83:8258-8562,1986;美国专利No.4,935,233和美国专利No.4,751,180中描述的那些。接头序列的长度可以从1到50个氨基酸。当第一和第二多肽具有可用来隔开功能性结构域并防止空间位阻的非必需的N-端氨基酸区域时,不需要肽接头序列。
另一方面,本发明提供了用上述多肽诊断结核病的方法。在该方面,提供了单用或合用上述一种或多种多肽来检测生物样品中结核分枝杆菌感染的方法。在采用多个多肽的实施方案中,可以包括除本文具体描述的那些多肽以外的多肽,例如Andersen和Hansen,Infect.Immun.57:2481-2488,1989中描述的38kD抗原。如本文所用的,“生物样品”是从患者获得的任何含抗体的样品。较佳的,样品是全血、痰液、血清、血浆、唾液、脑脊液和尿液。更佳的,样品是从患者或血液供应商处得到的血液、血清或血浆样品。将多肽用于如下所述的试验中,以确定样品中是否存在针对这些多肽的抗体(相对于预定的截断值(cut-off))。这些抗体的存在表明先前已受分枝杆菌抗原致敏,这可能是结核病的指针。
在采用多个多肽的实施方案中,所用的多肽宜是互相补充的(即,一个多肽组分检测样品中的感染,而感染不被另一多肽组分检测到)。互相补充的多肽通常可通过单独用每种多肽评价已知感染了结核分枝杆菌的一系列患者的血清样品来确定。在确定了用每种多肽使那些样品测试呈阳性(如下所述)后,可以配制两种或多种多肽的组合,该组合能检测大多数或所有测试样品中的感染。这些多肽是互相补充的。例如,约25-30%的结核病感染个体的血清对任何单个蛋白(如上述的38kD抗原)的抗体呈阴性。因此,可以将互相补充的多肽与38kD抗原组合使用,以改进诊断试验的灵敏度。
本领域普通技术人员己知有各种试验采用一种或多种多肽来检测样品中的抗体。例如参见,Harlow和Lane《抗体实验手册》,Cold Spring Harbor Laboratory,1988,该书纳入本文作参考。在一个较佳的实施方案中,试验涉及采用固定在固相载体上的多肽来结合并取出样品中的抗体。然后可用含有报道基团的检测剂检测该结合的抗体。合适的检测剂包括与抗体/多肽复合物以及标记了报道基团的游离多肽(例如在半竞争性试验中)结合的抗体。或者,可以采用竞争性试验,其中结合多肽的抗体标记有报道基团,在与样品中的抗原培育后和固定的抗原结合。样品组分抑制标记抗体与多肽结合的程度表明了样品与固定多肽的反应性。
固相载体可以是本领域普通技术人员己知的能连接抗原的固体材料。例如,固相载体可以是微量滴定板中的测试孔或硝酸纤维素膜或其它合适的膜。另外,载体可以是珠粒或圆片,如玻璃、玻璃纤维、乳胶或塑料材料如聚苯乙烯或聚氯乙烯。载体还可以是磁性颗粒或光纤传感器,例如在美国专利No.5,359,681中公开的那些。
多肽可用本领域普通技术人员已知的各种技术与固相载体结合,这些技术在专利和科学文献中详细的描述。在本发明的内容中,术语“结合(的)”既指非共价缔合,如吸附,也指共价连接(抗原和载体上的官能团之间可以直接连接或可通过交联剂连接)。通过吸附到微量滴定板中孔内或膜上的结合是较佳的。在这样的情况下,吸附可这样进行使合适缓冲液中的多肽与固相载体接触适当长的时间。接触时间随温度而异,但通常在大约1小时和1天之间。通常,塑料微量滴定板(如聚苯乙烯或聚氯乙烯)的孔与大约10纳克至1微克(较佳的约100ng)的多肽接触就足以结合足量的抗原。
多肽与固相载体的共价连接通常这样实现首先使载体与能和载体以及多肽上的官能团(如羟基或氨基)反应的双功能试剂反应。例如,利用苯醌,或通过载体上的醛基团与多肽上的胺以及活性氢缩合,多肽可以与具有合适聚合物涂层的载体结合(例如参见,Pierce Immunotechnology Catalog and Handkbook,1991,A12-A13)。
在某些实施方案中,试验是酶联免疫吸附试验(ELISA)。该试验可这样进行首先使已经固定在固相载体(通常是微量滴定板的孔)上的多肽抗原与样品接触,从而使样品中针对多肽的抗体与固定的多肽结合。然后,从固定的多肽中除去未结合的样品,加入能结合固定的抗体-多肽复合物的检测剂。然后,用适合特定检测剂的方法测定保持与固相载体结合的检测剂的量。
更具体地说,如上所述一旦多肽固定在载体上,通常要封闭载体上其余的蛋白质结合部位。本领域普通技术人员已知的任何合适的封闭剂,如牛血清白蛋白或吐温20TM(Sigma Chemical Co.,St.Louis,MO)均可采用。然后,使固定的多肽与样品培育,使抗体与抗原结合。在培育前,样品可用合适的稀释剂(如磷酸盐缓冲液)稀释。通常,合适的接触时间(即培育时间)是足以检测感染了结核分枝杆菌的样品中存在抗体的时间。较佳的,接触时间足以达到结合与未结合的抗体之间达到平衡的至少95%的结合水平。本领域普通技术人员会认识到,达到平衡所需的时间易通过测定一段时间内产生的结合水平来确定。在室温下,大约30分钟的培育时间就足够了。
然后用合适的缓冲液(如含有0.1%吐温20TM的PBS)洗涤固相载体,除去未结合的样品。然后,可将检测剂加到固相载体上。合适的检测剂是能结合固定的抗体-多肽复合物并能用本领域技术人员已知的各种方法检测的化合物。较佳的,检测剂含有与报道基团偶联的结合剂(例如蛋白质A、蛋白质G、免疫球蛋白、凝集素或游离的抗原)。较佳的报道基团包括酶(如辣根过氧化物酶)、底物、辅因子、抑制剂、染料、放射性核素、发光基团、荧光基团、生物素和胶体颗粒,如胶体金和硒。结合剂和报道基团的偶联可用本领域普通技术人员已知的标准方法来实现。偶联了各种报道基团的常见结合剂还可购自许多商业来源(例如Zymed Laboratories,SanFrancisco,CA和Pierce,Rockford,IL)。
然后使检测剂和固定的抗体-多肽复合物培育足够长的时间,以检测结合的抗体。合适的时间通常可根据生产商说明书来确定,或通过在一段时间内测定结合水平来确定。然后除去未结合的检测剂,用报道基团检测结合的检测剂。用来检测报道基团的方法取决于报道基团的性质。对于放射活性基团而言,闪烁计数或放射自显影方法通常是合适的。光谱方法可用来检测染料、发光基团和荧光基团。生物素可用偶联了不同报道基团(通常是放射活性基团或荧光基团或酶)的亲和素来检测。酶-报道基团通常可通过加入底物来检测(通常进行特定的时间),然后用光谱法或其它方法分析反应产物。
为了测定样品中是否存在抗结核分枝杆菌抗体,通常将保持结合于固相载体的报道基团检测到的信号与对应于预定截断值的信号比较。在一个较佳的实施方案中,截断值是固定抗原与未感染患者的样品培育后所得的平均信号。通常,认为产生信号比预定截断值高3个标准偏差的样品为结核病阳性。在另一个较佳的实施方案中,根据Sackett等人《临床流行病学临床医学基础科学》Little Brown and Co.,1985,106-107页中的方法,用接受者-操作者曲线(Receiver Operator Curve)确定截断值(cut-off)。简言之,在该实施方案中,截断值可从对应于诊断测试结果每个可能的截断值的数对真阳性率(即敏感性)和假阳性率(100%特异性)的曲线来确定。曲线上最接近左上角的截断值(即围住最大面积的数值)是最准确的截断值,经该方法测得产生信号高于截断值的样品可认为是阳性。或者,截断值可以沿曲线向左侧移动,以最大程度地减小假阳性率,或向右侧移动,以最大程度地减小假阴性率。通常,经该方法测得产生信号高于截断值的样品认为是结核病阳性。
在有关的实施方案中,试验以快速流穿或试条形式进行,其中抗原被固定在膜(如硝酸纤维素膜)上。在流穿试验中,当样品通过膜时,样品内的抗体与固定的多肽结合。然后,当含有检测剂的溶液流动通过膜时,检测剂(例如蛋白质A-胶体金)与抗体-多肽复合物结合。然后如上所述检测结合的检测剂。在试条形式中,将结合了多肽的膜的一端浸在含有样品的溶液内。样品沿膜迁移通过含有检测剂的区域,并迁移至固定多肽的区域。检测剂在多肽处浓集表明样品中存在抗结核分枝杆菌抗体。通常检测剂在该部位的浓缩产生了一种可用肉眼观察的图案(如线条)。不存在该图案则表示阴性结果。通常,当生物样品含有的抗体水平足以在上述ELISA中产生阳性信号时,选择固定在膜上的多肽的量,以产生肉眼可区分的图案。较佳的,固定在膜上的多肽量范围为25ng至约1微克,更佳的约50ng至500ng。这些测试通常可用非常少量(如一滴)的患者血清或血液来进行。
当然,还有其它许多试验方案也适合与本发明的多肽一起使用。上述描述只是列举性的。
另一方面,本发明提供了针对本发明多肽的抗体。抗体可用本领域普通技术人员已知的各种技术制备,例如参见Harlow和Lane《抗体实验手册》,Cold SpringHarbor Laboratory,1988。在一种这样的技术中,最初将包含抗原性多肽的免疫原注入各种哺乳动物(如小鼠、大鼠、家兔、绵羊和山羊)。在该步骤中,本发明的多肽可不经修饰作为免疫原。另外,特别是对于较小的多肽,如果将该多肽与载体蛋白(如牛血清白蛋白或匙孔血蓝蛋白)连接,则可能会引发超级免疫应答。将免疫原注入动物宿主,较佳的是根据预定的方案插入一次或多次强化免疫,然后定期对动物取血。然后可以通过例如亲和层析用偶联于合适的固相载体的多肽,将对多肽有特异性的多克隆抗体从这些抗血清中纯化出来。
对感兴趣的抗原性多肽的特异性单克隆抗体可以用Kohler和Milestein,Eur.J.Immunol.6:511-519,1976的技术及其改进方法制得。简言之,这些方法涉及制备能产生具有所需特异性(即与感兴趣多肽的反应性)的抗体的无限增殖细胞系。这些细胞系可以从如上所述免疫的动物的脾细胞产生。然后使脾细胞无限增殖,例如通过与骨髓瘤细胞融合伴侣(较佳的是与受免疫动物同系)融合。可以采用各种融合技术。例如,可以用非离子洗涤剂使脾细胞和骨髓瘤细胞结合数分钟,然后低密度接种在支持杂交细胞生长但不支持骨髓瘤细胞生长的选择培养基上。较佳的选择技术采用HAT(次黄嘌呤、氨基蝶呤、胸苷)选择。足够长的时间(通常约1-2周)后,观察杂交菌落。选出单菌落,测试其对多肽的结合活性。优选出具有高反应性和特异性的杂交瘤。
单克隆抗体可以从生长的杂交瘤集落的上清液分离得到。另外,可以采用各种技术来提高产量,例如将杂交瘤细胞系注射入合适脊椎动物宿主(如小鼠)的腹膜腔内。然后可以从腹水或血液中收获单克隆抗体。污染物可用常规技术(如层析、凝胶过滤、沉淀和抽提)从抗体中除去。本发明的多肽可用于纯化方法,例如亲和层析步骤中。
抗体可用于诊断试验,用类似于上文详细描述的试验以及本领域技术人员熟知的其它技术检测结核分枝杆菌抗原的存在,从而提供了检测患者结核分枝杆菌感染的方法。
本发明的诊断剂还包含编码上述一种或多种多肽或其一个或多个部分的DNA序列。例如,在以聚合酶链反应(PCR)为基础的试验中可以用至少两个寡核苷酸引物来扩增衍生自生物样品的结核分枝杆菌特异性cDNA,其中至少一个寡核苷酸引物对编码本发明多肽的DNA分子有特异性。然后,用本领域熟知的技术(如凝胶电泳)检测所扩增cDNA的存在。类似地,对编码本发明多肽的DNA分子有特异性的寡核苷酸探针可用于杂交试验,以检测生物样品中本发明多肽的存在。
本文所用的术语“对DNA分子有特异性的寡核苷酸/探针”指寡核苷酸序列与所涉及的DNA分子有至少约80%的相同性,较佳的有至少约90%的相同性,更佳的有至少约95%的相同性。可用于本发明诊断方法的寡核苷酸引物和/或探针宜具有至少大约10-40个核苷酸。在一个较佳的实施方案中,寡核苷酸引物包含编码本文公开的多肽之一的DNA分子的至少约10个连续的核苷酸。较佳的,用于本发明诊断方法的寡核苷酸探针包含可编码本文公开的多肽之一的DNA分子的至少大约15个毗连的寡核苷酸。PCR为基础的试验以及杂交试验的技术均是本领域所熟知的(例如参见,Mullis等人,Ibid;Ehrlich,Ibid)。因此,引物或探针可用来检测生物样品中的结核分枝杆菌特异性序列。包含上述寡核苷酸序列的DNA探针或引物可单独使用,或相互组合使用,或与以前鉴定的序列(如上述38kD抗原的序列)合用。
提供下列实施例是为了进行描述,而不是为了限制。
实施例实施例1从结核分枝杆菌培养渗滤液纯化多肽并特性分析本实施例描述了从培养渗滤液制备结核分枝杆菌可溶性多肽。除非另有描述,下列实施例中的所有百分数均为重量/体积。
将结核分枝杆菌(H37Ra,ATCC No.25177或H37Rv,ATCC No.25618)37℃培养在无菌GAS培养基中14天。然后,将培养基通过0.45μ滤膜真空过滤到无菌的2.5升瓶内(留下细胞团块)。然后将培养基通过0.2μ滤膜过滤到无菌的4升瓶内。然后在培养渗滤液中加入NaN3至浓度为0.04%。然后将瓶置于4℃冷藏室内。
对培养渗滤液进行浓缩,将滤液置于12升经高压蒸气灭菌的贮器内,将滤液加入400毫升Amicon搅拌装置内,该装置用乙醇清洗过并含有10000kDa MWCO膜。用氮气维持压力在60psi。该步骤将12升的体积减少至大约50毫升。
然后用8000kDa MWCO纤维素酯膜将培养渗滤液透析入0.1%碳酸氢铵内,更换碳酸氢铵溶液两次。然后用市售的BCA试验试剂(Pierce,Rockford,IL)测定蛋白质浓度。
然后将透析的培养渗滤液冻干,将多肽重悬于蒸馏水中。然后用0.01mM 1,3双[三(羟甲基)-甲氨基]丙烷(pH7.5)(Bis-Tris丙烷缓冲液)(这是阴离子交换层析的初始条件)对多肽透析。在经0.01mM Bis-Tris丙烷缓冲液(pH7.5)平衡的POROS 146Ⅱ Q/M阴离子交换柱(4.6mm×100mm,Perseptive Biosystems,Framingham,MA)上,用凝胶灌流(profusion)层析进行分级。用线性0-0.5M NaCl梯度将多肽洗脱到上述缓冲液系统内。在220nm波长下监测柱洗脱液。
用蒸馏水对离子交换柱洗脱下的多肽合并物透析,并冻干。将得到的物质溶于含0.1%三氟乙酸(TFA)的水(pH1.9)中,在Detla-Pak C18柱(Waters,Milford,MA,孔径300埃,粒径5微米(3.9×150mm))上纯化多肽。用0-60%稀释缓冲液(含0.1%TFA的乙腈)线性梯度将多肽洗脱下柱。流速为0.75毫升/分钟,在214nm下用HPLC监测洗脱液。收集含有洗脱多肽的组分,以最大程度地纯化各份样品。获得约200的纯化多肽。
然后筛选纯化多肽在PBMC制备物中诱导T-细胞增殖的能力。将已知PPD皮肤试验测试呈阳性且T细胞显示对PPD以及对MTB粗制可溶性蛋白起增殖反应的献血员的PBMC培养在含有RPMI 1640的培养基中,该培养基中添加了10%合并的人血清和50微克/毫升庆大霉素。以0.5至10微克/毫升的浓度加入纯化的多肽,一式两份。在96孔圆底平板中200微升的体积内培养6天后,从各孔中取出50微升培养基如下所述测定IFN-γ水平。然后在平板每孔内脉冲加入1μCi氚化的胸苷再培育18小时,收获并用气相闪烁计数器测定氚的摄入量。在两份样品中均导致增殖比培养在单用培养基中所见的细胞增殖大3倍的级分被认为呈阳性。
用酶联免疫吸附试验(ELISA)测定IFN-γ。在室温下用含有针对人IFN-γ的小鼠单克隆抗体(Chemicon)包被ELISA测试板4小时。然后在室温下用含有5%(W/V)脱脂奶粉的PBS封闭诸孔1小时。再用PBS/0.2%吐温-20洗板6次,使ELISA板中以培养基中作1∶2稀释的样品室温培育过夜。然后再次洗涤测试板,在每个孔内加入1∶3000稀释于PBS/10%正常山羊血清中的多克隆家兔抗-人IFN-γ血清。然后,室温培育测试板两小时,洗涤,加入以PBS/5%脱脂奶粉1∶2000稀释的辣根过氧化物酶偶联的抗家兔IgG(Jackson Labs.)。再室温培育2小时后,洗涤平板并加入TMB底物。20分钟后用1N硫酸终止反应。用570nm作为参照波长,在450nm下测定光密度。在两份样品中导致OD比培养在单用培养基中的平均OD大两倍加上3个标准差的级分被认为呈阳性。
为了进行测序,将多肽分别干燥在BiobreneTM(Perkin Elmer/Applied BiosystemsDivision,Foster City,CA)处理的玻璃纤维滤膜上。将带有多肽的滤膜载于PerkinElmer/Applied BioSystems Division Procise 492蛋白质测序仪上。用传统的Edman化学试剂从氨基端测定多肽的序列。通过比较PTH氨基酸衍生物对合适的PTH衍生物标准品的滞留时间,确定每个多肽的氨基酸序列。
采用上述程序,分离出具有下列N-端序列的抗原(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID NO:54);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO:55);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID NO:56);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID NO:57);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID NO:58);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ IDNO:59);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-Pro-Pro-Ala(SEQ ID NO:60);和(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID NO:61);其中Xaa可以是任何氨基酸。
除了上述程序外,用微孔HPLC纯化步骤分离其它的抗原。具体地说,在PerkinElmer/Applied Biosystems Division Model 172 HPLC中,在孔径7微米、柱体积1mm×100mm的Aquapore C18柱(Perkin Elmer/Applied Biosystems Division,Foster City,CA)上纯化含有前述层析纯化步骤得到的抗原混合物每级分20微升。用含1%微量乙腈(含0.05%TFA)线性梯度的水(0.05%TFA)以80微升/分钟的流速从柱上洗脱级分。在250nm处监测洗脱物。将原始的级分分离成4个主峰以及其它较小的组分,获得一种多肽,其显示出分子量为12.054Kd(通过质谱法),具有下列N-端序列(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-Phe-Ala-Asp(SEQ ID NO:62)。
用上述试验显示出该多肽在PBMC制备物中诱导增殖和IFN-γ产生。
如下所述从结核分枝杆菌培养渗滤液中分离出其它可溶性抗原。如上所述制备结核分枝杆菌培养渗滤液。在用Bis-Tris丙烷缓冲液(pH5.5)透析后,用阴离子交换层析在经Bis-Tris丙烷缓冲液(pH5.5)平衡的Poros QE柱4.6×100mm(PerseptiveBiosystems)上进行分级。在上述缓冲液系统中用0-1.5M NaCl线性梯度以10毫升/分钟的流速洗脱多肽。在214nm下监测柱洗脱液。
合并从离子交换柱上洗脱的级分,用Poros R2柱4.6×100mm(PerseptiveBiosystems)进行反相层析。用0-100%乙腈(0.1%TFA)的线性梯度以5毫升/分钟的流速从柱上洗脱多肽。在214nm下监测洗脱液。
将含有洗脱多肽的级分冻干,重悬于80微升0.1%TFA水溶液中,在Vydac C4柱4.6×150nm(Western Analytical,Temecula,CA)上用0-100%乙腈(0.1%TFA)的线性梯度以2毫升/分钟的流速进行进一步的反相层析。在214nm下监测洗脱液。
具有生物活性的级分被分离为一个主峰和其它较小的组分。将该峰Western印迹到PVDF膜上,结果显示分子量为14Kd,20Kd和26Kd的三条主要条带。测得这些多肽分别具有下列N-端序列(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser,(SEQ ID NO:129)(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;(SEQ ID NO:130)和(1)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gla-Ala-Gly;(SEQ ID NO:131)利用上述试验,这些多肽显示出能在PBMC制备物中诱导增殖和IFN-γ产生。图1A和B分别显示了用第一和第二献血员的PBMC制备物所做的这些试验结果。
用32p末端标记的对应于N-端序列并含有结核分枝杆菌密码子偏性的简并寡核苷酸,筛选结核分枝杆菌基因组文库,获得编码上述(a),(c),(d)和(g)的抗原的DNA序列。用对应于上述抗原(a)的探针进行的筛选鉴定出具有序列SEQ ID NO:96的克隆。SEQ ID NO:96编码的多肽提供在SEQ ID NO:97中。用对应于上述抗原(g)的探针进行的筛选鉴定出具有序列SEQ ID NO:52的克隆。SEQ ID NO:52编码的多肽提供在SEQ ID NO:53中。用对应于上述抗原(d)的探针进行的筛选鉴定出具有序列SEQ ID NO:24的克隆,用对应于抗原(c)的探针进行的筛选鉴定出具有序列SEQ IDNO:25的克隆。
用DNA STAR系统对上述氨基酸序列和基因库中已知的氨基酸序列进行比较。检索的数据库含有大约173000种蛋白质,它是Swiss,PIR数据库以及翻译的蛋白质序列(87版)的组合。没有检测到抗原(a)-(h)和(l)的氨基酸序列的明显同源物。
发现抗原(i)的氨基酸序列与麻风分枝杆菌(M.leprae)的一个序列同源。用从GENEBANK获得的序列从基因组DNA扩增全长麻风分枝杆菌序列。然后用该序列筛选结核分枝杆菌文库,获得结核分枝杆菌同系物的全长拷贝(SEQ ID NO:94)。
发现抗原(j)的氨基酸序列与一个DNA序列翻译的已知结核分枝杆菌蛋白同源。据发明者所知,该蛋白以前未显示具有T-细胞刺激活性。发现抗原(k)的氨基酸序列与麻风分枝杆菌的一个序列有关。
在上述增殖和IFN-γ试验中,用三个PPD阳性献血员,上文提供的代表性抗原的结果显示在表1中表1PBMC增殖和IFN-γ试验的结果

在表1中,产生刺激指数(SI)在2和4(与单独培养在培养基中的细胞相比)之间的反应评为+,SI为4-8或在1微克或更低浓度下SI为2-4评为++,SI大于8评为+++。发现序列(i)的抗原在增殖和IFN-γ试验中对于一个献血员有高的SI(+++),对于其它两个献血员有较低的SI(++和+)。这些结果表明这些抗原能诱导增殖和/或干扰素-γ产生。
实施例2用患者血清来分离结核分枝杆菌抗原本实施例描述了用结核分枝杆菌感染的个体的血清筛选来从结核分枝杆菌裂解液中分离抗原。
将干燥的结核分枝杆菌H37Ra(Difco Laboratories)加入到2%NP40溶液中,交替匀浆并超声处理3次。使所得悬浮液在微量离心管中13000rpm离心,使上清液通过0.2微米针筒式滤器。使滤液与Macro Prep DEAE珠粒(BioRad,Hercules,CA)结合。用20毫摩尔Tris pH7.5彻底洗涤珠粒,用1M NaCl洗脱结合的蛋白质。用10毫摩尔Tris,pH7.5透析NaCl洗脱液过夜。用0.05毫克/毫升DNA酶和RNA酶室温下处理透析溶液30分钟,然后用0.5U/毫克α-D-甘露糖苷酶在pH4.5下室温处理3-4小时。在回复至pH7.5后,通过FPLC在Bio Scale-Q-20柱(BioRad)上对材料分级。将级分合并成9份合并物,在Centriprep 10(Amicon,Beverley,MA)中浓缩,用感染结核分枝杆菌患者的与本发明其它抗原没有免疫反应的合并血清作Western印迹筛选血清学活性。
使最具反应性的级分进行SDS-PAGE,并转移至PVDF。切下约85Kd的条带,产生下列序列(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID NO:132),其中Xaa可以是任何氨基酸。
将该序列与上述基因库中的那些序列比较,结果显示与已知序列没有明显同源性。
用对应于SEQ ID NO:137N-端序列的标记的简并寡核苷酸筛选基因组结核分枝杆菌Erdman菌株文库,获得编码上述(m)抗原的DNA序列。鉴定出具有DNA序列SEQ ID NO:198的一个克隆。发现该序列编码SEQ ID NO:199的氨基酸序列。将这些序列与基因库中的那些序列比较,结果发现与以前在结核分枝杆菌以及牛分枝杆菌中鉴定的序列有一些相似。
实施例3编码结核分枝杆菌抗原的DNA序列的制备本实施例描述了用感染了结核分枝杆菌的患者获得的血清或针对结核分枝杆菌抗原产生的抗血清筛选结核分枝杆菌表达文库,制备编码结核分枝杆菌抗原的DNA序列。
A.用针对结核分枝杆菌上清液的家兔抗血清制备结核分枝杆菌可溶性抗原从结核分枝杆菌菌株H37Ra分离基因组DNA。随机切割该DNA,并用于以λZAP表达系统(Stratagene,La Jolla,CA)构建表达文库。用结核分枝杆菌培养物的浓缩上清液免疫家兔,产生针对结核分枝杆菌菌株H37Ra,H37Rv和Erdman的分泌性蛋白的家兔抗血清。具体地说,首先用总体积为2毫升(含有100微克胞壁酰二肽(Calbiochem,La Jolla,CA)和1毫升不完全Freund佐剂)的200微克蛋白抗原皮下免疫家兔。4周后,用含100微克抗原的不完全Freund佐剂对家兔作皮下强化免疫。最后,4周后用50微克蛋白抗原对家兔作静脉内免疫。如Sambrook等人《分子克隆实验指南》,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY,1989中描述的那样,用抗血清筛选表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。挽救噬斑的噬菌粒,推导出结核分枝杆菌克隆的核苷酸序列。
纯化得到32个克隆。其中有25个代表的序列以前未曾在结核分枝杆菌中得到鉴定。如Skeiky等人,J.Exp.Med.181:1527-1537,1995中描述的那样,用IPTG诱导蛋白质,并通过凝胶洗脱纯化。在该筛选中鉴定的DNA分子的代表性部分序列提供在SEQ ID NO:1-25中。对应的预计氨基酸序列显示在SEQ ID NO:64-88中。
在用上述数据库比较这些序列与基因库中已知序列后,发现后文称为TbRA2A,TbRA16,TbRA18和TbRA29的克隆(SEQ ID NO:77,69,71,76)显示出与以前鉴定的麻风分枝杆菌(但不是结核分枝杆菌)中的序列有一些同源性。发现TbRA2A是一种脂蛋白,有一个6残基脂化序列与一疏水性分泌性序列毗邻。TbRA11,TbRA26,TbRA28和TbDPEP(SEQ ID NO:66,74,75,55)在结核分枝杆菌中已有鉴定。发现与TbRA1,TbRA3,TbRA4,TbRA9,TbRA10,TbRA13,TbRA17,TbRA19,TbRA29,TbRA32,TbRA36以及重叠的克隆TbRA35和TbRA12(分别为SEQ ID NO:64,78,82,65,68,76,72,76,79,81,80,67)没有明显的同源性。克隆TbRa24与克隆TbRa29重叠。
B.用肺结核以及胸膜结核病患者的血清鉴定编码结核分枝杆菌抗原的DNA序列用活动性结核病患者的合并血清筛选上述基因组DNA文库以及附加的H37Rv文库。为了制备H37Rv文库,分离结核分枝杆菌菌株H37Rv基因组DNA,进行部分Sau3A消化,用于以λZAP表达盒(Stratagene,La Lolla,Ca)构建表达文库。在表达筛选中,采用三种不同的合并血清,每种所含血清获自三位患有活动性肺结核或胸膜结核病的个体。合并血清命名为TbL,TbM和TbH,指在ELISA和免疫印迹中与H37Ra裂解液的相对反应性(即,TbL=低反应性,TbM=中等反应性,TbH=高反应性)。另外还采用了来自7位活动性肺结核患者的第四份合并血清。所有血清与重组38kD结核分枝杆菌H37Ra磷酸结合蛋白的反应性均不增加。
如Sambrook等人《分子克隆实验指南》,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY,1989中所述的那样,用大肠杆菌裂解液预先吸附所有合并血清,并用来筛选H37Ra和H37Rv表达文库。纯化得到表达免疫反应性抗原的噬菌体噬斑。挽救噬斑的噬菌粒,推导出结核分枝杆菌克隆的核苷酸序列。
纯化获得了32个克隆。其中31个克隆显示出的序列以前未曾在人结核分枝杆菌中鉴定过。鉴定出的DNA分子的代表性序列提供在SEQ ID NO:26-51以及100中。其中,TbH-8-2(SEQ ID NO:100)是TbH-8的部分克隆,TbH-4(SEQ ID NO:43)和TbH-4-FWD(SEQ ID NO:44)是来自同一克隆的不连续的序列。后文鉴定为Tb38-1,TbH-4,TbH-8,TbH-9和TbH-12的抗原的氨基酸序列显示在SEQ ID NO:89-93中。用上述鉴定的数据库比较这些序列与基因库中已知的序列,结果显示与TbH-4,TbH-8,TbH-9和TbM-3没有明显的同源性,虽然发现与TbH-9有弱的同源性。发现TbH-12与以前在副结核分枝杆菌(M.paratuberculosis)(登录号S28515)中鉴定的34kD抗原性蛋白同源。发现Tb38-1位于以前在牛分枝杆菌(登录号U34848)和结核分枝杆菌(Sorensen等人,Infec.Immun.63:1710-1717,1995)中鉴定的抗原ESAT-6开放读框上游34碱基对处。
用衍生自Tb38-1和TbH-9(均从H37Ra文库分离出)的探针鉴定H37Ra文库中的克隆。Tb38-1与Tb38-1F2,Tb38-1F3,Tb38-1F5以及Tb38-1F6(SEQ ID NO:107,108,111,113以及114)杂交。(SEQ ID NO:107和108是克隆Tb38-1F2的不连续的序列。)推导出Tb38-1F2中的两个开放读框;一个对应于Tb37FL(SEQ ID NO:109),第二个部分序列可能与Tb38-1同源,称为Tb38-1N(SEQ ID NO:110)。Tb38-1F3的推导氨基酸序列显示在SEQ ID NO:112中。TbH-9探针在H37Rv文库中鉴定出三个克隆TbH-9-FL(SEQ ID NO:101),它可能与TbH-9(R37Ra)同源,TbH-9-1(SEQ ID NO:103),以及TbH-8-2(SEQ ID NO:105)是TbH-8的部分克隆。这三个克隆的推导氨基酸序列显示在SEQ ID NO:102、104和106中。
如上所述,进一步筛选结核分枝杆菌基因组DNA文库,导致发现另10个反应性克隆,代表了7种不同的基因。这些基因中的一个经鉴定是上文讨论的38Kd抗原,一个经确定与以前表明存在于结核分枝杆菌中的14Kdα晶体蛋白热休克蛋白相同,第三个经确定与上述抗原TbH-8相同。其余5个克隆(后文称TbH-29,TbH-30,TbH-32和TbH-33)的确定的DNA序列分别提供在SEQ ID NO:133-136中,其对应的预计的氨基酸序列分别提供在SEQ ID NO:137-140中。将这些抗原的DNA和氨基酸序列与上述基因库中的那些序列比较。发现与TbH-29的5'端(它含有反应性开放读框)没有同源性,但是发现TbH-29的3'端与结核分枝杆菌粘粒Y227相同。发现TbH-32和TbH-33分别与以前鉴定的结核分枝杆菌插入元件IS6110以及结核分枝杆菌粘粒Y50相同。发现与TbH-30没有明显的同源性。
如Sambrook等人(同上)所述的那样,用来自该附加筛选的阳性噬菌粒感染大肠杆菌XL-1 Blue MRF'。通过加入IPTG,实现了重组蛋白的诱导。使诱导的和未经诱导的裂解液进行SDS-PAGE,一式两份,并转移到硝酸纤维素膜上。使滤膜与能与TbH反应的人结核分枝杆菌血清(1∶200稀释度)以及能与lacZ的N端4Kd部分反应的家兔血清(1∶200或1∶250稀释度)反应。室温培育血清2小时。加入125Ⅰ标记的蛋白质A,随后使膜曝光16小时至11天的不同时间,检测结合的抗体。免疫印迹的结果总结在表2中。
表2抗原 人结核分枝杆菌血清 抗-lacZ血清TbH-29 45Kd 45KdTbH-30 没有反应性 29KdTbH-32 12Kd 12KdTbH-33 16Kd 16Kd重组人结核分枝杆菌抗原与人结核分枝杆菌血清以及抗lacZ血清的阳性反应表明,人结核分枝杆菌血清的反应性针对融合蛋白。对抗lacZ血清有反应性但对人结核分枝杆菌血清没有反应性的抗原,可能是人结核分枝杆菌血清识别构型性表位的结果,或抗原-抗体结合动力学可能这样的情况,即免疫印迹中2小时的血清接触不够充分。
进行了研究以确定抗原TbH-9和Tb38-1是否代表细胞蛋白还是分泌到结核分枝杆菌培养基内。在第一个研究中,用基本上如实施例3A所述的程序,产生的家兔血清针对下列蛋白(A)结核分枝杆菌的分泌性蛋白,(B)已知的分泌性重组结核分枝杆菌抗原85b,(C)重组Tb38-1和(D)重组TbH-9。在变性凝胶上分辨了结核分枝杆菌总裂解液、结核分枝杆菌培养物浓缩上清液以及重组抗原85b,TbH-9和Tb38-1,固定在硝酸纤维素膜上,用上述家兔血清探测一式两份的印迹。
图2A-D中分别显示了用对照血清(面板Ⅰ)、针对分泌性蛋白、重组85b、重组Tb38-1以及重组TbH-9的抗血清(面板Ⅱ)的该分析结果,其中泳道编号如下1)分子量蛋白标准品;2)5微克结核分枝杆菌裂解液;3)5微克分泌性蛋白;4)50ng重组Tb38-1;5)50ng重组TbH-9和6)50ng重组85b。重组抗原经基因工程加上了6个末端组氨酸残基,因此预计迁移时的移动比天然蛋白约大1kD。在图2D中,重组TbH-9缺少全长42kD抗原的大约10kD,因此裂解液泳道中免疫反应性天然TbH-9抗原的大小明显不同(用箭头表示)。这些结果证明Tb38-1和TbH-9是胞内抗原,并非由结核分枝杆菌主动分泌的。
通过测定TbH-9-特异性人T细胞克隆与重组TbH-9、分泌性结核分枝杆菌蛋白和PPD的反应性,确证了TbH-9是胞内抗原的发现。从健康PPD阳性献血员的PBMC了产生TbH-9-特异性T细胞克隆(命名为131TbH-9)。通过如实施例1所述的那样测定氚化胸苷的摄入,确定了131TbH-9对分泌性蛋白、重组TbH-9以及对照结核分枝杆菌抗原TbRa11的增殖反应。如图3A所示,克隆131TbH-9对TbH-9有特异性反应,说明TbH-9并非结核分枝杆菌分泌性蛋白的重要组分。图3B显示了从健康PPD阳性献血员的PBMC制得的第二种TbH-9特异性T细胞克隆(称为PPD 800-10)在用分泌性蛋白、PPD或重组TbH-9刺激T细胞克隆后的IFN-γ产生情况。这些结果进一步确证TbH-9不是结核分枝杆菌分泌的。
C.用肺外结核病患者的血清鉴定编码结核分枝杆菌抗原的DNA序列从结核分枝杆菌Erdman菌株分离出基因组DNA,随机剪切并用于以λZAP表达系统(Stratagene,La Jolla,CA)来构建表达文库。如实施例3B所述的那样,所得文库用肺外结核病个体的合并血清来筛选,第二抗体是偶联了碱性磷酸酶的山羊抗人IgG+A+M(H+L)。
纯化获得18个克隆。发现其中4个克隆(后称XP14、XP24、XP31和XP32)与己知的序列有一些相同性。测得的XP14、XP24和XP31的DNA序列分别提供在SEQID NO:151-153中,XP32的5'和3'DNA序列分别在SEQ ID NO:154和155中。XP14的预计氨基酸序列提供在SEQ ID NO:156中。发现XP14的反向互补序列编码了SEQID NO:157中的氨基酸序列。
将其余14个克隆(后称XP1-XP6,XP17-19,XP22,XP25,XP27,XP30和XP36)的序列与上述基因库中的那些序列比较,结果表明,除了发现XP2和XP6的3'端与已知的结核分枝杆菌粘粒有一些同源性以外,没有同源性。XP27以及XP36的DNA序列分别显示在SEQ ID NO:158和159中,XP4,XP5,XP17和XP30的5'序列分别显示在SEQ ID NO:160-163中,XP2、XP3、XP6、XP18、XP19、XP22和XP25的5'和3'序列分别显示在SEQ ID NO:164和165;166和167;168和169;170和171;172和173;174和175;176和177中。发现XP1与上述TbH4的DNA序列重叠。TbH4-XP1的全长DNA序列提供在SEQ ID NO:178中。发现该DNA序列含有的开放读框编码了SEQ ID NO:179所示的氨基酸序列。发现TbH4-XP1的反向互补序列含有的开放读框编码SEQ ID NO:180的氨基酸序列。发现XP36的DNA序列含有的两个开放读框编码了SEQ ID NO:181和182所示的氨基酸序列,反向互补序列含有的开放读框编码了SEQ ID NO:183所示的氨基酸序列。
如上实施例3B所述的那样,制备重组XP1蛋白,用金属离子亲和层析柱来纯化。发现重组XP1在分离自结核分枝杆菌-免疫献血员的T细胞中刺激细胞增殖和IFN-γ产生。
D.用结核病患者的裂解液阳性合并血清鉴定编码结核分枝杆菌抗原的DNA序列如下文实施例6所述,从结核分枝杆菌Erdman菌株分离得到基因组DNA,随机剪切,并用于以λ筛选表达系统(Novagen,Madison,WI)来构建表达文库。如实施例3B所述,用从结核分枝杆菌感染患者获得的且显示与结核分枝杆菌裂解液反应(但不与以前表达的蛋白质38kD、Tb38-1、TbRa3、TbH4、DPEP和TbRa11反应)的合并血清来筛选表达文库,第二抗体是偶联碱性磷酸酶的山羊抗人IgG+A+M(H+L)。
纯化得到27个克隆。比较这些克隆测得的cDNA序列,结果表明与10个克隆(后称LSER-10、LSER-11、LSER-12、LSER-13、LSER-16、LSER-18、LSER-23、LSER-24、LSER-25和LSER-27)没有显著同源性。测得的LSER-10、LSER-11、LSER-12、LSER-13、LSER-16和LSER-25的5'cDNA序列分别提供在SEQ ID NO:237-242中,对应于LSER-10、LSER-12、LSER-13、LSER-16和LSER-25的预计氨基酸序列分别提供在SEQ ID NO:243-247中。测得的LSER-18、LSER-23、LSER-24和LSER-27的全长cDNA序列分别显示在SEQ ID NO:248-251中,其对应的预计氨基酸序列提供在SEQ ID NO:252-255中。发现其余17个克隆与以前在结核分枝杆菌中鉴定的未知序列相似。这些克隆中16个克隆(后称LSER-1、LSER-3、LSER-4、LSER-5、LSER-6、LSER-8、LSER-14、LSER-15、LSER-17、LSER-19、LSER-20、LSER-22、LSER-26、LSER-28、LSER-29和LSER-30)的测得的5'cDNA序列分别提供在SEQ IDNO:256-271中,对应于LSER-1、LSER-3、LSER-5、LSER-6、LSER-8、LSER-14、LSER-15、LSER-17、LSER-19、LSER-20、LSER-22、LSER-26、LSER-28、LSER-29和LSER-30的预计氨基酸序列分别提供在SEQ ID NO:272-286中。SEQ ID NO:287中提供了克隆LSER-9测得的全长cDNA序列。发现LSER-6的反向互补序列(SEQ IDNO:288)编码了SEQ ID NO:289的预计氨基酸序列。
E.用针对结核分枝杆菌分级蛋白产生的家兔抗血清制备结核分枝杆菌可溶性抗原如实施例2所述制备结核分枝杆菌裂解液。所得物质用HPLC分级,用结核分枝杆菌感染患者的显示出与本发明其它抗原没有或有很少免疫反应性的合并血清通过Western印迹筛选级分的血清学活性。用实施例3A所述的方法针对最具反应性的级分产生家兔抗血清。用该抗血清来筛选如上所述制备的结核分枝杆菌Erdman菌株基因组DNA表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。挽救噬斑的噬菌粒,测定结核分枝杆菌克隆的核苷酸序列。
纯化得到10个不同的克隆。其中发现一个是上述的TbRa35,一个是以前鉴定的结核分枝杆菌抗原HSP60。在其余的8个克隆中,发现6个克隆(后称RDIF2、RDIF5、RDIF8、RDIF10、RDIF11和RDIF12)与以前鉴定的结核分枝杆菌序列具有一定相似性。RDIF2、RDIF5、RDIF8、RDIF10和RDIF11测得的DNA序列分别提供在SEQ ID NO:184-188中,其对应的预计氨基酸序列分别提供在SEQ ID NO:189-193中。RDIF12的5'和3'DNA序列分别提供在SEQ ID NO:194和195中。发现与抗原RDIF-7没有显著的同源性。RDIF7测得的DNA序列以及预计的氨基酸序列分别提供在SEQ ID NO:196和197中。还分离出另一个克隆,称为RDIF6,然而,发现它与RDIF5相同。
如上所述制备重组的RDIF6、RDIF8、RDIF10和RDIF11。发现这些抗原在分离自结核分枝杆菌-免疫献血员的T细胞中刺激细胞增殖和IFN-γ产生。
实施例4从结核菌素纯化的蛋白质衍生物纯化多肽并作特性分析如下所述,从结核菌素纯化蛋白质衍生物(PPD)中分离得到结核分枝杆菌多肽。
PPD如公开的那样稍作改动来制备(Seibert,F.等人,″结核菌素纯化的蛋白质衍生物。大量标准品的制备和分析″The American Review of Tuberculosis 44:9-25,1941)。使结核分枝杆菌Rv菌株在转瓶中合成培养基中37℃生长6周。然后在水蒸汽中加热含有细菌生长的瓶至100℃3小时。用0.22μ滤膜对培养物作无菌过滤,用3kD截断膜将液相浓缩20倍。用50%硫酸铵溶液沉淀蛋白质一次,用25%硫酸铵溶液沉淀8次。得到的蛋白质(PPD)用C18柱(7.8×300mM;Waters,Milford,MA)在BiocadHPLC系统(Preseptive Biosystems,Framingham,MA)中通过反相液相层析(RP-HPLC)分级。用0-100%缓冲液(含0.1%TFA的乙腈)的线性梯度从柱上洗脱各级分。流速为10毫升/分钟,在214nm和280nm下监测洗脱液。
收集到6个级分,干燥,分别悬于PBS中,在感染结核分枝杆菌的豚鼠中测试6个级分诱导迟发型超敏(DTH)反应的情况。发现一个级分诱导了强的DTH反应,随后将此级分在Perkin Elmer/Applied Biosystems Division Model 172 HPLC中在微孔Vydac C18柱(目录号218TP5115)上通过RP-HPLC进一步分级。用5-100%缓冲液(含0.05%TFA的乙腈)的线性梯度以80微升/分钟的流速洗脱各级分。在215nm下监测洗脱液。收集到8个级分,测试其在感染了结核分枝杆菌的豚鼠中诱导DTH的情况。发现一个级分诱导可约16毫米硬块的强DTH反应。其它级分没有诱导出可检测的DTH。对该阳性级分再进行SDS-PAGE凝胶电泳,发现有大约12kD分子量的单个蛋白条带。
如上所述,用Perkin Elmer/Applied Biosystems Division Procise 492型蛋白测序仪从氨基端起对该多肽(后称DPPD)测序,发现N端序列如SEQ ID NO:124所示。如上所述将该序列与基因库中的已知序列比较,结果表明没有已知的同源物。分离DPPD的四个溴化氰片段,发现具有如SEQ ID NO:125-128所示的序列。随后搜寻由基因组搜寻委员会(Institute for Genomic Research)发布的结核分枝杆菌基因组数据库,结果表明DPPD部分氨基酸序列与结核分枝杆菌粘粒MTY21C12中的序列匹配。鉴定出336bp的一个开放读框。DPPD的全长DNA序列提供在SEQ ID NO:235中,其对应的全长氨基酸序列提供在SEQ ID NO:236中。
实施例5用感染结核病的猴血清鉴定编码结核分枝杆菌抗原的DNA序列从结核分枝杆菌Erdman菌株分离得到基因组DNA,随机剪切并用于以λZAP表达系统(Stratagene,La Jolla,CA)构建表达文库。从感染结核分枝杆菌Erdman菌株后18、33、51和56天的猕猴获得血清样品。合并这些样品,用实施例3C所述的步骤筛选结核分枝杆菌基因组DNA表达文库。
纯化得到20个克隆。SEQ ID NO:210-220中分别提供了称为MO-1、MO-2、MO-4、MO-8、MO-9、MO-26、MO-28、MO-29、MO-30、MO-34和MO-35的克隆所测得的5'DNA序列,其对应的预计氨基酸序列提供在SEQ ID NO:221-231中。克隆MO-10的全长DNA序列提供在SEQ ID NO:232中,其对应的预计氨基酸序列提供在SEQ ID NO:233中。克隆MO-27的3'DNA序列提供在SEQ ID NO:234中。
发现克隆MO-1、MO-30和MO-35与以前鉴定的未明结核分枝杆菌序列以及粘粒MTCI237有高度相关并表现出某些同源性。发现MO-2与结核分枝杆菌的天冬氨酸激酶有一些同源性。发现MO-3、MO-7和MO-27是相同的,并与MO-5高度相关。所有这四种克隆表现出与结核分枝杆菌热休克蛋白70有一些同源性。发现MO-27与结核分枝杆菌粘粒MTCY339有一些同源性。发现MO-4和MO-34与粘粒SCY21B4以及耻垢分枝杆菌整合宿主因子有一些同源性,还发现两者与以前鉴定的未知的结核分枝杆菌序列有一些同源性。发现MO-6与结核分枝杆菌热休克蛋白65有一些同源性。发现MO-8、MO-9、MO-10、MO-26和MO-29彼此高度相关,且与结核分枝杆菌二氢硫辛酰胺琥珀酰转移酶有一些同源性。发现MO-28、MO-31和MO-32是相同的,并显示出与以前鉴定的结核分枝杆菌蛋白质有一些同源性。发现MO-33与以前鉴定的14kDa结核分枝杆菌热休克蛋白有一些同源性。
用上述方案作进一步研究,导致分离得到另四个克隆,后称MO-12、MO-13、MO-19和MO-39。这些克隆所测得的5'cDNA序列分别提供在SEQ ID NO:290-293中,其对应的预计蛋白质序列分别提供在SEQ ID NO:294-297中。如上所述将这些序列与基因库中的那些序列比较,结果揭示与MO-39没有显著的同源性。发现MO-12、MO-13和MO-19与以前从结核分枝杆菌分离的未知序列有一些同源性。
实施例6通过筛选新的表达文库分离编码结核分枝杆菌抗原的DNA序列本实施例描述了通过用结核分枝杆菌感染患者的血清筛选新的表达文库来分离编码结核分枝杆菌抗原的DNA序列,该血清显示与一组重组结核分枝杆菌抗原TbRa11,TbRa3,Tb38-1,TbH4,TbF和38kD不反应。
将来自结核分枝杆菌Erdman菌株的基因组DNA随机剪切至平均大小为2kb,用Klenow聚合酶使末端变成平头,然后加入EcoRⅠ衔接物。随后将插入物连接入筛选噬菌体载体(Novagen,Madison,WI),用PhageMaker抽提物(Novagen)体外包装。如实施例3B所述的那样,用来自几个结核分枝杆菌献血员的已显示对一组以前鉴定的结核分枝杆菌抗原呈阴性(反应)的血清筛选得到的文库。
总共分离得到22个不同的克隆。相比,用同血一清筛选上述λZAP文库没有得到一个阳性命中物。发现一个克隆代表了上述的TbRa11。其余21个克隆中的19个克隆(后称Erdsn1,Erdsn2,Erdsn4-Erdsn10,Erdsn12-18,Erdsn21-Erdsn23以及Erdsn25)所测得的5'cDNA序列分别提供在SEQ ID NO:298-317中,Erdsn1,Erdsn2,Erdsn4,Erdsn5,Erdsn7-Erdsn10,Erdsn12-Erdsn18,Erdsn21-Erdsn23以及Erdsn25所测得的3'cDNA序列分别提供在SEQ ID NO:318-336中。克隆Erdsn24的全部cDNA插入序列提供在SEQ ID NO:337中。将测得的cDNA序列与基因库中的那些序列比较,结果表明与SEQ ID NO:304、311、313-315、317、319、324、326、329、331、333、335和337提供的序列没有显著同源性。发现SEQ ID NO:298-303、305-310、312、316、318、320-321、324-326、328、330、332、334和336的序列与以前在结核分枝杆菌中鉴定的未知序列有一些同源性。
实施例7用质谱法分离可溶性结核分枝杆菌抗原本实施例描述用质谱法鉴定可溶性结核分枝杆菌抗原。
在第一个方法中,用结核病感染个体的血清通过Western分析筛选结核分枝杆菌培养渗滤液。从银染凝胶上切下反应条带,用质谱法测定氨基酸序列。一个分离抗原所测得的氨基酸序列提供在SEQ ID NO:338中。将该序列与基因库中的那些序列比较,结果揭示与以前在结核分枝杆菌中鉴定的85b前体抗原同源。
在第二个方法中,研究了结核分枝杆菌培养上清液的高分子量区域。该区域可能含有可用于诊断结核分枝杆菌感染的免疫优势抗原。通过Western分析,两个已知的单克隆抗体IT24和IT57(购自Center for Disease Control,Atlanta,GA)显示出与此邻近的抗原有反应性,但是该抗原的身份仍然未知。另外,未知的高分子量蛋白质已被描述成含有HIV阳性个体中结核分枝杆菌感染的替代制造者(Jnl.Infect.Dis.,176:133-143,1997)。为了确定这些抗原的身份,用抗体IT57和IT42进行了二维凝胶电泳和二维Western分析。鉴定出高分子量区域的5个蛋白质斑点,单独切下,酶促消化并进行质谱分析。
这些斑点中的三个(称为斑点1、2和4)所测得的氨基酸序列分别提供在SEQ IDNO:339,340-341和342中。将这些序列与基因库中的那些序列比较,结果表明斑点1是以前鉴定的Pck-1(一种磷酸烯醇丙酮酸激酶)。分离自斑点2的两个序列经测定来自两个DNAks,它们以前在结核分枝杆菌中鉴定为热休克蛋白。斑点4被确定是以前鉴定的结核分枝杆菌蛋白质Kat G。就发明人所知,Pck-1和两个DNAks以前均未显示可用来诊断结核分枝杆菌感染。
实施例8合成性多肽的合成可通过FMOC化学试剂用HPTU(O-苯并三唑-N,N,N',N'-四甲基脲六氟磷酸)激活在Millipore 9050肽合成仪上合成多肽。可将Gly-Cys-Gly序列与肽的氨基端连接,提供一种对肽的偶联或标记方法。用下列切割混合物可将肽从固相载体上切割下来三氟乙酸∶乙二硫醇∶苯硫基甲烷∶水∶苯酚(40∶1∶2∶2∶3)。切割2小时后,可将肽沉淀在冷的甲基叔丁基醚中。然后将肽沉淀溶于含有0.1%三氟乙酸(TFA)的水中,冻干,然后用C18反相HPLC纯化。可用含0-60%梯度乙腈(含有0.1%TFA)的水(含有0.1%TFA)洗脱肽。在将纯级分冻干后,可用电喷射质谱法和氨基酸分析对肽作特性分析。
用该步骤合成了含有一个半TbM-1序列重复序列的TbM-1肽。TbM-1肽具有序列GCGDRSGGNLDQIRLRRDRSGGNL(SEQ ID NO:63)。
实施例9代表性抗原在结核病血清学诊断中的用途本实施例描述了几个代表性抗原的诊断性质。
在96孔板上进行试验,测试板上包被了稀释在50微升碳酸盐包被缓冲液(pH9.6)的200ng抗原。4℃下包被诸孔过夜(37℃2小时)。然后除去孔中物质,用200微升PBS/1%BSA封闭诸孔2小时。封闭步骤后,用PBS/0.1%吐温20TM洗孔5次。然后在各孔中加入50微升1∶100稀释在PBS/0.1%吐温20TM/0.1%BSA中的血清,室温培育30分钟。然后用PBS/0.1%吐温20TM再洗板5次。
然后将酶偶联物(辣根过氧化物酶-蛋白质A,Zymed,San Francisco,CA)1∶10000稀释在PBS/0.1%吐温20TM/0.1%BSA中,在各孔中加入50微升稀释的偶联物,室温培育30分钟。培育后,用PBS/0.1%吐温20TM洗涤孔5次。加入100微升四甲基联苯胺过氧化物酶(TMB)底物(Kirkegaard and Perry Laboratories,Gaithersburg,MD),不稀释,培育大约15分钟。在每个孔内加入100微升1N硫酸终止反应,在450nm平板读数。
图4显示了用结核分枝杆菌阳性和阴性患者的血清以及实施例3方法A的两个重组抗原(TbRa3和TbRa9)的ELISA反应性。将这些抗原的反应性与分离自结核分枝杆菌菌株H37Ra(Difco,Detroit,MI)的细菌裂解液比较。在两种情况下,重组抗原均能区别阳性和阴性血清。根据从接受者-操作者曲线(receiver-operator curve)获得的截断值,TbRa3检测出87份阳性血清中的56份,TbRa9检测出165份阳性血清中的111份。
图5描述了用实施例3方法B分离的代表性抗原的ELISA反应性。将重组抗原TbH4,TbH12,Tb38-1和肽TbM-1的反应性(如实施例4所述)与Andersen和Hansen,Infect.Immun.57:2481-2488,1989中描述的38kD抗原的反应性比较。同样,测试的所有多肽均能区别阳性和阴性血清。根据从接受者-操作者曲线获得的截断值,TbH4检测出126份阳性血清中的67份,TbH12检测出125份阳性血清中的50份,38-1检测出101份阳性血清中的61份,TbM-1肽检测出30份阳性血清中的25份。
还检查了四种抗原(TbRa3,TbRa9,TbH4和TbH12)与一组结核分枝杆菌感染患者的血清(此血清在痰液的抗酸细菌染色中有不同的反应性(Smithwick和David,Tubercle 52:226,1971))的反应性,并与结核分枝杆菌裂解液以及38kD抗原的反应性比较。结果显示在下表3中表3抗原与结核分枝杆菌患者血清的反应性


根据从接受者-操作者曲线获得的截断值,TbRa3检测出27份阳性血清中的23份,TbRa9检测出27份中的22份,TbH4检测出27份中的18份,TbH12检测出27份的15份。如果合用,这四种抗原理论上的敏感性是27份中检出27份,这表明在结核分枝杆菌感染的血清学检测中,这些抗原应互相补充。另外,几种重组抗原检测出用38kD抗原未能检测出的阳性血清,这表明这些抗原可能与38kD抗原互补。
如上所述,用ELISA测定重组抗原TbRa11和显示对38kD抗原呈阴性的结核分枝杆菌患者血清以及PPD阳性和正常献血员血清的反应性。结果显示在图6中。结果表明TbRa11尽管对PPD阳性和正常献血员的血清呈阴性,却检测出对38kD抗原呈阴性的血清。在测试的13份38kD阴性血清中,有9份对TbRa11呈阳性,这表明该抗原可能与38kD抗原阴性血清的一个亚组反应。相反,在一组与TbRa1l反应的38kD阳性血清中,TbRa11的平均OD450低于38kD抗原的平均OD450。此数据表明TbRa11活性和38kD阳性之间成相反的关系。
在间接ELISA试验中测试了抗原TbRa2A,试验开始时用50微升稀释度为1∶100的血清在室温下反应30分钟,然后用PBS吐温洗涤,并与稀释度为1∶10000的生物素化蛋白质A(Zymed,San Francisco,CA)培育30分钟。洗涤后,加入1∶10000稀释的链霉亲和素辣根过氧化物酶(Zymed),培育混合物30分钟。洗涤后,如上所述用TMB底物使试验显色。表4中显示了TbRa2A与结核分枝杆菌患者以及正常献血员的血清的反应性。TbRa2A与结核分枝杆菌患者血清的反应性的平均值为0.444,标准偏差为0.309。与正常献血员的血清的反应性平均值为0.109,标准偏差为0.029。38kD阴性血清的测试(图7)也表明TbRa2A抗原能检测出该范畴中的血清。
表4TBRA2A与结核分枝杆菌患者以及正常献血员的血清的反应性


如上所述,用ELISA测定重组抗原(g)(SEQ ID NO:60)与结核分枝杆菌患者以及正常献血员的血清的反应性。图8显示了全都和38kD抗原反应的四份结核分枝杆菌阳性血清以及四份供体血清滴定抗原(g)的结果。所有四份阳性血清都与抗原(g)反应。
如上所述,用间接ELISA测定了重组抗原TbH-29(SEQ ID NO:137)与结核分枝杆菌患者、PPD阳性献血员以及正常献血员的血清的反应性。结果显示在图9中。TbH检测出60份结核分枝杆菌血清中的30份,8份PPD阳性血清中的2份以及27份正常血清中的2份。
图10显示了用结核分枝杆菌患者的血清、正常献血员的血清以及结核分枝杆菌患者的合并血清对抗原TbH-33(SEQ ID NO:140)进行ELISA测试(直接和间接)的结果。证实结核分枝杆菌患者血清的OD450平均值高于正常献血员的血清,间接ELISA中的OD450平均值显著高于直接ELISA中的OD450平均值。图11是重组TbH-33与结核分枝杆菌患者血清以及正常献血员血清的反应性的滴定曲线,该曲线显示OD450随抗原浓度增加而增加。
如上所述,用ELISA测定重组抗原RDIF6、RDIF8和RDIF10(分别为SEQ ID NO:184-187)与结核分枝杆菌患者血清以及正常献血员血清的反应性。RDIF6检测出32份结核分枝杆菌血清中的6份,15份正常血清中的0份;RDIF8检测出32份结核分枝杆菌血清中的14份,15份正常血清中的0份;RDIF10检测出27份结核分枝杆菌血清中的4份,15份正常血清中的1份。另外,发现RDIF10检测出5份PPD阳性献血员血清中的0份。
在大肠杆菌中表达了上述实施例5中的抗原MO-1、MO-2、MO-4、MO-28和MO-29,并用六组氨酸尾纯化。如上所述用ELISA检测这些抗原与结核分枝杆菌阳性以及阴性血清的反应性。图12A-E中分别显示了在对四份结核分枝杆菌阳性血清和四份结核分枝杆菌阴性血清测试时在不同固相包被水平下MO-1、MO-2、MO-4、MO-28和MO-29的反应性。在HIV阳性/结核病(HIV/TB)阳性和肺外血清组中对克隆中的三个克隆MO-1、MO-2和MO-29作进一步测试。MO-1检测出20份肺外血清中的3份,38份HIV/TB血清中的2份。在同一血清组中,MO-2检测出20份中的2份,38份中的10份,MO-29检测出20份血清中的2份,38份中的8份。这三个克隆组合将检测出20份肺外血清中的4份,38份HIV/TB血清中的16份。另外,在17份已显示仅与结核分枝杆菌裂解液反应但不与本发明的38kD或其它抗原反应的血清中,MO-1检测出6份。
实施例10结核分枝杆菌融合蛋白的制备和特性分析如下制备含有TbRa3,38kD抗原和Tb38-1的融合蛋白。
用PCR修饰各个DNA构建物TbRa3,38kD和Tb38-1,以促进它们的融合级融合蛋白TbRa3-38kD-Tb38-1随后的表达。用TbRa3,38kD和Tb38-1的DNA进行PCR,采用的引物分别为PDM-64和PDM-65(SEQ ID NO:141和142),PDM-57和PDM-58(SEQ ID NO:143和144),PDM-69和PDM-60(SEQ ID NO:145-146)。在每一例中,用10微升10X Pfu缓冲液、2微升10mM dNTP、2微升10微摩尔的各种PCR引物、81.5微升水、1.5微升Pfu DNA聚合酶(Stratagene,La Jolla,CA)和1微升70ng/μl(对于TbRa3而言)或50ng/μl(对于38kD和Tb38-1而言)的DNA进行DNA扩增。对于TbRa3,进行94℃变性2分钟,然后进行40轮的96℃15秒和72℃1分钟,最后72℃4分钟。对于38kD,96℃变性2分钟,然后进行40轮的96℃30秒,68℃15秒和72℃3分钟,最后72℃4分钟。对于Tb38-1,94℃变性2分钟,然后进行10轮的96℃15秒、68℃15秒、72℃1.5分钟,30轮的96℃15秒、64℃15秒和72℃1.5分钟,最后72℃4分钟。
用NdeⅠ和EcoRⅠ消化TbRa3 PCR片段,用NdeⅠ和EcoRⅠ位点直接克隆到pT7^L2IL1载体中。用Sse8387I消化38kD PCR片段,用T4 DNA聚合酶处理变为平头,然后用EcoRⅠ消化,直接克隆到经StuⅠ和EcoRⅠ消化的pT7^L2Ra3-1载体中。用Eco47Ⅲ和EcoRⅠ消化38-1PCR片段,直接亚克隆到经相同酶消化的pT7^L2Ra3/38kD-17中。然后利用NdeⅠ和EcoRⅠ位点将整个融合物转移到pET28b中。通过DNA测序确认融合构建物。
将表达构建物转化到BLR plys S大肠杆菌(Novagen,Madison,WI)中在含卡那霉素(30微克/毫升)和氯霉素(34微克/毫升)的LB肉汤中生长过夜。用该培养物(12毫升)接种500毫升含相同抗生素的2XYT,在OD650为0.44时用IPTG诱导培养物至最终浓度为1.2毫摩尔。诱导4小时后,收获细菌并在20毫摩尔Tris(8.0)、100毫摩尔NaCl、0.1%DOC、20微克/毫升亮抑酶肽、20毫摩尔PMSF中超声处理,然后26000Xg离心。将得到的沉淀重悬于8M尿素、20毫摩尔Tris(8.0)、100毫摩尔NaCl中并结合到Pro-bond nickel树脂(Invitrogen,Carlsbad,CA)。用上述缓冲液洗柱数次,然后用咪唑梯度(50毫摩尔、100毫摩尔、500毫摩尔咪唑加入8M尿素、20毫摩尔Tris(8.0)、100毫摩尔氯化钠中)洗脱。然后用10毫摩尔Tris(8.0)透析含有感兴趣蛋白质的洗脱液。
SEQ ID NO:147和148分别提供了所得融合蛋白(后称TbRa3-38kD-Tb38-1)的DNA序列和氨基酸序列。
用类似于上文的方法制备含有两个抗原TbH-9和Tb38-1但无铰链序列(后称TbH9-Tb38-1)的融合蛋白。SEQ ID NO:151中提供了TbH9-Tb38-1融合蛋白的DNA序列。
如下制备含有TbRa3、抗原38kD、Tb38-1和DPEP的融合蛋白。
基本上如上所述的那样,用PCR修饰各个DNA构建物TbRa3、38kD和Tb38-1,并克隆到载体中,引物PDM-69(SEQ ID NO:145)和PDM-83(SEQ ID NO:200)用于Tb38-1A片段的扩增。Tb38-1A与Tb38-1不同之处在于编码区3'端有DraⅠ位点,该位点维持最终氨基酸完整同时产生了符合读框的平头限制性位点。然后用NdeⅠ和EcoRⅠ位点将TbRa3/38kD/Tb38-1A融合物转移到pET28b中。
用DPEP DNA进行PCR,采用引物PDM-84和PDM-85(分别为SEQ ID NO:201和202)以及1微升50ng/μl DNA。94℃变性2分钟,然后进行10轮96℃15秒、68℃15秒和72℃1.5分钟;30轮96℃15秒、64℃15秒和72℃1.5分钟;最后72℃4分钟。用EcoRⅠ和Eco72Ⅰ消化DPEP PCR片段,直接克隆到经DraⅠ和EcoRⅠ消化的pET28Ra3/38kD/38-1A构建物中。用DNA测序确认融合构建物的正确。如上所述制备重组蛋白。得到的融合蛋白(后称TbF-2)的DNA和氨基酸序列分别提供在SEQID NO:203和204中。
如下制备含有TbRa3、抗原38kD、Tb38-1和TbH4的融合蛋白。
用结核分枝杆菌基因组DNA来PCR全长TbH4(FL TbH4),采用引物PDM-157和PDM-160(分别为SEQ ID NO:343和344)和2微升100ng/μl的DNA。96℃变性2分钟,然后进行40轮的96℃30秒、61℃20秒和72℃5分钟;最后72℃退火10分钟。用EcoRⅠ和ScaⅠ(New England Biolabs)消化FL TbH4 PCR片段,直接克隆到上述经DraⅠ和EcoRⅠ消化的pET28Ra3/38kD/38-1A构建物中。用DNA测序确认融合构建物正确。如上所述制备重组蛋白。得到的融合蛋白(后称TbF-6)的DNA和氨基酸序列分别提供在SEQ ID NO:345和346中。
如下制备含有由接头隔开的抗原38kD和DPEP的融合蛋白。
用38kD DNA进行PCR,采用引物PDM-176和PDM-175(分别为SEQ ID NO:347和348)以及1微升110ng/μl的PET28Ra3/38kD/38-1/Ra2A-12 DNA。96℃变性2分钟,然后进行40轮的96℃30秒、71℃15秒和72℃5分钟40秒;最后72℃退火4分钟。两组引物PDM-171、PDM-172和PDM-173、PDM-174通过95℃加热2分钟然后以0.1℃/秒的速度降至25℃来退火。如上所述用DPEP DNA进行PCR。用EcoRⅠ(New England Biolabs)消化38kD片段,并克隆到经Eco72Ⅰ(Promega)和EcoRⅠ切割的修饰的pT7ΔL2载体中。修饰的pT7ΔL2构建物设计成在紧靠Eco72Ⅰ位点的5'有符合读框的MGHHHHHH氨基酸编码区。用Kpn2Ⅰ(Gibco,BRL)和PstⅠ(NewEngland Biolabs)消化构建物,克隆入退火的一组磷酸化的引物(PDM-171、PDM-172和PDM-173、PDM-174)。用EcoRⅠ和Eco72Ⅰ消化DPEP PCR片段,克隆到经过Eco47Ⅲ(New England Biolabs)和EcoRⅠ消化的此第二构建物中。用Panvera(Madison,WI)的连接试剂盒进行连接。得到的构建物用NdeⅠ(New England Biolabs)和EcoRⅠ消化,转移到修饰的pET28载体中。通过DNA测序确认融合构建物的正确。
基本上如上所述制备重组蛋白。所得融合蛋白(后称TbF-8)的DNA和氨基酸序列分别提供在SEQ ID NO:349和350中。
实施例11结核分枝杆菌融合蛋白在结核病血清学诊断中的应用用ELISA检查上述制得的融合蛋白TbRa3-38kD-Tb38-1在结核病感染的血清学诊断中的效果。
ELISA程序如上文实施例6所述,每孔包被200ng融合蛋白。从经ELISA或Western印迹分析已显示与三种抗原之一或其组合起反应的一组结核病患者中选出一组血清。该组血清能分辨融合蛋白的血清学反应性,以确定是否所有三个表位均与融合蛋白作用。如表5所示,用融合蛋白仅能检测到所有四份与TbRa3反应的血清。仅与Tb38-1反应的三份血清也是可检测的,与单单38kD反应的两份血清也是如此。根据阴性平均值+3个标准偏差的试验中的截断值,其余的15份血清均对融合蛋白呈阳性。该数据证明了融合蛋白中所有三个表位均有功能活性。
表5三肽融合蛋白与结核分枝杆菌患者血清的反应性



用上文描述的方法通过ELISA检查融合蛋白TbF-2与结核分枝杆菌感染患者血清的反应性。这些研究的结果(表6)证明所有四种抗原在融合蛋白中独立地起作用。
表6TBF-2融合蛋白与TB(结核病)以及正常血清的反应性


本领域技术人员将会理解,融合蛋白中的各抗原次序可以改变,并且预计将提供相当的活性,只要每个表位仍然在功能上有效。另外,在构建融合蛋白时可以采用含有活性表位的蛋白质截短形式。
从前述内容可以理解,尽管本文出于说明的目的描述了本发明的具体实施方案,但仍可不脱离本发明精神和范围而作各种变动。
序列表(1)一般信息(ⅰ)申请人Reed,Steven G.
Skeiky,Yasir A.W.
Dillon,Davin C.
Campos-Neto,AntoniaHoughton,RaymondVedvick,Thomas S.
Twardzik,Daniel R.
Lodes,Michael J.
Hendrickson,Ronald(ⅱ)发明名称诊断结核病的化合物和方法(ⅲ)序列数目350(ⅳ)通信地址(A)地址SEED and BERRY LLP(B)街道6300 Columbia Center,701 Fifth Avenue(C)城市Seattle(D)州Washington(E)国家USA(F)ZIP:98104-7092(ⅴ)计算机可读形式(A)记录介质类型软盘(B)计算机IBM PC兼容型(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,Version#1.30(ⅵ)本申请资料(A)申请号(B)申请日1998年5月5日(C)分类(ⅷ)律师/代理人信息(A)姓名Maki,David J.
(B)登记号31,392(C)参考/案卷号210121.417C9(ⅸ)通讯信息(A)电话(206)622-4900(B)电传(206)682-6031(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)长度766碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:1:CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA 60ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCGGCTGC AATCGGCGCC 120GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG 180GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC 240GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG 300GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG 360AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG 420GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG 480GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG 540ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA 600GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG 660GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC720GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA766(2)SEQ ID NO:2的信息(ⅰ)序列特征(A)长度752碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:2:ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA 60GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG 120GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG 180TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA 240TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA 300TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT 360TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG 420ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA 480GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT 540CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC 600CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN 660TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA 720TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT 752(2)SEQ ID NO:3的信息(ⅰ)序列特征(A)长度813碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:3:CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA 60CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG 120CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT 180GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC 240ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG 300ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC 360GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG 420GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA 480CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG 540CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG 600ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG 660CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT 720GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG 780TGAAATTATC ACAACTTCGC AGTCACNAAA NAA 813(2)SEQ ID NO:4的信息(ⅰ)序列特征(A)长度447碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:4:CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC 60CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC 120CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA 180CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC 240CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA 300CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG 360CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG 420ATACCACCCG CCGGCCGGCC AATTGGA 447(2)SEQ ID NO:5的信息(ⅰ)序列特征(A)长度604碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:5:GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT 60CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG 240ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG 360NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG 420NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA 480NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT 540NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT 600NAAT 604(2)SEQ ID NO:6的信息(ⅰ)序列特征(A)长度633碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:6:TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC 60CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC 120TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA 180CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA 240CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC 300ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG 360GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG 420CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT 480GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC 540CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG 600CCTGACCGGC GACTACCTGT CCGTGACCGA CGC 633(2)SEQ ID NO:7的信息(ⅰ)序列特征(A)长度1362碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:7:CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT 60CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG 120CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC 180CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG 240GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC 300GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG 360CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC 420GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA 480CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC 540CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTFCCTGCC GGGGGGCCCG 600CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG 660GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG 720GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG 780GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG 840TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG 900CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG 960GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT1020GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC1080GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG1140TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT1200GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT1260GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA1320GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA 1362(2)SEQ ID NO:8的信息(ⅰ)序列特征(A)长度1458碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ⅹⅰ)序列描述SEQ ID NO:8:GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG 60GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC 120TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG 180CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC 240TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC 300TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT 360CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT 420CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC 480CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC 540GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG 600CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG 660CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT 720CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC 780ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC 840TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC 900TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG 960ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT1020GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC1080GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG1140TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG1200CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG1260CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC1320GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC CGAAGAGCGG GGCGCATTCC1380CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT1440CCGTCGCTCC GACGGGCA 1458(2)SEQ ID NO:9的信息(ⅰ)序列特征(A)长度862碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:9:ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC 60GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG 120TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT 180CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG 240AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG 300CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG 360CCGTCAAAGG TTTGACCAAC GCGCCGCAGT ACTACGTCGG CGACCAGCCG AAGTTCACCA 420TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG 480CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT 540CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT 600GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA 660CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA 720ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC 780CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT 840GACAACCCCT CGCCTCGTGC CG 862(2)SEQ ID NO:10的信息(ⅰ)序列特征(A)长度622碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:10:TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA 60GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA 120GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG 180TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT 240CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG 300TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT 360TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG 420ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG 480TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG 540GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC 600CGGAAGCCAC CCGNGACATT CT 622(2)SEQ ID NO:11的信息(ⅰ)序列特征(A)长度1200碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:11:GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC 60ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG 120AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT 180GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC 240GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT 300CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG 360CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT 420CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA 480CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC 540CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC 600GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC 660GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG 720TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG 780GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG 840GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC 900TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG 960ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG1020GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG1080AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA1140GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG1200(2)SEQ ID NO:12的信息(ⅰ)序列特征(A)长度1155碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:12:GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA 60AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC 120CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG 180GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG 240CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG 300ACGCGGGCCG GCGGATCCGG GACGCGTTCG TGGTCGGGGA CGGTTACGCC GAGTTGATGA 360CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC 420TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG 480GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG 540GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG 600AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC 660GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC 720GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG 780CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG 840TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG 900AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA 960AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA1020GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT1080TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT1140CGAGTAGCCT CGTCA 1155(2)SEQ ID NO:13的信息(ⅰ)序列特征(A)长度1771碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:13:GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTGCCGGGT 60TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC 120ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC 180GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCG GAGCACGGAC 240ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA 300ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT 360GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG 420GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC 480GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA 540CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC 600GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT 660CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT 720CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC 780AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT 840GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT 900CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA 960GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC1020ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG1080CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC1140GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG1200CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA1260CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT1320GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA1380TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT1440CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC1500CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC1560GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG1620CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC1680CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA1740GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C 1771(2)SEQ ID NO:14的信息(ⅰ)序列特征(A)长度1058碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEC)ID NO:14:CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC 60ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG 240ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG 360CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG 420TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA 480CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC 540TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT 600GCACCTACAA CGACGAGCAG GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA 660AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC 720TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG 780GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT 840CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC 900AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC 960TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC1020GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC1058(2)SEQ ID NO:15的信息(ⅰ)序列特征(A)长度542碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:15:GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC 60GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT 120CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA 180AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA 240AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG 300GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG 360CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA 420CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA 480AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC 540GG542(2)SEQ ID NO:16的信息(ⅰ)序列特征(A)长度913碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:16:CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC 60CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC 120TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC 180GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC 240CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG 300CCGAACAGCC AMGCACCGTT GCCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC 360GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC 420GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG 480CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT 540TCACCGCCAG CACCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG 600CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC 660CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT 720TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC 780CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC GTTGCCGCCA TTGCCGCCAT 840TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC 900CGCCGGCGGC CGC913(2)SEQ ID NO:17的信息(ⅰ)序列特征
(A)长度1872碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:17:GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAATTTCTGA 60TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG 120GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA 180GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA 240CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG 300CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT 360GACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG 420CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA 480GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA 540GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG 600CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA 660GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC 720CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA 780GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG 840CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG 900CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC 960TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC1020GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT1080CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA1140GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC1200CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA1260GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA1320GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC1380GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC1440GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG1500TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC1560GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC1620GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG1680AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG1740TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC1800TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG1860GCACCGATTC TT1872(2)SEQ ID NO:18的信息(ⅰ)序列特征(A)长度1482碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:18:CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC 60CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC 120ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG 180TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG 240GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA 300ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA 360CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA 420TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG 480GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG 540TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG 600AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG 660AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA 720GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG 780CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG 840CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG 900AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG 960AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG1020AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG1080GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC1140GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA1200CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG1260TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG1320GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG1380GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG1440GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT 1482(2)SEQ ID NO:19的信息(ⅰ)序列特征(A)长度876碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:19:GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT 60CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA 120CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT 180CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC 240GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC 300GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA 360GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG 420GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG 480TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA 540TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT 600CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC 660ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG 720TTACTTCAAC ACCGACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG 780TCGACGGGTG AATATCGACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG 840ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT 876(2)SEQ ID NO:20的信息(ⅰ)序列特征(A)长度1021碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:20:ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA 60CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC 120AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC 180CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC 240GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT 300CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC 360GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC 420TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG 480AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC 540GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT 600TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC 660CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA 720GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG 780GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC 840AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA 900CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG 960GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG1020T1021(2)SEQ ID NO:21的信息(ⅰ)序列特征(A)长度321碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:21:CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG 60ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN 120CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA 180TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAG NCTCGNCGAT 240CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG 300GGNGNGNATC GNCGANCACA A 321(2)SECID NO22的信息(ⅰ)序列特征(A)长度373碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:22:TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC 60CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC 120CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG 180ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG 240GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC 300GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA 360CTTACCATCG CCG373(2)SEQ ID NO:23的信息(ⅰ)序列特征(A)长度352碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:23:GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC 60TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT 120TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC 180TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG 240GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT 300TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA 352(2)SEQ ID NO:24的信息(ⅰ)序列特征(A)长度726碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:24:GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC 60GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC 120CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT 180GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG 240GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC 300CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC 360GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG 420TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT 480CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA 540CGACCCCCGG CGGGGCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG 600AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTCATGAAC 660GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG 720ATCGTG726(2)SEQ ID NO:25的信息(ⅰ)序列特征(A)长度580碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:25:CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT 60GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG 120CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA 180ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT 240GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG 300AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG 360AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC 420TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC 480AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC 540TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT 580(2)SEQ ID NO:26的信息(ⅰ)序列特征(A)长度160碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:26:AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC 60GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC 120GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG 160(2)SEQ ID NO:27的信息(ⅰ)序列特征(A)长度272碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:27:GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC 60CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC 120AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT 180GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC 240GCCTACGAGC GCAACGTACA GACCAACGCC CG 272(2)SEQ ID NO:28的信息(ⅰ)序列特征(A)长度317碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:28:GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA 60AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG 120CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC 180GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC 240GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG 300CGGCCTGGTT GCGCGGG317(2)SEQ ID NO:29的信息(ⅰ)序列特征(A)长度182碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ⅹⅰ)序列描述SEQ ID NO:29:GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA 60GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC 120CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT 180GG182(2)SEQ ID NO:30的信息(ⅰ)序列特征(A)长度308碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:30:GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT 60CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA 120GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT 180GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT 240CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC 300ACGTTTGG 308(2)SEQ ID NO:31的信息(ⅰ)序列特征(A)长度267碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:31:CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC 60CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT 120GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG 180ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG 240TCGACGCGGC AATCCAGGGC GGTCTGG 267(2)SEQ ID NO:32的信息(ⅰ)序列特征(A)长度1539碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:32:CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA 60TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG 120CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG 180ACGGAGCGGT CGCGCACTTC CAGGTGACTA TGAAAGTCGG CTTCCGCTGG AGGATTCCTG 240AACCTTCAAG CGCGGCCGAT AACTGAGGTG CATCATTAAG CGACTTTTCC AGAACATCCT 300GACGCGCTCG AAACGCGGTT CAGCCGACGG TGGCTCCGCC GAGGCGCTGC CTCCAAAATC 360CCTGCGACAA TTCGTCGGCG GCGCCTACAA GGAAGTCGGT GCTGAATTCG TCGGGTATCT 420GGTCGACCTG TGTGGGCTGC AGCCGGACGA AGCGGTGCTC GACGTCGGCT GCGGCTCGGG 480GCGGATGGCG TTGCCGCTCA CCGGCTATCT GAACAGCGAG GGACGCTACG CCGGCTTCGA 540TATCTCGCAG AAAGCCATCG CGTGGTGCCA GGAGCACATC ACCTCGGCGC ACCCCAACTT 600CCAGTTCGAG GTCTCCGACA TCTACAACTC GCTGTACAAC CCGAAAGGGA AATACCAGTC 660ACTAGACTTT CGCTTTCCAT ATCCGGATGC GTCGTTCGAT GTGGTGTTTC TTACCTCGGT 720GTTCACCCAC ATGTTTCCGC CGGACGTGGA GCACTATCTG GACGAGATCT CCCGCGTGCT 780GAAGCCCGGC GGACGATGCC TGTGCACGTA CTTCTTGCTC AATGACGAGT CGTTAGCCCA 840CATCGCGGAA GGAAAGAGTG CGCACAACTT CCAGCATGAG GGACCGGGTT ATCGGACAAT 900CCACAAGAAG CGGCCCGAAG AAGCAATCGG CTTGCCGGAG ACCTTCGTCA GGGATGTCTA 960TGGCAAGTTC GGCCTCGCCG TGCACGAACC ATTGCACTAC GGCTCATGGA GTGGCCGGGA1020ACCACGCCTA AGCTTCCAGG ACATCGTCAT CGCGACCAAA ACCGCGAGCT AGGTCGGCAT1080CCGGGAAGCA TCGCGACACC GTGGCGCCGA GCGCCGCTGC CGGCAGGCCG ATTAGGCGGG1140CAGATTAGCC CGCCGCGGCT CCCGGCTCCG AGTACGGCGC CCCGAATGGC GTCACCGGCT1200GGTAACCACG CTTGCGCGCC TGGGCGGCGG CCTGCCGGAT CAGGTGGTAG ATGCCGACAA1260AGCCTGCGTG ATCGGTCATC ACCAACGGTG ACAGCAGCCG GTTGTGCACC AGCGCGAACG1320CCACCCCGGT CTCCGGGTCT GTCCAGCCGA TCGAGCCGCC CAAGCCCACA TGACCAAACC1380CCGGCATCAC GTTGCCGATC GGCATACCGT GATAGCCAAG ATGAAAATTT AAGGGCACCA1440ATAGATTTCG ATCCGGCAGA ACTTGCCGTC GGTTGCGGGT CAGGCCCGTG ACCAGCTCCC1500GCGACAAGAA CCGTATGCCG TCGATCTCGC CTCGTGCCG 1539(2)SEQ ID NO:33的信息(ⅰ)序列特征(A)长度851碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:33:CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT 60CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT 120CGCCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC 180CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC 240GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA 300GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC 360CTCCGACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT 420GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT 480CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT 540GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC 600GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC 660GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG 720GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG 780GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG 840GAAACAGTTA C 851(2)SEQ ID NO:34的信息
(ⅰ)序列特征(A)长度254碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:34:GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC 60CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG 120CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC 180CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC 240GCTTGGTCAA GATC 254(2)SEQ ID NO:35的信息(ⅰ)序列特征(A)长度1227碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:35:GATCCTGACC GAAGCGGCCG CCGCCAAGGC GAAGTCGCTG TTGGACCAGG AGGGACGGGA 60CGATCTGGCG CTGCGGATCG CGGTTCAGCC GGGGGGGTGC GCTGGATTGC GCTATAACCT 120TTTCTTCGAC GACCGGACGC TGGATGGTGA CCAAACCGCG GAGTTCGGTG GTGTCAGGTT 180GATCGTGGAC CGGATGAGCG CGCCGTATGT GGAAGGCGCG TCGATCGATT TCGTCGACAC 240TATTGAGAAG CAAGGTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG CGCGTGCGGG 300GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCGCAACACG TACGAGCACA 360CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATGCC TTGCACCTGA CCGCGTGGCG 420GGCCGCCGGC GGCAGGTGTC ACCTGCATGG TGAACAGCAC CTGGGCCTGA TATTGCGACC 480AGTACACGAT TTTGTCGATC GAGGTCACTT CGACCTGGGA GAACTGCTTG CGGAACGCGT 540CGCTGCTCAG CTTGGCCAAG GCCTGATCGG AGCGCTTGTC GCGCACGCCG TCGTGGATAC 600CGCACAGCGC ATTGCGAACG ATGGTGTCCA CATCGCGGTT CTCCAGCGCG TTGAGGTATC 660CCTGAATCGC GGTTTTGGCC GGTCCCTCCG AGAATGTGCC TGCCGTGTTG GCTCCGTTGG 720TGCGGACCCC GTATATGATC GCCGCCGTCA TAGCCGACAC CAGCGCGAGG GCTACCACAA 780TGCCGATCAG CAGCCGCTTG TGCCGTCGCT TCGGGTAGGA CACCTGCGGC GGCACGCCGG 840GATATGCGGC GGGCGGCAGC GCCGCGTCGT CTGCCGGTCC CGGGGCGAAG GCCGGTTCGG 900CGGCGCCGAG GTCGTGGGGG TAGTCCAGGG CTTGGGGTTC GTGGGATGAG GGCTCGGGGT 960ACGGCGCCGG TCCGTTGGTG CCGACACCGG GGTTCGGCGA GTGGGGACCG GGCATTGTGG1020TTCTCCTAGG GTGGTGGACG GGACCAGCTG CTAGGGCGAC AACCGCCCGT CGCGTCAGCC1080GGCAGCATCG GCAATCAGGT GAGCTCCCTA GGCAGGCTAG CGCAACAGCT GCCGTCAGCT1140CTCAACGCGA CGGGGCGGGC CGCGGCGCCG ATAATGTTGA AAGACTAGGC AACCTTAGGA1200ACGAAGGACG GAGATTTTGT GACGATC1227(2)SEQ ID NO:36的信息(ⅰ)序列特征(A)长度181碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:36:GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG 60GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG 120GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG 180G 181(2)SEQ ID NO:37的信息(ⅰ)序列特征(A)长度290碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:37:GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG 60GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG 120GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC GGAGGCAACG 180CCCCGGACGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG 240GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC290(2)SEQ ID NO:38的信息(ⅰ)序列特征(A)长度34碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:38:GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT 34(2)SEQ ID NO:39的信息(ⅰ)序列特征(A)长度155碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:39:GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC 60TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG 120TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG155(2)SEQ ID NO:40的信息(ⅰ)序列特征(A)长度53碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:40:ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG 53(2)SEQ ID NO:41的信息(ⅰ)序列特征(A)长度132碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ⅹⅰ)序列描述SEQ ID NO:41:GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG 60GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA 120AGGGCGGCAA CG 132(2)SEQ ID NO:42的信息(ⅰ)序列特征(A)长度132碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:42:GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA 60CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG 120GCANCGGCGG CA 132(2)SEQ ID NO:43的信息(ⅰ)序列特征(A)长度702碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:43:CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG 360CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG 660GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG702(2)SEQ ID NO:44的信息(ⅰ)序列特征(A)长度298碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:44:GAAGCCGCAG CGCTGTCGGG CGACGTGGCG GTCAAAGCGG CATCGCTCGG TGGCGGTGGA 60GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG 120CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG 180CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC 240AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG 298(2)SEQ ID NO:45的信息(ⅰ)序列特征(A)长度1058碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:45:CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG 60CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG 120GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC 180TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT 240TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC 300CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA 360AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG 420CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT 480TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA 540CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT 600ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG 660CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT 720ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG 780CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA 840CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG 900GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG 960GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA1020GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC1058(2)SEQ ID NO:46的信息(ⅰ)序列特征(A)长度327碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:46:CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT 60CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC 120AGTGGCGCGG CGCGGCGGGG ACGGCCGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG 180CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC 240AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC 300CCGCTAATAC GAAAAGAAAC GGAGCAA 327(2)SEQ ID NO:47的信息(ⅰ)序列特征(A)长度170碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:47:CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA 60CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT 120TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG170(2)SEQ ID NO:48的信息(ⅰ)序列特征(A)长度127碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:48:GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG 60CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG 120GGGCCGT 127(2)SEQ ID NO:49的信息(ⅰ)序列特征(A)长度81碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:49:CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA 60CGGCGGCTCC GGCCTCAACG G81(2)SEQ ID NO:50的信息(ⅰ)序列特征(A)长度149碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:50:GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG 60GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG 120GAAACGGTGG TGCCGGTGGG CTGATCTGG 149(2)SEQ ID NO:51的信息(ⅰ)序列特征(A)长度355碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:51:CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG 60ACGCGGNAAT CCAGGGCGGT CTGGCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT 120TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA 180CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA 240GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG 300ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG 355(2)SEQ ID NO:52的信息(ⅰ)序列特征(A)长度999碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:52:ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA 60CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG 120CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG 180CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG 240GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC 300GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC 360GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC 420GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC 480GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG 540CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG 600GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC 660GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG 720CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC 780GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG 840GGCGCGGCCA AGGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG 900GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC 960CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA999(2)SEQ ID NO:53的信息(ⅰ)序列特征(A)长度332氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:53:Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr1 5 10 15Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser20 25 30Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro35 40 45Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr50 55 60Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro65 70 75 80Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala85 90 95Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro100 105 110Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser115 120 125Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp130 135 140Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro145 150 155 160Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg165 170 175Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala180 185 190Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro195 200 205Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val210 215 220Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys225 230 235 240Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn245 250 255Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly260 265 270Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu275 280 285Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro290 295 300Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr305 310 315 320Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala325 330(2)SEQ ID NO:54的信息(ⅰ)序列特征(A)长度20氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:54:Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO:55的信息
(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:55:
Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO:56的信息(ⅰ)序列特征(A)长度19氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:56:
Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO:57的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:57:
Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO:58的信息(ⅰ)序列特征(A)长度14氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:58:
Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val
1 5 10(2)SEQ ID NO:59的信息(ⅰ)序列特征(A)长度13氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:59:
Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO:60的信息(ⅰ)序列特征(A)长度17氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:60:
Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ma Pro Pro1 5 10 15Ala(2)SEQ ID NO:61的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:61:
Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO:62的信息(ⅰ)序列特征(A)长度30氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性
(ⅹⅰ)序列描述SEQ ID NO:62:
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gin Thr Ser1 5 10 15Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp20 25 30(2)SEQ ID NO:63的信息(ⅰ)序列特征(A)长度24氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:63:
Gly Cys Gly Asp Arg Ser Gly Gly Asn Leu Asp Gin Ile Arg Leu Arg1 5 10 15Arg Asp Arg Ser Gly Gly Asn Leu20(2)SEQ ID NO:64的信息(ⅰ)序列特征(A)长度187氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:64:
Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys1 5 10 15Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala20 25 30Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala35 40 45Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro50 55 60Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln65 70 75 80Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala85 90 95Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Alg Arg100 105 110Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro115 120 125Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala130 135 140Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr145 150 155 160Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala165 170 175Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa180 185(2)SEQ ID NO:65的信息(ⅰ)序列特征(A)长度148氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:65:Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu1 5 10 15Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser20 25 30Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg35 40 45Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser50 55 60Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val65 70 75 80Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val85 90 95Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val100 105 110Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu115 120 125Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser130 135 140Thr Gly Gly Pro145(2)SEQ ID NO:66的信息(ⅰ)序列特征(A)长度230氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:66:Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr1 5 10 15Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln20 25 30Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser35 40 45Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn50 55 60Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu65 70 75 80Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu85 90 95Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser100 105 110Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp115 120 125Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu130 135 140Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn145 150 155 160Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln165 170 175Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr180 185 190Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile195 200 205Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val210 215 220Phe Pro Ile Val Ala Arg225 230(2)SEQ ID NO:67的信息(ⅰ)序列特征(A)长度132氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:67:Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe1 5 10 15Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser20 25 30Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly35 40 45Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val50 55 60Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val65 70 75 80Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala85 90 95Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp100 105 110Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu115 120 125Gly Pro Pro Ala130(2)SEQ ID NO:68的信息(ⅰ)序列特征(A)长度100氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:68:Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala1 5 10 15Ala Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro20 25 30Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly35 40 45Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa50 55 60Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val65 70 75 80Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly85 90 95Ser Glu Arg Lys100(2)SEQ ID NO:69的信息(ⅰ)序列特征(A)长度163氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:69:Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr1 5 10 15Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu20 25 30Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp35 40 45Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly50 55 60Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu65 70 75 80Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg85 90 95Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro100 105 110Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly115 120 125Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg130 135 140His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg145 150 155 160Asp Arg Arg(2)SEQ ID NO:70的信息(ⅰ)序列特征(A)长度344氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:70:Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly1 5 10 15Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg20 25 30Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr35 40 45Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro50 55 60Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg65 70 75 80Cys Pro Trp Cys Val Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly85 90 95Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala100 105 110Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr115 120 125Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr130 135 140Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val145 150 155 160Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu165 170 175Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu180 185 190His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro195 200 205Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe210 215 220Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro225 230 235 240Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro245 250 255Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro260 265 270Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala275 280 285Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu290 295 300Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr305 310 315 320Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln325 330 335Val Ser Arg Gln Asn Pro Thr Gly340(2)SEQ ID NO:71的信息(ⅰ)序列特征(A)长度485氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:71:Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala1 5 10 15Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu20 25 30Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile35 40 45Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu50 55 60Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu65 70 75 80Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser85 90 95Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu100 105 110Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala115 120 125Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met130 135 140Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro145 150 155 160Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala165 170 175Glu Leu Gln Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu180 185 190Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly195 200 205Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser210 215 220Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser225 230 235 240His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser245 250 255Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu260 265 270Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr275 280 285Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile290 295 300Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp305 310 315 320Thr Ile Ash Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala325 330 335Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn340 345 350Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp355 360 365Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp370 375 380Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala385 390 395 400Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu405 410 415Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg420 425 430Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala435 440 445Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp450 455 460Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser465 470 475 480Val Ala Pro Thr Gly485(2)SEQ ID NO:72的信息(ⅰ)序列特征(A)长度267氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:72:Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu1 5 10 15Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val20 25 30Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala35 40 45Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His50 55 60Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu65 70 75 80Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro85 90 95Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp100 105 110Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro115 120 125Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn130 135 140Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala145 150 155 160Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp165 170 175Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu180 185 190Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg195 200 205Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val210 215 220Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn225 230 235 240Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln245 250 255Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly260 265(2)SEQ ID NO:73的信息(ⅰ)序列特征(A)长度97氨基酸
(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:73:Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val1 5 10 15Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala20 25 30Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr35 40 45Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala50 55 60Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp65 70 75 80Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu85 90 95Gln(2)SEQ ID NO:74的信息(ⅰ)序列特征(A)长度364氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:74:Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala1 5 10 15Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser20 25 30Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser35 40 45Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg50 55 60Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala65 70 75 80Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp85 90 95Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg100 105 110Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala115 120 125Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro130 135 140Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro145 150 155 160Gln Ile Gln Ala Leu Ash Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile165 170 175Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln180 185 190Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser195 200 205Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly210 215 220Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Asn Glu225 230 235 240Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr245 250 255Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys260 265 270Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu275 280 285Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile290 295 300Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr305 310 315 320Thr Gly Thr Ala Val Arg Ala Phe Met Gln Ala Ala Ile Gly Pro Gly325 330 335Gln Glu Gly Leu Asp Gln Tyr Gly Ser lle Pro Leu Pro Lys Ser Phe340 345 350Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser
355 360(2)SEQ ID NO:75的信息(ⅰ)序列特征(A)长度309氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:75:Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp1 5 10 15Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val20 25 30Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro35 40 45Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser50 55 60Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg65 70 75 80Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro85 90 95Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg100 105 110Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp115 120 125Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val130 135 140Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg145 150 155 160Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly165 170 175Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala180 185 190Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val195 200 205Phe Arg Pro Ile Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg
210 215 220Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro225 230 235 240Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg245 250 255Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His260 265 270His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr275 280 285Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg290 295 300Asn Arg Pro Arg Arg305(2)SEQ ID NO:76的信息(ⅰ)序列特征(A)长度580氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:76:Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly1 5 10 15Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys20 25 30Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala35 40 45Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys50 55 60Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr65 70 75 80Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser85 90 95Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His100 105 110Ala Ser Pro Arg Met Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln
115 120 125Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro130 135 140Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr145 150 155 160Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln165 170 175Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro180 185 190Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met195 200 205Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr210 215 220Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val225 230 235 240Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala245 250 255Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val260 265 270Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr275 280 285Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala290 295 300Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys305 310 315 320Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp325 330 335Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp340 345 350Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser355 360 365Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile370 375 380Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser385 390 395 400Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn405 410 415Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn420 425 430Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn435 440 445Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly450 455 460Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile465 470 475 480Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly485 490 495Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu500 505 510Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val515 520 525Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu530 535 540Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr545 550 555 560Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly565 570 575Lys Ala Glu Gln580(2)SEQ ID NO:77的信息(ⅰ)序列特征(A)长度233氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:77:Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu1 5 10 15Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro20 25 30Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro35 40 45Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu50 55 60Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu65 70 75 80Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala85 90 95Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg100 105 110Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn115 120 125Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala130 135 140Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln145 150 155 160Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr165 170 175Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala180 185 190Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val195 200 205Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser210 215 220Lys Trp Asn Glu Pro Val Asn Val Asp225 230(2)SEQ ID NO:78的信息(ⅰ)序列特征(A)长度66氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:78:Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala1 5 10 15Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val20 25 30Ala Arg Val Ile Glu Gln Asp Met Ala Val Asp Ser Ala Gly Lys Ile35 40 45Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln50 55 60Pro Arg65(2)SEQ ID NO:79的信息(ⅰ)序列特征(A)长度69氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:79:Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser1 5 10 15Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala20 25 30Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro35 40 45Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro50 55 60Ser Pro Pro Leu Pro65(2)SEQ ID NO:80的信息(ⅰ)序列特征(A)长度355氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:80:Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser1 5 10 15Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala
20 25 30Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu35 40 45Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val50 55 60Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr65 70 75 80Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val85 90 95Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln100 105 110Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala115 120 125Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly130 135 140Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly145 150 155 160Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu165 170 175Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr180 185 190Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser195 200 205Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr210 215 220Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala225 230 235 240Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly245 250 255Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu260 265 270Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val275 280 285Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile290 295 300Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp305 310 315 320Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln325 330 335Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly340 345 350Pro Pro Ala355(2)SEQ ID NO:81的信息(ⅰ)序列特征(A)长度205氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:81:Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr1 5 10 15Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala20 25 30Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys35 40 45Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala50 55 60Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly65 70 75 80Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp85 90 95Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val100 105 110Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn115 120 125Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys130 135 140Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly145 150 155 160Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser165 170 175His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln180 185 190Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp195 200 205(2)SEQ ID NO:82的信息(ⅰ)序列特征(A)长度286氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:82:Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val1 5 10 15Leu Gly Ala Thr Ala Gly Arg Thr Thr Leu Thr Gly Glu Gly Leu Gln20 25 30His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val35 40 45Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu50 55 60Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe65 70 75 80Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu85 90 95Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala100 105 110Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val115 120 125Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp130 135 140Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn145 150 155 160Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg165 170 175Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly180 185 190Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile195 200 205Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe210 215 220Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp225 230 235 240Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg245 250 255Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln260 265 270Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys275 280 285(2)SEQ ID NO:83的信息(ⅰ)序列特征(A)长度173氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:83:Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr1 5 10 15Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp20 25 30Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg35 40 45Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg50 55 60Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro65 70 75 80Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp85 90 95Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu100 105 110Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val115 120 125Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn130 135 140Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro145 150 155 160Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu165 170(2)SEQ ID NO:84的信息(ⅰ)序列特征(A)长度107氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:84:Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile1 5 10 15Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly20 25 30Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro35 40 45Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa50 55 60Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp65 70 75 80Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Glu Gly Gly Ile85 90 95Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln100 105(2)SEQ ID NO:85的信息(ⅰ)序列特征(A)长度125氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:85:Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn1 5 10 15Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr20 25 30Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly35 40 45Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr50 55 60Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr65 70 75 80Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu85 90 95Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr100 105 110Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg115 120 125(2)SEQ ID NO:86的信息(ⅰ)序列特征(A)长度117氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:86:Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val1 5 10 15Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala20 25 30Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu35 40 45Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala50 55 60Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp65 70 75 80Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu85 90 95Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa100 105 110Arg Ser Ser Xaa Gly115(2)SEQ ID NO:87的信息(ⅰ)序列特征(A)长度103氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:87:Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu1 5 10 15Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln20 25 30Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp35 40 45Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe50 55 60His Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro65 70 75 80Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro85 90 95Pro Ala Ala Gly Gly Gly Ala100(2)SEQ ID NO:88的信息(ⅰ)序列特征(A)长度88氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:88:Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly1 5 10 15Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His
20 25 30Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala35 40 45Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly50 55 60Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly65 70 75 80Asp Glu Leu Lys Gly Val Thr Ser85(2)SEQ ID NO:89的信息(ⅰ)序列特征(A)长度95氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:89:Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile1 5 10 15Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly20 25 30Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala35 40 45Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu50 55 60Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg65 70 75 80Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe85 90 95(2)SEQ ID NO:90的信息(ⅰ)序列特征(A)长度166氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:90:Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn1 5 10 15Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val20 25 30Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln35 40 45Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala50 55 60Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa65 70 75 80Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly85 90 95Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser100 105 110Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro115 120 125Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp130 135 140Gln Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr145 150 155 160Leu Thr Leu Gln Gly Asp165(2)SEQ ID NO:91的信息(ⅰ)序列特征(A)长度5氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:9l:
Arg Ala Glu Arg Met1 5(2)SEQ ID NO:92的信息(ⅰ)序列特征(A)长度263氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:92:Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala1 5 10 15Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr20 25 30Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu35 40 45Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn50 55 60Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe65 70 75 80Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe85 90 95Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala100 105 110Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met115 120 125Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly130 135 140Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro145 150 155 160His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met165 170 175Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met180 185 190Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala195 200 205Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly210 215 220Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala225 230 235 240Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly245 250 255
Arg Arg Asn Gly Gly Pro Ala260(2)SEQ ID NO:93的信息(ⅰ)序列特征(A)长度303氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:93:Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala1 5 10 15Gly Ser Tyr Gly Gly ValThr Pro Ser Phe Ala His Ala Asp Glu Gly20 25 30Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly35 40 45Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr50 55 60Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro65 70 75 80Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val85 90 95Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu100 105 110Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr115 120 125Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln130 135 140Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr145 150 155 160Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg165 170 175Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly180 185 190Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln195 200 205Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser210 215 220Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala225 230 235 240Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser245 250 255Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser260 265 270Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn275 280 285Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val290 295 300(2)SEQ ID NO:94的信息(ⅰ)序列特征(A)长度507碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:94:ATGAAGATGG TGAAATCGAT CGCCGCAGGT CTGACCGCCG CGGCTGCAAT CGGCGCCGCT 60GCGGCCGGTG TGACTTCGAT CATGGCTGGC GGCCCGGTCG TATACCAGAT GCAGCCGGTC 120GTCTTCGGCG CGCCACTGCC GTTGGACCCG GCATCCGCCC CTGACGTCCC GACCGCCGCC 180CAGTTGACCA GCCTGCTCAA CAGCCTCGCC GATCCCAACG TGTCGTTTGC GAACAAGGGC 240AGTCTGGTCG AGGGCGGCAT CGGGGGCACC GAGGCGCGCA TCGCCGACCA CAAGCTGAAG 300AAGGCCGCCG AGCACGGGGA TCTGCCGCTG TCGTTCAGCG TGACGAACAT CCAGCCGGCG 360GCCGCCGGTT CGGCCACCGC CGACGTTTCC GTCTCGGGTC CGAAGCTCTC GTCGCCGGTC 420ACGCAGAACG TCACGTTCGT GAATCAAGGC GGCTGGATGC TGTCACGCGC ATCGGCGATG 480GAGTTGCTGC AGGCCGCAGG GAACTGA 507(2)SEQ ID NO:95的信息(ⅰ)序列特征(A)长度168氨基酸(B)类型氨基酸
(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:95:Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala1 5 10 15Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro20 25 30Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu35 40 45Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser50 55 60Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly65 70 75 80Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp85 90 95His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe100 105 110Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp115 120 125Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val130 135 140Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met145 150 155 160Glu Leu Leu Gln Ala Ala Gly Asn165(2)SEQ ID NO:96的信息(ⅰ)序列特征(A)长度500碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:96:CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT 60CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG 120GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC 180CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC 240ACAGTACATC GGCCTTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC 300GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA 360ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT 420CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG 480GCCGCCACCG CGGTGGAGCT 500(2)SEQ ID NO:97的信息(ⅰ)序列特征(A)长度96氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:97:Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro1 5 10 15Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala20 25 30Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser35 40 45Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro50 55 60Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala65 70 75 80Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr85 90 95(2)SEQ ID NO:98的信息(ⅰ)序列特征(A)长度154碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:98:ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA 60AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA 120GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC 154(2)SEQ ID NO:99的信息(ⅰ)序列特征(A)长度51氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:99:Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser1 5 10 15Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly20 25 30Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser35 40 45Glu Ala Tyr50(2)SEQ ID NO:100的信息(ⅰ)序列特征(A)长度282碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:100:CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT 60TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC 120GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA 180GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG 240ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG282(2)SEQ ID NO:101的信息(ⅰ)序列特征(A)长度3058碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:101:GATCGTACCC GTGCGAGTGC TCGGGCCGTT TGAGGATGGA GTGCACGTGT CTTTCGTGAT 60GGCATACCCA GAGATGTTGG CGGCGGCGGC TGACACCCTG CAGAGCATCG GTGCTACCAC 120TGTGGCTAGC AATGCCGCTG CGGCGGCCCC GACGACTGGG GTGGTGCCCC CCGCTGCCGA 180TGAGGTGTCG GCGCTGACTG CGGCGCACTT CGCCGCACAT GCGGCGATGT ATCAGTCCGT 240GAGCGCTCGG GCTGCTGCGA TTCATGACCA GTTCGTGGCC ACCCTTGCCA GCAGCGCCAG 300CTCGTATGCG GCCACTGAAG TCGCCAATGC GGCGGCGGCC AGCTAAGCCA GGAACAGTCG 360GCACGAGAAA CCACGAGAAA TAGGGACACG TAATGGTGGA TTTCGGGGCG TTACCACCGG 420AGATCAACTC CGCGAGGATG TACGCCGGCC CGGGTTCGGC CTCGCTGGTG GCCGCGGCTC 480AGATGTGGGA CAGCGTGGCG AGTGACCTGT TTTCGGCCGC GTCGGCGTTT CAGTCGGTGG 540TCTGGGGTCT GACGGTGGGG TCGTGGATAG GTTCGTCGGC GGGTCTGATG GTGGCGGCGG 600CCTCGCCGTA TGTGGCGTGG ATGAGCGTCA CCGCGGGGCA GGCCGAGCTG ACCGCCGCCC 660AGGTCCGGGT TGCTGCGGCG GCCTACGAGA CGGCGTATGG GCTGACGGTG CCCCCGCCGG 720TGATCGCCGA GAACCGTGCT GAACTGATGA TTCTGATAGC GACCAACCTC TTGGGGCAAA 780ACACCCCGGC GATCGCGGTC AACGAGGCCG AATACGGCGA GATGTGGGCC CAAGACGCCG 840CCGCGATGTT TGGCTACGCC GCGGCGACGG CGACGGCGAC GGCGACGTTG CTGCCGTTCG 900AGGAGGCGCC GGAGATGACC AGCGCGGGTG GGCTCCTCGA GCAGGCCGCC GCGGTCGAGG 960AGGCCTCCGA CACCGCCGCG GCGAACCAGT TGATGAACAA TGTGCCCCAG GCGCTGCAAC1020AGCTGGCCCA GCCCACGCAG GGCACCACGC CTTCTTCCAA GCTGGGTGGC CTGTGGAAGA1080CGGTCTCGCC GCATCGGTCG CCGATCAGCA ACATGGTGTC GATGGCCAAC AACCACATGT1140CGATGACCAA CTCGGGTGTG TCGATGACCA ACACCTTGAG CTCGATGTTG AAGGGCTTTG1200CTCCGGCGGC GGCCGCCCAG GCCGTGCAAA CCGCGGCGCA AAACGGGGTC CGGGCGATGA1260GCTCGCTGGG CAGCTCGCTG GGTTCTTCGG GTCTGGGCGG TGGGGTGGCC GCCAACTTGG1320GTCGGGCGGC CTCGGTCGGT TCGTTGTCGG TGCCGCAGGC CTGGGCCGCG GCCAACCAGG1380CAGTCACCCC GGCGGCGCGG GCGCTGCCGC TGACCAGCCT GACCAGCGCC GCGGAAAGAG1440GGCCCGGGCA GATGCTGGGC GGGCTGCCGG TGGGGCAGAT GGGCGCCAGG GCCGGTGGTG1500GGCTCAGTGG TGTGCTGCGT GTTCCGCCGC GACCCTATGT GATGCCGCAT TCTCCGGCGG1560CCGGCTAGGA GAGGGGGCGC AGACTGTCGT TATTTGACCA GTGATCGGCG GTCTCGGTGT1620TTCCGCGGCC GGCTATGACA ACAGTCAATG TGCATGACAA GTTACAGGTA TTAGGTCCAG1680GTTCAACAAG GAGACAGGCA ACATGGCCTC ACGTTTTATG ACGGATCCGC ACGCGATGCG1740GGACATGGCG GGCCGTTTTG AGGTGCACGC CCAGACGGTG GAGGACGAGG CTCGCCGGAT1800GTGGGCGTCC GCGCAAAACA TTTCCGGTGC GGGCTGGAGT GGCATGGCCG AGGCGACCTC1860GCTAGACACC ATGGCCCAGA TGAATCAGGC GTTTCGCAAC ATCGTGAACA TGCTGCACGG1920GGTGCGTGAC GGGCTGGTTC GCGACGCCAA CAACTACGAG CAGCAAGAGC AGGCCTCCCA1980GCAGATCCTC AGCAGCTAAC GTCAGCCGCT GCAGCACAAT ACTTTTACAA GCGAAGGAGA2040ACAGGTTCGA TGACCATCAA CTATCAATTC GGGGATGTCG ACGCTCACGG CGCCATGATC2100CGCGCTCAGG CCGGGTTGCT GGAGGCCGAG CATCAGGCCA TCATTCGTGA TGTGTTGACC2160GCGAGTGACT TTTGGGGCGG CGCCGGTTCG GCGGCCTGCC AGGGGTTCAT TACCCAGTTG2220GGCCGTAACT TCCAGGTGAT CTACGAGCAG GCCAACGCCC ACGGGCAGAA GGTGCAGGCT2280GCCGGCAACA ACATGGCGCA AACCGACAGC GCCGTCGGCT CCAGCTGGGC CTGACACCAG2340GCCAAGGCCA GGGACGTGGT GTACGAGTGA AGTTCCTCGC GTGATCCTTC GGGTGGCAGT2400CTAAGTGGTC AGTGCTGGGG TGTTGGTGGT TTGCTGCTTG GCGGGTTCTT CGGTGCTGGT2460CAGTGCTGCT CGGGCTCGGG TGAGGACCTC GAGGCCCAGG TAGCGCCGTC CTTCGATCCA2520TTCGTCGTGT TGTTCGGCGA GGACGGCTCC GACGAGGCGG ATGATCGAGG CGCGGTCGGG2580GAAGATGCCC ACGACGTCGG TTCGGCGTCG TACCTCTCGG TTGAGGCGTT CCTGGGGGTT2640GTTGGACCAG ATTTGGCGCC AGATCTGCTT GGGGAAGGCG GTGAACGCCA GCAGGTCGGT2700GCGGGCGGTG TCGAGGTGCT CGGCCACCGC GGGGAGTTTG TCGGTCAGAG CGTCGAGTAC2760CCGATCATAT TGGGCAACAA CTGATTCGGC GTCGGGCTGG TCGTAGATGG AGTGCAGCAG2820GGTGCGCACC CACGGCCAGG AGGGCTTCGG GGTGGCTGCC ATCAGATTGG CTGCGTAGTG2880GGTTCTGCAG CGCTGCCAGG CCGCTGCGGG CAGGGTGGCG CCGATCGCGG CCACCAGGCC2940GGCGTGGGCG TCGCTGGTGA CCAGCGCGAC CCCGGACAGG CCGCGGGCGA CCAGGTCGCG3000GAAGAACGCC AGCCAGCCGG CCCCGTCCTC GGCGGAGGTG ACCTGGATGC CCAGGATC 3058(2)SEQ ID NO:102的信息(ⅰ)序列特征(A)长度391氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:102:Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala145 150 155 160Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr165 170 175Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu210 215 220Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn225 230 235 240Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala275 280 285Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly290 295 300Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val305 310 315 320Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg325 330 335Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly340 345 350Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly355 360 365Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met370 375 380Pro His Ser Pro Ala Ala Gly385 390(2)SEQ ID NO:103的信息(ⅰ)序列特征(A)长度1725碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:103:GACGTCAGCA CCCGCCGTGC AGGGCTGGAG CGTGGTCGGT TTTGATCTGC GGTCAAGGTG 60ACGTCCCTCG GCGTGTCGCC GGCGTGGATG CAGACTCGAT GCCGCTCTTT AGTGCAACTA 120ATTTCGTTGA AGTGCCTGCG AGGTATAGGA CTTCACGATT GGTTAATGTA GCGTTCACCC 180CGTGTTGGGG TCGATTTGGC CGGACCAGTC GTCACCAACG CTTGGCGTGC GCGCCAGGCG 240GGCGATCAGA TCGCTTGACT ACCAATCAAT CTTGAGCTCC CGGGCCGATG CTCGGGCTAA 300ATGAGGAGGA GCACGCGTGT CTTTCACTGC GCAACCGGAG ATGTTGGCGG CCGCGGCTGG 360CGAACTTCGT TCCCTGGGGG CAACGCTGAA GGCTAGCAAT GCCGCCGCAG CCGTGCCGAC 420GACTGGGGTG GTGCCCCCGG CTGCCGACGA GGTGTCGCTG CTGCTTGCCA CACAATTCCG 480TACGCATGCG GCGACGTATC AGACGGCCAG CGCCAAGGCC GCGGTGATCC ATGAGCAGTT 540TGTGACCACG CTGGCCACCA GCGCTAGTTC ATATGCGGAC ACCGAGGCCG CCAACGCTGT 600GGTCACCGGC TAGCTGACCT GACGGTATTC GAGCGGAAGG ATTATCGAAG TGGTGGATTT 660CGGGGCGTTA CCACCGGAGA TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC 720GCTGGTGGCC GCCGCGAAGA TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC 780GGCGTTTCAG TCGGTGGTCT GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG 840TCTGATGGCG GCGGCGGCCT CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC 900CCAGCTGACC GCCGCCCAGG TCCGGGTTGC TGCGGCGGCC TACGAGACAG CGTATAGGCT 960GACGGTGCCC CCGCCGGTGA TCGCCGAGAA CCGTACCGAA CTGATGACGC TGACCGCGAC1020CAACCTCTTG GGGCAAAACA CGCCGGCGAT CGAGGCCAAT CAGGCCGCAT ACAGCCAGAT1080GTGGGGCCAA GACGCGGAGG CGATGTATGG CTACGCCGCC ACGGCGGCGA CGGCGACCGA1140GGCGTTGCTG CCGTTCGAGG ACGCCCCACT GATCACCAAC CCCGGCGGGC TCCTTGAGCA1200GGCCGTCGCG GTCGAGGAGG CCATCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT1260GCCCCAAGCG CTGCAACAGC TGGCCCAGCC AGCGCAGGGC GTCGTACCTT CTTCCAAGCT1320GGGTGGGCTG TGGACGGCGG TCTCGCCGCA TCTGTCGCCG CTCAGCAACG TCAGTTCGAT1380AGCCAACAAC CACATGTCGA TGATGGGCAC GGGTGTGTCG ATGACCAACA CCTTGCACTC1440GATGTTGAAG GGCTTAGCTC CGGCGGCGGC TCAGGCCGTG GAAACCGCGG CGGAAAACGG1500GGTCTGGGCG ATGAGCTCGC TGGGCAGCCA GCTGGGTTCG TCGCTGGGTT CTTCGGGTCT1560GGGCGCTGGG GTGGCCGCCA ACTTGGGTCG GGCGGCCTCG GTCGGTTCGT TGTCGGTGCC1620GCCAGCATGG GCCGCGGCCA ACCAGGCGGT CACCCCGGCG GCGCGGGCGC TGCCGCTGAC1680CAGCCTGACC AGCGCCGCCC AAACCGCCCC CGGACACATG CTGGG1725(2)SEQ ID NO:104的信息(ⅰ)序列特征(A)长度359氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:104:Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Ala Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Gln Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Arg Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Thr Glu Leu Met Thr Leu Thr Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Glu Ala Asn Gln Ala Ala Tyr Ser Gln Met130 135 140Trp Gly Gln Asp Ala Glu Ala Met Tyr Gly Tyr Ala Ala Thr Ala Ala145 150 155 160Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr165 170 175Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Clu Glu Ala Ile180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Ala Gln Gly Val Val Pro Ser Ser Lys Leu210 215 220Gly Gly Leu Trp Thr Ala Val Ser Pro His Leu Ser Pro Leu Ser Asn225 230 235 240Val Ser Ser Ile Ala Asn Asn His Met Ser Met Met Gly Thr Gly Val245 250 255Ser Met Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala260 265 270Ala Ala Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met275 280 285Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu290 295 300Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser305 310 315 320Leu Ser Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro325 330 335Ala Ala Arg Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Gln Thr340 345 350Ala Pro Gly His Met Leu Gly355(2)SEQ ID NO:105的信息(ⅰ)序列特征(A)长度3027碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:105:AGTTCAGTCG AGAATGATAC TGACGGGCTG TATCCACGAT GGCTGAGACA ACCGAACCAC 60CGTCGGACGC GGGGACATCG CAAGCCGACG CGATGGCGTT GGCCGCCGAA GCCGAAGCCG 120CCGAAGCCGA AGCGCTGGCC GCCGCGGCGC GGGCCCGTGC CCGTGCCGCC CGGTTGAAGC 180GTGAGGCGCT GGCGATGGCC CCAGCCGAGG ACGAGAACGT CCCCGAGGAT ATGCAGACTG 240GGAAGACGCC GAAGACTATG ACGACTATGA CGACTATGAG GCCGCAGACC AGGAGGCCGC 300ACGGTCGGCA TCCTGGCGAC GGCGGTTGCG GGTGCGGTTA CCAAGACTGT CCACGATTGC 360CATGGCGGCC GCAGTCGTCA TCATCTGCGG CTTCACCGGG CTCAGCGGAT ACATTGTGTG 420GCAACACCAT GAGGCCACCG AACGCCAGCA GCGCGCCGCG GCGTTCGCCG CCGGAGCCAA 480GCAAGGTGTC ATCAACATGA CCTCGCTGGA CTTCAACAAG GCCAAAGAAG ACGTCGCGCG 540TGTGATCGAC AGCTCCACCG GCGAATTCAG GGATGACTTC CAGCAGCGGG CAGCCGATTT 600CACCAAGGTT GTCGAACAGT CCAAAGTGGT CACCGAAGGC ACGGTGAACG CGACAGCCGT 660CGAATCCATG AACGAGCATT CCGCCGTGGT GCTCGTCGCG GCGACTTCAC GGGTCACCAA 720TTCCGCTGGG GCGAAAGACG AACCACGTGC GTGGCGGCTC AAAGTGACCG TGACCGAAGA 780GGGGGGACAG TACAAGATGT CGAAAGTTGA GTTCGTACCG TGACCGATGA CGTACGCGAC 840GTCAACACCG AAACCACTGA CGCCACCGAA GTCGCTGAGA TCGACTCAGC CGCAGGCGAA 900GCCGGTGATT CGGCGACCGA GGCATTTGAC ACCGACTCTG CAACGGAATC TACCGCGCAG 960AAGGGTCAGC GGCACCGTGA CCTGTGGCGA ATGCAGGTTA CCTTGAAACC CGTTCCGGTG1020ATTCTCATCC TGCTCATGTT GATCTCTGGG GGCGCGACGG GATGGCTATA CCTTGAGCAA1080TACGACCCGA TCAGCAGACG GACTCCGGCG CCGCCCGTGC TGCCGTCGCC GCGGCGTCTG1140ACGGGACAAT CGCGCTGTTG TGTATTCACC CGACACGTCG ACCAAGACTT CGCTACCGCC1200AGGTCGCACC TCGCCGGCGA TTTCCTGTCC TATACGACCA GTTCACGCAG CAGATCGTGG1260CTCCGGCGGC CAAACAGAAG TCACTGAAAA CCACCGCCAA GGTGGTGCGC GCGGCCGTGT1320CGGAGCTACA TCCGGATTCG GCCGTCGTTC TGGTTTTTGT CGACCAGAGC ACTACCAGTA1380AGGACAGCCC CAATCCGTCG ATGGCGGCCA GCAGCGTGAT GGTGACCCTA GCCAAGGTCG1440ACGGCAATTG GCTGATCACC AAGTTCACCC CGGTTTAGGT TGCCGTAGGC GGTCGCCAAG1500TCTGACGGGG GCGCGGGTGG CTGCTCGTGC GAGATACCGG CCGTTCTCCG GACAATCACG1560GCCCGACCTC AAACAGATCT CGGCCGCTGT CTAATCGGCC GGGTTATTTA AGATTAGTTG1620CCACTGTATT TACCTGATGT TCAGATTGTT CAGCTGGATT TAGCTTCGCG GCAGGGCGGC1680TGGTGCACTT TGCATCTGGG GTTGTGACTA CTTGAGAGAA TTTGACCTGT TGCCGACGTT1740GTTTGCTGTC CATCATTGGT GCTAGTTATG GCCGAGCGGA AGGATTATCG AAGTGGTGGA1800CTTCGGGGCG TTACCACCGG AGATCAACTC CGCGAGGATG TACGCCGGCC CGGGTTCGGC1860CTCGCTGGTG GCCGCCGCGA AGATGTGGGA CAGCGTGGCG AGTGACCTGT TTTCGGCCGC1920GTCGGCGTTT CAGTCGGTGG TCTGGGGTCT GACGACGGGA TCGTGGATAG GTTCGTCGGC1980GGGTCTGATG GTGGCGGCGG CCTCGCCGTA TGTGGCGTGG ATGAGCGTCA CCGCGGGGCA2040GGCCGAGCTG ACCGCCGCCC AGGTCCGGGT TGCTGCGGCG GCCTACGAGA CGGCGTATGG2100GCTGACGGTG CCCCCGCCGG TGATCGCCGA GAACCGTGCT GAACTGATGA TTCTGATAGC2160GACCAACCTC TTGGGGCAAA ACACCCCGGC GATCGCGGTC AACGAGGCCG AATACGGGGA2220GATGTGGGCC CAAGACGCCG CCGCGATGTT TGGCTACGCC GCCACGGCGG CGACGGCGAC2280CGAGGCGTTG CTGCCGTrCG AGGACGCCCC ACTGATCACC AACCCCGGCG GGCTCCTTGA2340GCAGGCCGTC GCGGTCGAGG AGGCCATCGA CACCGCCGCG GCGAACCAGT TGATGAACAA2400TGTGCCCCAA GCGCTGCAAC AACTGGCCCA GCCCACGAAA AGCATCTGGC CGTTCGACCA2460ACTGAGTGAA CTCTGGAAAG CCATCTCGCC GCATCTGTCG CCGCTCAGCA ACATCGTGTC2520GATGCTCAAC AACCACGTGT CGATGACCAA CTCGGGTGTG TCGATGGCCA GCACCTTGCA2580CTCAATGTTG AAGGGCTTTG CTCCGGCGGC GGCTCAGGCC GTGGAAACCG CGGCGCAAAA2640CGGGGTCCAG GCGATGAGCT CGCTGGGCAG CCAGCTGGGT TCGTCGCTGG GTTCTTCGGG2700TCTGGGCGCT GGGGTGGCCG CCAACTTGGG TCGGGCGGCC TCGGTCGGTT CGTTGTCGGT2760GCCGCAGGCC TGGGCCGCGG CCAACCAGGC GGTCACCCCG GCGGCGCGGG CGCTGCCGCT2820GACCAGCCTG ACCAGCGCCG CCCAAACCGC CCCCGGACAC ATGCTGGGCG GGCTACCGCT2880GGGGCAACTG ACCAATAGCG GCGGCGGGTT CGGCGGGGTT AGCAATGCGT TGCGGATGCC2940GCCGCGGGCG TACGTAATGC CCCGTGTGCC CGCCGCCGGG TAACGCCGAT CCGCACGCAA3000TGCGGGCCCT CTATGCGGGC AGCGATC3027(2)SEQ ID NO:106的信息(ⅰ)序列特征(A)长度396氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:106:Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met1 5 10 15Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp20 25 30Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser35 40 45Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly50 55 60Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr65 70 75 80Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala85 90 95Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala100 105 110Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly115 120 125Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met130 135 140Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala145 150 155 160Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr165 170 175Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile180 185 190Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu195 200 205Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu210 215 220Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn225 230 235 240Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val245 250 255Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala260 265 270Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met275 280 285Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu290 295 300Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser305 310 315 320Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro325 330 335Ala Ala Arg Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Gln Thr340 345 350Ala Pro Gly His Met Leu Gly Gly Leu Pro Leu Gly Gln Leu Thr Asn355 360 365Ser Gly Gly Gly Phe Gly Gly Val Ser Asn Ala Leu Arg Met Pro Pro370 375 380Arg Ala Tyr Val Met Pro Arg Val Pro Ala Ala Gly385 390 395(2)SEQ ID NO:107的信息(ⅰ)序列特征(A)长度1616碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:107:CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGTAA ATACCGCACG 60GCTGATGGCC GGCGCGGGTC CGGCTCCAAT GCTTGCGGCG GCCGCGGGAT GGCAGACGCT 120TTCGGCGGCT CTGGACGCTC AGGCCGTCGA GTTGACCGCG CGCCTGAACT CTCTGGGAGA 180AGCCTGGACT GGAGGTGGCA GCGACAAGGC GCTTGCGGCT GCAACGCCGA TGGTGGTCTG 240GCTACAAACC GCGTCAACAC AGGCCAAGAC CCGTGCGATG CAGGCGACGG CGCAAGCCGC 300GGCATACACC CAGGCCATGG CCACGACGCC GTCGCTGCCG GAGATCGCCG CCAACCACAT 360CACCCAGGCC GTCCTTACGG CCACCAACTT CTTCGGTATC AACACGATCC CGATCGCGTT 420GACCGAGATG GATTATTTCA TCCGTATGTG GAACCAGGCA GCCCTGGCAA TGGAGGTCTA 480CCAGGCCGAG ACCGCGGTTA ACACGCTTTT CGAGAAGCTC GAGCCGATGG CGTCGATCCT 540TGATCCCGGC GCGAGCCAGA GCACGACGAA CCCGATCTTC GGAATGCCCT CCCCTGGCAG 600CTCAACACCG GTTGGCCAGT TGCCGCCGGC GGCTACCCAG ACCCTCGGCC AACTGGGTGA 660GATGAGCGGC CCGATGCAGC AGCTGACCCA GCCGCTGCAG CAGGTGACGT CGTTGTTCAG 720CCAGGTGGGC GGCACCGGCG GCGGCAACCC AGCCGACGAG GAAGCCGCGC AGATGGGCCT 780GCTCGGCACC AGTCCGCTGT CGAACCATCC GCTGGCTGGT GGATCAGGCC CCAGCGCGGG 840CGCGGGCCTG CTGCGCGCGG AGTCGCTACC TGGCGCAGGT GGGTCGTTGA CCCGCACGCC 900GCTGATGTCT CAGCTGATCG AAAAGCCGGT TGCCCCCTCG GTGATGCCGG CGGCTGCTGC 960CGGATCGTCG GCGACGGGTG GCGCCGCTCC GGTGGGTGCG GGAGCGATGG GCCAGGGTGC1020GCAATCCGGC GGCTCCACCA GGCCGGGTCT GGTCGCGCCG GCACCGCTCG CGCAGGAGCG1080TGAAGAAGAC GACGAGGACG ACTGGGACGA AGAGGACGAC TGGTGAGCTC CCGTAATGAC1140AACAGACTTC CCGGCCACCC GGGCCGGAAG ACTTGCCAAC ATTTTGGCGA GGAAGGTAAA1200GAGAGAAAGT AGTCCAGCAT GGCAGAGATG AAGACCGATG CCGCTACCCT CGCGCAGGAG1260GCAGGTAATT TCGAGCGGAT CTCCGGCGAC CTGAAAACCC AGATCGACCA GGTGGAGTCG1320ACGGCAGGTT CGTTGCAGGG CCAGTGGCGC GGCGCGGCGG GGACGGCCGC CCAGGCCGCG1380GTGGTGCGCT TCCAAGAAGC AGCCAATAAG CAGAAGCAGG AACTCGACGA GATCTCGACG1440AATATTCGTC AGGCCGGCGT CCAATACTCG AGGGCCGACG AGGAGCAGCA GCAGGCGCTG1500TCCTCGCAAA TGGGCTTCTG ACCCGCTAAT ACGAAAAGAA ACGGAGCAAA AACATGACAG1560AGCAGCAGTG GAATTTCGCG GGTATCGAGG CCGCGGCAAG CGCAATCCAG GGAAAT1616(2)SEQ ID NO:108的信息(ⅰ)序列特征(A)长度432碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:108:CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG 60GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG 120AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC 180TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC 240GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA 300GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG 360TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG 420TACGCCTCCG AA 432(2)SEQ ID NO:109的信息(ⅰ)序列特征(A)长度368氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:109:Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met1 5 10 15Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln20 25 30Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg35 40 45Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala50 55 60Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr65 70 75 80Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr85 90 95Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn100 105 110His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn115 120 125Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp130 135 140Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val145 150 155 160Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro165 170 175Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro180 185 190Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr195 200 205Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln210 215 220Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly225 230 235 240Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly245 250 255Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser260 265 270Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly275 280 285Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val290 295 300Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly305 310 315 320Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser325 330 335Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln340 345 350Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp355 360 365(2)SEQ ID NO:110的信息(ⅰ)序列特征(A)长度100氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:110:Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly1 5 10 15Asn Phe Glu Arg Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val20 25 30Glu Ser Thr Ala Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly35 40 45Thr Ala Ala Gln Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys50 55 60Gln Lys Gln Glu Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly65 70 75 80Val Gln Tyr Ser Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser85 90 95Gln Met Gly Phe100(2)SEQ ID NO:111的信息(ⅰ)序列特征(A)长度396碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:111:GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA 60GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA 120AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG 180CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT 240CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC 300GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC 360CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA 396(2)SEQ ID NO:112的信息(ⅰ)序列特征(A)长度80氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:112:Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala1 5 10 15Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln20 25 30Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu35 40 45Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser50 55 60Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe65 70 75 80(2)SEQ ID NO:113的信息(ⅰ)序列特征(A)长度387碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:113:GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA 60TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG 120CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC 180CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT 240TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG 300CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT 360ATTAGCGGGT CAGAAGCCCA TTTGCGA 387(2)SEQ ID NO:114的信息(ⅰ)序列特征(A)长度272碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:114:CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC 60TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC 120TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG 180TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG 240GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA 272(2)SEQ ID NO:115的信息(ⅰ)序列特征(A)长度20氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:115:
Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val1 5 10 15Val Ala Ala Leu20(2)SEQ ID NO:116的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:116:
Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser1 5 10 15(2)SEQ ID NO:117的信息(ⅰ)序列特征(A)长度19氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:117:
Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys1 5 10 15Glu Gly Arg(2)SEQ ID NO:118的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性
(ⅹⅰ)序列描述SEQ ID NO:118:
Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro1 5 10 15(2)SEQ ID NO:119的信息(ⅰ)序列特征(A)长度14氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:119:
Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val1 5 10(2)SEQ ID NO:120的信息(ⅰ)序列特征(A)长度13氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:120:
Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro1 5 10(2)SEQ ID NO:121的信息(ⅰ)序列特征(A)长度17氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:121:
Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro1 5 10 15Ser(2)SEQ ID NO:122的信息(ⅰ)序列特征(A)长度15氨基酸
(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:122:
Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly1 5 10 15(2)SEQ ID NO:123的信息(ⅰ)序列特征(A)长度30氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:123:
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser1 5 10 15Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn20 25 30(2)SEQ ID NO:124的信息(ⅰ)序列特征(A)长度22氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:124:
Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro1 5 10 15Gly Gly Arg Arg Xaa Phe20(2)SEQ ID NO:125的信息(ⅰ)序列特征(A)长度7氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:125:
Asp Pro Gly Tyr Thr Pro Gly
1 5(2)SEQ ID NO:126的信息(ⅰ)序列特征(A)长度10氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅸ)特征(D)其它信息/注意=″第二个残基可以是Pro或Thr″(ⅹⅰ)序列描述SEQ ID NO:126:
Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr1 5 10(2)SEQ ID NO:127的信息(ⅰ)序列特征(A)长度9氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅸ)特征(D)其它信息/注意=″第三个残基可以是Gln或Leu″(ⅹⅰ)序列描述SEQ ID NO:127Xaa Pro Xaa Val Thr Ala Tyr Ala Gly1 5(2)SEQ ID NO:128的信息(ⅰ)序列特征(A)长度9氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:128:
Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg1 5(2)SEQ ID NO:129的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸
(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:129:
Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser1 5 10 15(2)SEQ ID NO:130的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:130:
Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp1 5 10 15(2)SEQ ID NO:131的信息(ⅰ)序列特征(A)长度15氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:131:
Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly1 5 10 15(2)SEQ ID NO:132的信息(ⅰ)序列特征(A)长度21氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:132:
Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile1 5 10 15Asn Val His Leu Val20(2)SEQ ID NO:133的信息
(ⅰ)序列特征(A)长度882碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:133:GCAACGCTGT CGTGGCCTTT GCGGTGATCG GTTTCGCCTC GCTGGCGGTG GCGGTGGCGG 60TCACCATCCG ACCGACCGCG GCCTCAAAAC CGGTAGAGGG ACACCAAAAC GCCCAGCCAG 120GGAAGTTCAT GCCGTTGTTG CCGACGCAAC AGCAGGCGCC GGTCCCGCCG CCTCCGCCCG 180ATGATCCCAC CGCTGGATTC CAGGGCGGCA CCATTCCGGC TGTACAGAAC GTGGTGCCGC 240GGCCGGGTAC CTCACCCGGG GTGGGTGGGA CGCCGGCTTC GCCTGCGCCG GAAGCGCCGG 300CCGTGCCCGG TGTTGTGCCT GCCCCGGTGC CAATCCCGGT CCCGATCATC ATTCCCCCGT 360TCCCGGGTTG GCAGCCTGGA ATGCCGACCA TCCCCACCGC ACCGCCGACG ACGCCGGTGA 420CCACGTCGGC GACGACGCCG CCGACCACGC CGCCGACCAC GCCGGTGACC ACGCCGCCAA 480CGACGCCGCC GACCACGCCG GTGACCACGC CGCCAACGAC GCCGCCGACC ACGCCGGTGA 540CCACGCCACC AACGACCGTC GCCCCGACGA CCGTCGCCCC GACGACGGTC GCTCCGACCA 600CCGTCGCCCC GACCACGGTC GCTCCAGCCA CCGCCACGCC GACGACCGTC GCTCCGCAGC 660CGACGCAGCA GCCCACGCAA CAACCAACCC AACAGATGCC AACCCAGCAG CAGACCGTGG 720CCCCGCAGAC GGTGGCGCCG GCTCCGCAGC CGCCGTCCGG TGGCCGCAAC GGCAGCGGCG 780GGGGCGACTT ATTCGGCGGG TTCTGATCAC GGTCGCGGCT TCACTACGGT CGGAGGACAT 840GGCCGGTGAT GCGGTGACGG TGGTGCTGCC CTGTCTCAAC GA882(2) SEQ ID NO:134的信息(ⅰ)序列特征(A)长度815碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:134:CCATCAACCA ACCGCTCGCG CCGCCCGCGC CGCCGGATCC GCCGTCGCCG CCACGCCCGC 60CGGTGCCTCC GGTGCCCCCG TTGCCGCCGT CGCCGCCGTC GCCGCCGACC GGCTGGGTGC 120CTAGGGCGCT GTTACCGCCC TGGTTGGCGG GGACGCCGCC GGCACCACCG GTACCGCCGA 180TGGCGCCGTT GCCGCCGGCG GCACCGTTGC CACCGTTGCC ACCGTTGCCA CCGTTGCCGA 240CCAGCCACCC GCCGCGACCA CCGGCACCGC CGGCGCCGCC CGCACCGCCG GCGTGCCCGT 300TCGTGCCCGT ACCGCCGGCA CCGCCGTTGC CGCCGTCACC GCCGACGGAA CTACCGGCGG 360ACGCGGCCTG CCCGCCGGCG CCGCCCGCAC CGCCATTGGC ACCGCCGTCA CCGCCGGCTG 420GGAGTGCCGC GATTAGGGCA CTGACCGGCG CAACCAGCGC AAGTACTCTC GGTCACCGAG 480CACTTCCAGA CGACACCACA GCACGGGGTT GTCGGCGGAC TGGGTGAAAT GGCAGCCGAT 540AGCGGCTAGC TGTCGGCTGC GGTCAACCTC GATCATGATG TCGAGGTGAC CGTGACCGCG 600CCCCCCGAAG GAGGCGCTGA ACTCGGCGTT GAGCCGATCG GCGATCGGTT GGGGCAGTGC 660CCAGGCCAAT ACGGGGATAC CGGGTGTCNA AGCCGCCGCG AGCGCAGCTT CGGTTGCGCG 720ACNGTGGTCG GGGTGGCCTG TTACGCCGTT GTCNTCGAAC ACGAGTAGCA GGTCTGCTCC 780GGCGAGGGCA TCCACCACGC GTTGCGTCAG CTCGT815(2)SEQ ID NO:135的信息(ⅰ)序列特征(A)长度1152碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:135:ACCAGCCGCC GGCTGAGGTC TCAGATCAGA GAGTCTCCGG ACTCACCGGG GCGGTTCAGC 60CTTCTCCCAG AACAACTGCT GAAGATCCTC GCCCGCGAAA CAGGCGCTGA TTTGACGCTC 120TATGACCGGT TGAACGACGA GATCATCCGG CAGATTGATA TGGCACCGCT GGGCTAACAG 180GTGCGCAAGA TGGTGCAGCT GTATGTCTCG GACTCCGTGT CGCGGATCAG CTTTGCCGAC 240GGCCGGGTGA TCGTGTGGAG CGAGGAGCTC GGCGAGAGCC AGTATCCGAT CGAGACGCTG 300GACGGCATCA CGCTGTTTGG GCGGCCGACG ATGACAACGC CCTTCATCGT TGAGATGCTC 360AAGCGTGAGC GCGACATCCA GCTCTTCACG ACCGACGGCC ACTACCAGGG CCGGATCTCA 420ACACCCGACG TGTCATACGC GCCGCGGCTC CGTCAGCAAG TTCACCGCAC CGACGATCCT 480GCGTTCTGCC TGTCGTTAAG CAAGCGGATC GTGTCGAGGA AGATCCTGAA TCAGCAGGCC 540TTGATTCGGG CACACACGTC GGGGCAAGAC GTTGCTGAGA GCATCCGCAC GATGAAGCAC 600TCGCTGGCCT GGGTCGATCG ATCGGGCTCC CTGGCGGAGT TGAACGGGTT CGAGGGAAAT 660GCCGCAAAGG CATACTTCAC CGCGCTGGGG CATCTCGTCC CGCAGGAGTT CGCATTCCAG 720GGCCGCTCGA CTCGGCCGCC GTTGGACGCC TTCAACTCGA TGGTCAGCCT CGGCTATTCG 780CTGCTGTACA AGAACATCAT AGGGGCGATC GAGCGTCACA GCCTGAACGC GTATATCGGT 840TTCCTACACC AGGATTCACG AGGGCACGCA ACGTCTCGTG CCGAATTCGG CACGAGCTCC 900GCTGAAACCG CTGGCCGGCT GCTCAGTGCC CGTACGTAAT CCGCTGCGCC CAGGCCGGCC 960CGCCGGCCGA ATACCAGCAG ATCGGACAGC GAATTGCCGC CCAGCCGGTT GGAGCCGTGC1020ATACCGCCGG CACACTCACC GGCAGCGAAC AGGCCTGGCA CCGTGGCGGC GCCGGTGTCC1080GCGTCTACTT CGACACCGCC CATCACGTAG TGACACGTCG GCCCGACTTC CATTGCCTGC1140GTTCGGCACG AG1152(2)SEQ ID NO:136的信息(ⅰ)序列特征(A)长度655碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:136:CTCGTGCCGA TTCGGCAGGG TGTACTTGCC GGTGGTGTAN GCCGCATGAG TGCCGACGAC 60CAGCAATGCG GCAACAGCAC GGATCCCGGT CAACGACGCC ACCCGGTCCA CGTGGGCGAT 120CCGCTCGAGT CCGCCCTGGG CGGCTCTTTC CTTGGGCAGG GTCATCCGAC GTGTTTCCGC 180CGTGGTTTGC CGCCATTATG CCGGCGCGCC GCGTCGGGCG GCCGGTATGG CCGAANGTCG 240ATCAGCACAC CCGAGATACG GGTCTGTGCA AGCTTTTTGA GCGTCGCGCG GGGCAGCTTC 300GCCGGCAATT CTACTAGCGA GAAGTCTGGC CCGATACGGA TCTGACCGAA GTCGCTGCGG 360TGCAGCCCAC CCTCATTGGC GATGGCGCCG ACGATGGCGC CTGGACCGAT CTTGTGCCGC 420TTGCCGACGG CGACGCGGTA GGTGGTCAAG TCCGGTCTAC GCTTGGGCCT TTGCGGACGG 480TCCCGACGCT GGTCGCGGTT GCGCCGCGAA AGCGGCGGGT CGGGTGCCAT CAGGAATGCC 540TCACCGCCGC GGCACTGCAC GGCCAGTGCC GCGGCGATGT CAGCCATCGG GACATCATGC 600TCGCGTTCAT ACTCCTCGAC CAGTCGGCGG AACAGCTCGA TTCCCGGACC GCCCA 655(2)SEQ ID NO:137的信息(ⅰ)序列特征(A)长度267氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:137:Ash Ala Val Val Ala Phe Ala Val Ile Gly Phe Ala Ser Leu Ala Val1 5 10 15Ala Val Ala Val Thr Ile Arg Pro Thr Ala Ala Ser Lys Pro Val Glu20 25 30Gly His Gln Asn Ala Gln Pro Gly Lys Phe Met Pro Leu Leu Pro Thr35 40 45Gln Gln Gln Ala Pro Val Pro Pro Pro Pro Pro Asp Asp Pro Thr Ala50 55 60Gly Phe Gln Gly Gly Thr Ile Pro Ala Val Gln Asn Val Val Pro Arg65 70 75 80Pro Gly Thr Ser Pro Gly Val Gly Gly Thr Pro Ala Ser Pro Ala Pro85 90 95Glu Ala Pro Ala Val Pro Gly Val Val Pro Ala Pro Val Pro Ile Pro100 105 110Val Pro Ile Ile Ile Pro Pro Phe Pro Gly Trp Gln Pro Gly Met Pro115 120 125Thr Ile Pro Thr Ala Pro Pro Thr Thr Pro Val Thr Thr Ser Ala Thr130 135 140Thr Pro Pro Thr Thr Pro Pro Thr Thr Pro Val Thr Thr Pro Pro Thr145 150 155 160Thr Pro Pro Thr Thr Pro Val Thr Thr Pro Pro Thr Thr Pro Pro Thr165 170 175Thr Pro Val Thr Thr Pro Pro Thr Thr Val Ala Pro Thr Thr Val Ala180 185 190Pro Thr Thr Val Ala Pro Thr Thr Val Ala Pro Thr Thr Val Ala Pro195 200 205Ala Thr Ala Thr Pro Thr Thr Val Ala Pro Gln Pro Thr Gln Gln Pro210 215 220Thr Gln Gln Pro Thr Gln Gln Met Pro Thr Gln Gln Gln Thr Val Ala225 230 235 240Pro Gln Thr Val Ala Pro Ala Pro Gln Pro Pro Ser Gly Gly Arg Asn245 250 255Gly Ser Gly Gly Gly Asp Leu Phe Gly Gly Phe260 265(2)SEQ ID NO:138的信息(ⅰ)序列特征(A)长度174氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:138:Ile Asn Gln Pro Leu Ala Pro Pro Ala Pro Pro Asp Pro Pro Ser Pro1 5 10 15Pro Arg Pro Pro Val Pro Pro Val Pro Pro Leu Pro Pro Ser Pro Pro20 25 30Ser Pro Pro Thr Gly Trp Val Pro Arg Ala Leu Leu Pro Pro Trp Leu35 40 45Ala Gly Thr Pro Pro Ala Pro Pro Val Pro Pro Met Ala Pro Leu Pro50 55 60Pro Ala Ala Pro Leu Pro Pro Leu Pro Pro Leu Pro Pro Leu Pro Thr65 70 75 80Ser His Pro Pro Arg Pro Pro Ala Pro Pro Ala Pro Pro Ala Pro Pro85 90 95Ala Cys Pro Phe Val Pro Val Pro Pro Ala Pro Pro Leu Pro Pro Ser
100 105 110Pro Pro Thr Glu Leu Pro Ala Asp Ala Ala Cys Pro Pro Ala Pro Pro115 120 125Ala Pro Pro Leu Ala Pro Pro Ser Pro Pro Ala Gly Ser Ala Ala Ile130 135 140Arg Ala Leu Thr Gly Ala Thr Ser Ala Ser Thr Leu Gly His Arg Ala145 150 155 160Leu Pro Asp Asp Thr Thr Ala Arg Gly Cys Arg Arg Thr Gly165 170(2)SEQ ID NO:139的信息(ⅰ)序列特征(A)长度35氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:139:Gln Pro Pro Ala Glu Val Ser Asp Gln Arg Val Ser Gly Leu Thr Gly1 5 10 15Ala Val Gln Pro Ser Pro Arg Thr Thr Ala Glu Asp Pro Arg Pro Arg20 25 30Asn Arg Arg35(2)SEQ ID NO:140的信息(ⅰ)序列特征(A)长度104氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:140:Arg Ala Asp Ser Ala Gly Cys Thr Cys Arg Trp Cys Xaa Pro His Glu1 5 10 15Cys Arg Arg Pro Ala Met Arg Gln Gln His Gly Ser Arg Ser Thr Thr20 25 30Pro Pro Gly Pro Arg Gly Arg Ser Ala Arg Val Arg Pro Gly Arg Leu35 40 45Phe Pro Trp Ala Gly Ser Ser Asp Val Phe Pro Pro Trp Phe Ala Ala50 55 60Ile Met Pro Ala Arg Arg Val Gly Arg Pro Val Trp Pro Xaa Val Asp65 70 75 80Gln His Thr Arg Asp Thr Gly Leu Cys Lys Leu Phe Glu Arg Arg Ala85 90 95Gly Gln Leu Arg Arg Gln Phe Tyr100(2)SEQ ID NO:141的信息(ⅰ)序列特征(A)长度53碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它核酸(A)描述/描述=″PCR引物″(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅹⅰ)序列描述SEQ ID NO:141:GGATCCATAT GGGCCATCAT CATCATCATC ACGTGATCGA CATCATCGGG ACC 53(2)SEQ ID NO:142的信息(ⅰ)序列特征(A)长度42碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它核酸(A)描述/描述=″PCR引物″(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅹⅰ)序列描述SEQ ID NO:142:CCTGAATTCA GGCCTCGGTT GCGCCGGCCT CATCTTGAAC GA42(2)SEQ ID NO:143的信息(ⅰ)序列特征(A)长度31碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它核酸(A)描述/描述=″PCR引物″(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅹⅰ)序列描述SEQ ID NO:143:GGATCCTGCA GGCTCGAAAC CACCGAGCGG T 31(2)SEQ ID NO:144的信息(ⅰ)序列特征(A)长度31碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它核酸(A)描述/描述=″PCR引物″(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅹⅰ)序列描述SEQ ID NO:144:CTCTGAATTC AGCGCTGGAA ATCGTCGCGA T31(2)SEQ ID NO:145的信息(ⅰ)序列特征(A)长度33碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它核酸(A)描述/描述=″PCR引物″(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅹⅰ)序列描述SEQ ID NO:145:GGATCCAGCG CTGAGATGAA GACCGATGCC GCT 33(2)SEQ ID NO:146的信息(ⅰ)序列特征(A)长度33碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它核酸(A)描述/描述=″PCR引物″(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅹⅰ)序列描述SEQ ID NO:146:GAGAGAATTC TCAGAAGCCC ATTTGCGAGG ACA 33(2)SEQ ID NO:147的信息(ⅰ)序列特征(A)长度1993碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型DNA(基因组)(ⅵ)最初来源(A)生物体结核分枝杆菌(ⅸ)特征(A)名称/关键字CDS(B)位置152..1273(ⅹⅰ)序列描述SEQ ID NO:147:TGTTCTTCGA CGGCAGGCTG GTGGAGGAAG GGCCCACCGA ACAGCTGTTC TCCTCGCCGA 60AGCATGCGGA AACCGCCCGA TACGTCGCCG GACTGTCGGG GGACGTCAAG GACGCCAAGC 120GCGGAAATTG AAGAGCACAG AAAGGTATGG C GTG AAA ATT CGT TTG CAT ACG172Val Lys Ile Arg Leu His Thr1 5CTG TTG GCC GTG TTG ACC GCT GCG CCG CTG CTG CTA GCA GCG GCG GGC 220Leu Leu Ala Val Leu Thr Ala Ala Pro Leu Leu Leu Ala Ala Ala Gly10 15 20TGT GGC TCG AAA CCA CCG AGC GGT TCG CCT GAA ACG GGC GCC GGC GCC 268Cys Gly Ser Lys Pro Pro Ser Gly Ser Pro Glu Thr Gly Ala Gly Ala25 30 35GGT ACT GTC GCG ACT ACC CCC GCG TCG TCG CCG GTG ACG TTG GCG GAG 316Gly Thr Val Ala Thr Thr Pro Ala Ser Ser Pro Val Thr Leu Ala Glu40 45 50 55ACC GGT AGC ACG CTG CTC TAC CCG CTG TTC AAC CTG TGG GGT CCG GCC 364Thr Gly Ser Thr Leu Leu Tyr Pro Leu Phe Asn Leu Trp Gly Pro Ala60 65 70TTT CAC GAG AGG TAT CCG AAC GTC ACG ATC ACC GCT CAG GGC ACC GGT 412Phe His Glu Arg Tyr Pro Asn Val Thr Ile Thr Ala Gln Gly Thr Gly75 80 85TCT GGT GCC GGG ATC GCG CAG GCC GCC GCC GGG ACG GTC AAC ATT GGG 460Ser Gly Ala Gly Ile Ala Gln Ala Ala Ala Gly Thr Val Asn Ile Gly90 95 100GCC TCC GAC GCC TAT CTG TCG GAA GGT GAT ATG GCC GCG CAC AAG GGG 508Ala Ser Asp Ala Tyr Leu Ser Glu Gly Asp Met Ala Ala His Lys Gly105 110 115CTG ATG AAC ATC GCG CTA GCC ATC TCC GCT CAG CAG GTC AAC TAC AAC 556Leu Met Asn Ile Ala Leu Ala Ile Ser Ala Gln Gln Val Asn Tyr Asn120 125 130 135CTG CCC GGA GTG AGC GAG CAC CTC AAG CTG AAC GGA AAA GTC CTG GCG 604Leu Pro Gly Val Ser Glu His Leu Lys Leu Asn Gly Lys Val Leu Ala140 145 150GCC ATG TAC CAG GGC ACC ATC AAA ACC TGG GAC GAC CCG CAG ATC GCT 652Ala Met Tyr Gln Gly Thr Ile Lys Thr Trp Asp Asp Pro Gln Ile Ala155 160 165GCG CTC AAC CCC GGC GTG AAC CTG CCC GGC ACC GCG GTA GTT CCG CTG 700Ala Leu Asn Pro Gly Val Asn Leu Pro Gly Thr Ala Val Val Pro Leu170 175 180CAC CGC TCC GAC GGG TCC GGT GAC ACC TTC TTG TTC ACC CAG TAC CTG 748His Arg Ser Asp Gly Ser Gly Asp Thr Phe Leu Phe Thr Gln Tyr Leu185 190 195TCC AAG CAA GAT CCC GAG GGC TGG GGC AAG TCG CCC GGC TTC GGC ACC 796Ser Lys Gln Asp Pro Glu Gly Trp Gly Lys Ser Pro Gly Phe Gly Thr200 205 210 215ACC GTC GAC TTC CCG GCG GTG CCG GGT GCG CTG GGT GAG AAC GGC AAC 844Thr Val Asp Phe Pro Ala Val Pro Gly Ala Leu Gly Glu Asn Gly Asn220 225 230GGC GGC ATG GTG ACC GGT TGC GCC GAG ACA CCG GGC TGC GTG GCC TAT 892Gly Gly Met Val Thr Gly Cys Ala Glu Thr Pro Gly Cys Val Ala Tyr235 240 245ATC GGC ATC AGC TTC CTC GAC CAG GCC AGT CAA CGG GGA CTC GGC GAG 940Ile Gly Ile Ser Phe Leu Asp Gln Ala Ser Gln Arg Gly Leu Gly Glu250 255 260GCC CAA CTA GGC AAT AGC TCT GGC AAT TTC TTG TTG CCC GAC GCG CAA 988Ala Gln Leu Gly Asn Ser Ser Gly Asn Phe Leu Leu Pro Asp Ala Gln265 270 275AGC ATT CAG GCC GCG GCG GCT GGC TTC GCA TCG AAA ACC CCG GCG AAC 1036Ser Ile Gln Ala Ala Ala Ala Gly Phe Ala Ser Lys Thr Pro Ala Asn280 285 290 295CAG GCG ATT TCG ATG ATC GAC GGG CCC GCC CCG GAC GGC TAC CCG ATC 1084Gln Ala Ile Ser Met Ile Asp Gly Pro Ala Pro Asp Gly Tyr Pro Ile300 305 310ATC AAC TAC GAG TAC GCC ATC GTC AAC AAC CGG CAA AAG GAC GCC GCC 1132Ile Asn Tyr Glu Tyr Ala Ile Val Asn Asn Arg Gln Lys Asp Ala Ala315 320 325ACC GCG CAG ACC TTG CAG GCA TTT CTG CAC TGG GCG ATC ACC GAC GGC 1180Thr Ala Gln Thr Leu Gln Ala Phe Leu His Trp Ala Ile Thr Asp Gly330 335 340AAC AAG GCC TCG TTC CTC GAC CAG GTT CAT TTC CAG CCG CTG CCG CCC 1228Asn Lys Ala Ser Phe Leu Asp Gln Val His Phe Gln Pro Leu Pro Pro345 350 355GCG GTG GTG AAG TTG TCT GAC GCG TTG ATC GCG ACG ATT TCC AGC 1273Ala Val Val Lys Leu Ser Asp Ala Leu Ile Ala Thr Ile Ser Ser360 365 370TAGCCTCGTT GACCACCACG CGACAGCAAC CTCCGTCGGG CCATCGGGCT GCTTTGCGGA1333GCATGCTGGC CCGTGCCGGT GAAGTCGGCC GCGCTGGCCC GGCCATCCGG TGGTTGGGTG1393GGATAGGTGC GGTGATCCCG CTGCTTGCGC TGGTCTTGGT GCTGGTGGTG CTGGTCATCG1453AGGCGATGGG TGCGATCAGG CTCAACGGGT TGCATTTCTT CACCGCCACC GAATGGAATC1513CAGGCAACAC CTACGGCGAA ACCGTTGTCA CCGACGCGTC GCCCATCCGG TCGGCGCCTA1573CTACGGGGCG TTGCCGCTGA TCGTCGGGAC GCTGGCGACC TCGGCAATCG CCCTGATCAT1633CGCGGTGCCG GTCTCTGTAG GAGCGGCGCT GGTGATCGTG GAACGGCTGC CGAAACGGTT1693GGCCGAGGCT GTGGGAATAG TCCTGGAATT GCTCGCCGGA ATCCCCAGCG TGGTCGTCGG1753TTTGTGGGGG GCAATGACGT TCGGGCCGTT CATCGCTCAT CACATCGCTC CGGTGATCGC1813TCACAACGCT CCCGATGTGC CGGTGCTGAA CTACTTGCGC GGCGACCCGG GCAACGGGGA1873GGGCATGTTG GTGTCCGGTC TGGTGTTGGC GGTGATGGTC GTTCCCATTA TCGCCACCAC1933CACTCATGAC CTGTTCCGGC AGGTGCCGGT GTTGCCCCGG GAGGGCGCGA TCGGGAATTC1993(2)SEQ ID NO:148的信息(ⅰ)序列特征(A)长度374氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:148:Val Lys Ile Arg Leu His Thr Leu Leu Ala Val Leu Thr Ala Ala Pro1 5 10 15Leu Leu Leu Ala Ala Ala Gly Cys Gly Ser Lys Pro Pro Ser Gly Ser20 25 30Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro Ala Ser35 40 45Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr Pro Leu50 55 60Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn Val Thr65 70 75 80Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln Ala Ala85 90 95Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser Glu Gly100 105 110Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala Ile Ser115 120 125Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His Leu Lys130 135 140Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile Lys Thr145 150 155 160Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn Leu Pro165 170 175Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly Asp Thr
180 185 190Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly Trp Gly195 200 205Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val Pro Gly210 215 220Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys Ala Glu225 230 235 240Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp Gln Ala245 250 255Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser Gly Asn260 265 270Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala Gly Phe275 280 285Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp Gly Pro290 295 300Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile Val Asn305 310 315 320Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala Phe Leu325 330 335His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp Gln Val340 345 350His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp Ala Leu355 360 365Ile Ala Thr Ile Ser Ser370(2)SEQ ID NO:149的信息(ⅰ)序列特征(A)长度1993碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:149:TGTTCTTCGA CGGCAGGCTG GTGGAGGAAG GGCCCACCGA ACAGCTGTTC TCCTCGCCGA 60AGCATGCGGA AACCGCCCGA TACGTCGCCG GACTGTCGGG GGACGTCAAG GACGCCAAGC 120GCGGAAATTG AAGAGCACAG AAAGGTATGG CGTGAAAATT CGTTTGCATA CGCTGTTGGC 180CGTGTTGACC GCTGCGCCGC TGCTGCTAGC AGCGGCGGGC TGTGGCTCGA AACCACCGAG 240CGGTTCGCCT GAAACGGGCG CCGGCGCCGG TACTGTCGCG ACTACCCCCG CGTCGTCGCC 300GGTGACGTTG GCGGAGACCG GTAGCACGCT GCTCTACCCG CTGTTCAACC TGTGGGGTCC 360GGCCTTTCAC GAGAGGTATC CGAACGTCAC GATCACCGCT CAGGGCACCG GTTCTGGTGC 420CGGGATCGCG CAGGCCGCCG CCGGGACGGT CAACATTGGG GCCTCCGACG CCTATCTGTC 480GGAAGGTGAT ATGGCCGCGC ACAAGGGGCT GATGAACATC GCGCTAGCCA TCTCCGCTCA 540GCAGGTCAAC TACAACCTGC CCGGAGTGAG CGAGCACCTC AAGCTGAACG GAAAAGTCCT 600GGCGGCCATG TACCAGGGCA CCATCAAAAC CTGGGACGAC CCGCAGATCG CTGCGCTCAA 660CCCCGGCGTG AACCTGCCCG GCACCGCGGT AGTTCCGCTG CACCGCTCCG ACGGGTCCGG 720TGACACCTTC TTGTTCACCC AGTACCTGTC CAAGCAAGAT CCCGAGGGCT GGGGCAAGTC 780GCCCGGCTTC GGCACCACCG TCGACTTCCC GGCGGTGCCG GGTGCGCTGG GTGAGAACGG 840CAACGGCGGC ATGGTGACCG GTTGCGCCGA GACACCGGGC TGCGTGGCCT ATATCGGCAT 900CAGCTTCCTC GACCAGGCCA GTCAACGGGG ACTCGGCGAG GCCCAACTAG GCAATAGCTC 960TGGCAATTTC TTGTTGCCCG ACGCGCAAAG CATTCAGGCC GCGGCGGCTG GCTTCGCATC1020GAAAACCCCG GCGAACCAGG CGATTTCGAT GATCGACGGG CCCGCCCCGG ACGGCTACCC1080GATCATCAAC TACGAGTACG CCATCGTCAA CAACCGGCAA AAGGACGCCG CCACCGCGCA1140GACCTTGCAG GCATTTCTGC ACTGGGCGAT CACCGACGGC AACAAGGCCT CGTTCCTCGA1200CCAGGTTCAT TTCCAGCCGC TGCCGCCCGC GGTGGTGAAG TTGTCTGACG CGTTGATCGC1260GACGATTTCC AGCTAGCCTC GTTGACCACC ACGCGACAGC AACCTCCGTC GGGCCATCGG1320GCTGCTTTGC GGAGCATGCT GGCCCGTGCC GGTGAAGTCG GCCGCGCTGG CCCGGCCATC1380CGGTGGTTGG GTGGGATAGG TGCGGTGATC CCGCTGCTTG CGCTGGTCTT GGTGCTGGTG1440GTGCTGGTCA TCGAGGCGAT GGGTGCGATC AGGCTCAACG GGTTGCATTT CTTCACCGCC1500ACCGAATGGA ATCCAGGCAA CACCTACGGC GAAACCGTTG TCACCGACGC GTCGCCCATC1560CGGTCGGCGC CTACTACGGG GCGTTGCCGC TGATCGTCGG GACGCTGGCG ACCTCGGCAA1620TCGCCCTGAT CATCGCGGTG CCGGTCTCTG TAGGAGCGGC GCTGGTGATC GTGGAACGGC1680TGCCGAAACG GTTGGCCGAG GCTGTGGGAA TAGTCCTGGA ATTGCTCGCC GGAATCCCCA1740GCGTGGTCGT CGGTTTGTGG GGGGCAATGA CGTTCGGGCC GTTCATCGCT CATCACATCG1800CTCCGGTGAT CGCTCACAAC GCTCCCGATG TGCCGGTGCT GAACTACTTG CGCGGCGACC1860CGGGCAACGG GGAGGGCATG TTGGTGTCCG GTCTGGTGTT GGCGGTGATG GTCGTTCCCA1920TTATCGCCAC CACCACTCAT GACCTGTTCC GGCAGGTGCC GGTGTTGCCC CGGGAGGGCG1980CGATCGGGAA TTC 1993(2)SEQ ID NO:150的信息(ⅰ)序列特征(A)长度374氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:150:Met Lys Ile Arg Leu His Thr Leu Leu Ala Val Leu Thr Ala Ala Pro1 5 10 15Leu Leu Leu Ala Ala Ala Gly Cys Gly Ser Lys Pro Pro Ser Gly Ser20 25 30Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro Ala Ser35 40 45Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr Pro Leu50 55 60Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn Val Thr65 70 75 80Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln Ala Ala85 90 95Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser Glu Gly100 105 110Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala Ile Ser115 120 125Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His Leu Lys130 135 140Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile Lys Thr145 150 155 160Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn Leu Pro165 170 175Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly Asp Thr180 185 190Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly Trp Gly195 200 205Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val Pro Gly210 215 220Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys Ala Glu225 230 235 240Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp Gln Ala245 250 255Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser Gly Asn260 265 270Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala Gly Phe275 280 285Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp Gly Pro290 295 300Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile Val Asn305 310 315 320Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala Phe Leu325 330 335His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp Gln Val340 345 350His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp Ala Leu355 360 365Ile Ala Thr Ile Ser Ser370(2)SEQ ID NO:151的信息(ⅰ)序列特征(A)长度1777碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:151:GGTCTTGACC ACCACCTGGG TGTCGAAGTC GGTGCCCGGA TTGAAGTCCA GGTACTCGTG 60GGTGGGGCGG GCGAAACAAT AGCGACAAGC ATGCGAGCAG CCGCGGTAGC CGTTGACGGT 120GTAGCGAAAC GGCAACGCGG CCGCGTTGGG CACCTTGTTC AGCGCTGATT TGCACAACAC 180CTCGTGGAAG GTGATGCCGT CGAATTGTGG CGCGCGAACG CTGCGGACCA GGCCGATCCG 240CTGCAACCCG GCAGCGCCCG TCGTCAACGG GCATCCCGTT CACCGCGACG GCTTGCCGGG 300CCCAACGCAT ACCATTATTC GAACAACCGT TCTATACTTT GTCAACGCTG GCCGCTACCG 360AGCGCCGCAC AGGATGTGAT ATGCCATCTC TGCCCGCACA GACAGGAGCC AGGCCTTATG 420ACAGCATTCG GCGTCGAGCC CTACGGGCAG CCGAAGTACC TAGAAATCGC CGGGAAGCGC 480ATGGCGTATA TCGACGAAGG CAAGGGTGAC GCCATCGTCT TTCAGCACGG CAACCCCACG 540TCGTCTTACT TGTGGCGCAA CATCATGCCG CACTTGGAAG GGCTGGGCCG GCTGGTGGCC 600TGCGATCTGA TCGGGATGGG CGCGTCGGAC AAGCTCAGCC CATCGGGACC CGACCGCTAT 660AGCTATGGCG AGCAACGAGA CTTTTTGTTC GCGCTCTGGG ATGCGCTCGA CCTCGGCGAC 720CACGTGGTAC TGGTGCTGCA CGACTGGGGC TCGGCGCTCG GCTTCGACTG GGCTAACCAG 780CATCGCGACC GAGTGCAGGG GATCGCGTTC ATGGAAGCGA TCGTCACCCC GATGACGTGG 840GCGGACTGGC CGCCGGCCGT GCGGGGTGTG TTCCAGGGTT TCCGATCGCC TCAAGGCGAG 900CCAATGGCGT TGGAGCACAA CATCTTTGTC GAACGGGTGC TGCCCGGGGC GATCCTGCGA 960CAGCTCAGCG ACGAGGAAAT GAACCACTAT CGGCGGCCAT TCGTGAACGG CGGCGAGGAC1020CGTCGCCCCA CGTTGTCGTG GCCACGAAAC CTTCCAATCG ACGGTGAGCC CGCCGAGGTC1080GTCGCGTTGG TCAACGAGTA CCGGAGCTGG CTCGAGGAAA CCGACATGCC GAAACTGTTC1140ATCAACGCCG AGCCCGGCGC GATCATCACC GGCCGCATCC GTGACTATGT CAGGAGCTGG1200CCCAACCAGA CCGAAATCAC AGTGCCCGGC GTGCATTTCG TTCAGGAGGA CAGCGATGGC1260GTCGTATCGT GGGCGGGCGC TCGGCAGCAT CGGCGACCTG GGAGCGCTCT CATTTCACGA1320GACCAAGAAT GTGATTTCCG GCGAAGGCGG CGCCCTGCTT GTCAACTCAT AAGACTTCCT1380GCTCCGGGCA GAGATTCTCA GGGAAAAGGG CACCAATCGC AGCCGCTTCC TTCGCAACGA1440GGTCGACAAA TATACGTGGC AGGACAAAGG TCTTCCTATT TGCCCAGCGA ATTAGTCGCT1500GCCTTTCTAT GGGCTCAGTT CGAGGAAGCC GAGCGGATCA CGCGTATCCG ATTGGACCTA1560TGGAACCGGT ATCATGAAAG CTTCGAATCA TTGGAACAGC GGGGGCTCCT GCGCCGTCCG1620ATCATCCCAC AGGGCTGCTC TCACAACGCC CACATGTACT ACGTGTTACT AGCGCCCAGC1680GCCGATCGGG AGGAGGTGCT GGCGCGTCTG ACGAGCGAAG GTATAGGCGC GGTCTTTCAT1740TACGTGCCGC TTCACGATTC GCCGGCCGGG CGTCGCT 1777(2)SEQ ID NO:152的信息(ⅰ)序列特征(A)长度324碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:152:GAGATTGAAT CGTACCGGTC TCCTTAGCGG CTCCGTCCCG TGAATGCCCA TATCACGCAC 60GGCCATGTTC TGGCTGTCGA CCTTCGCCCC ATGCCCGGAC GTTGGTAAAC CCAGGGTTTG 120ATCAGTAATT CCGGGGGACG GTTGCGGGAA GGCGGCCAGG ATGTGCGTGA GCCGCGGCGC 180CGCCGTCGCC CAGGCGACCG CTGGATGCTC AGCCCCGGTG CGGCGACGTA GCCAGCGTTT 240GGCGCGTGTC GTCCACAGTG GTACTCCGGT GACGACGCGG CGCGGTGCCT GGGTGAAGAC 300CGTGACCGAC GCCGCCGATT CAGA324(2)SEQ ID NO:153的信息(ⅰ)序列特征(A)长度1338碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:153:GCGGTACCGC CGCGTTGCGC TGGCACGGGA CCTGTACGAC CTGAACCACT TCGCCTCGCG 60AACGATTGAC GAACCGCTCG TGCGGCGGCT GTGGGTGCTC AAGGTGTGGG GTGATGTCGT 120CGATGACCGG CGCGGCACCC GGCCACTACG CGTCGAAGAC GTCCTCGCCG CCCGCAGCGA 180GCACGACTTC CAGCCCGACT CGATCGGCGT GCTGACCCGT CCTGTCGCTA TGGCTGCCTG 240GGAAGCTCGC GTTCGGAAGC GATTTGCGTT CCTCACTGAC CTCGACGCCG ACGAGCAGCG 300GTGGGCCGCC TGCGACGAAC GGCACCGCCG CGAAGTGGAG AACGCGCTGG CGGTGCTGCG 360GTCCTGATCA ACCTGCCGGC GATCGTGCCG TTCCGCTGGC ACGGTTGCGG CTGGACGCGG 420CTGAATCGAC TAGATGAGAG CAGTTGGGCA CGAATCCGGC TGTGGTGGTG AGCAAGACAC 480GAGTACTGTC ATCACTATTG GATGCACTGG ATGACCGGCC TGATTCAGCA GGACCAATGG 540AACTGCCCGG GGCAAAACGT CTCGGAGATG ATCGGCGTCC CCTCGGAACC CTGCGGTGCT 600GGCGTCATTC GGACATCGGT CCGGCTCGCG GGATCGTGGT GACGCCAGCG CTGAAGGAGT 660GGAGCGCGGC GGTGCACGCG CTGCTGGACG GCCGGCAGAC GGTGCTGCTG CGTAAGGGCG 720GGATCGGCGA GAAGCGCTTC GAGGTGGCGG CCCACGAGTT CTTGTTGTTC CCGACGGTCG 780CGCACAGCCA CGCCGAGCGG GTTCGCCCCG AGCACCGCGA CCTGCTGGGC CCGGCGGCCG 840CCGACAGCAC CGACGAGTGT GTGCTACTGC GGGCCGCAGC GAAAGTTGTT GCCGCACTGC 900CGGTTAACCG GCCAGAGGGT CTGGACGCCA TCGAGGATCT GCACATCTGG ACCGCCGAGT 960CGGTGCGCGC CGACCGGCTC GACTTTCGGC CCAAGCACAA ACTGGCCGTC TTGGTGGTCT1020CGGCGATCCC GCTGGCCGAG CCGGTCCGGC TGGCGCGTAG GCCCGAGTAC GGCGGTTGCA1080CCAGCTGGGT GCAGCTGCCG GTGACGCCGA CGTTGGCGGC GCCGGTGCAC GACGAGGCCG1140CGCTGGCCGA GGTCGCCGCC CGGGTCCGCG AGGCCGTGGG TTGACTGGGC GGCATCGCTT1200GGGTCTGAGC TGTACGCCCA GTCGGCGCTG CGAGTGATCT GCTGTCGGTT CGGTCCCTGC1260TGGCGTCAAT TGACGGCGCG GGCAACAGCA GCATTGGCGG CGCCATCCTC CGCGCGGCCG1320GCGCCCACCG CTACAACC 1338(2)SEQ ID NO:154的信息(ⅰ)序列特征(A)长度321碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:154:CCGGCGGCAC CGGCGGCACC GGCGGTACCG GCGGCAACGG CGCTGACGCC GCTGCTGTGG 60TGGGCTTCGG CGCGAACGGC GACCCTGGCT TCGCTGGCGG CAAAGGCGGT AACGGCGGAA 120TAGGTGGGGC CGCGGTGACA GGCGGGGTCG CCGGCGACGG CGGCACCGGC GGCAAAGGTG 180GCACCGGCGG TGCCGGCGGC GCCGGCAACG ACGCCGGCAG CACCGGCAAT CCCGGCGGTA 240AGGGCGGCGA CGGCGGGATC GGCGGTGCCG GCGGGGCCGG CGGCGCGGCC GGCACCGGCA 300ACGGCGGCCA TGCCGGCAAC C 321(2)SEQ ID NO:155的信息(ⅰ)序列特征(A)长度492碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:155:GAAGACCCGG CCCCGCCATA TCGATCGGCT CGCCGACTAC TTTCGCCGAA CGTGCACGCG 60GCGGCGTCGG GCTGATCATC ACCGGTGGCT ACGCGCCCAA CCGCACCGGA TGGCTGCTGC 120CGTTCGCCTC CGAACTCGTC ACTTCGGCGC AAGCCCGACG GCACCGCCGA ATCACCAGGG 180CGGTCCACGA TTCGGGTGCA AAGATCCTGC TGCAAATCCT GCACGCCGGA CGCTACGCCT 240ACCACCCACT TGCGGTCAGC GCCTCGCCGA TCAAGGCGCC GATCACCCCG TTTCGTCCGC 300GAGCACTATC GGCTCGCGGG GTCGAAGCGA CCATCGCGGA TTTCGCCCGC TGCGCGCAGT 360TGGCCCGCGA TGCCGGCTAC GACGGCGTCG AAATCATGGG CAGCGAAGGG TATCTGCTCA 420ATCAGTTCCT GGCGCCGCGC ACCAACAAGC GCACCGACTC GTGGGGCGGC ACACCGGCCA 480ACCGTCGCCG GT 492(2)SEQ ID NO:156的信息(ⅰ)序列特征(A)长度536氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:156:Phe Ala Gln His Leu Val Glu Gly Asp Ala Val Glu Leu Trp Arg Ala1 5 10 15Asn Ala Ala Asp Gln Ala Asp Pro Leu Gln Pro Gly Ser Ala Arg Arg20 25 30Gln Arg Ala Ser Arg Ser Pro Arg Arg Leu Ala Gly Pro Asn Ala Tyr35 40 45His Tyr Ser Asn Asn Arg Ser Ile Leu Cys Gln Arg Trp Pro Leu Pro
50 55 60Ser Ala Ala Gln Asp Val Ile Cys His Leu Cys Pro His Arg Gln Glu65 70 75 80Pro Gly Leu Met Thr Ala Phe Gly Val Glu Pro Tyr Gly Gln Pro Lys85 90 95Tyr Leu Glu Ile Ala Gly Lys Arg Met Ala Tyr Ile Asp Glu Gly Lys100 105 110Gly Asp Ala Ile Val Phe Gln His Gly Asn Pro Thr Ser Ser Tyr Leu115 120 125Trp Arg Asn Ile Met Pro His Leu Glu Gly Leu Gly Arg Leu Val Ala130 135 140Cys Asp Leu Ile Gly Met Gly Ala Ser Asp Lys Leu Ser Pro Ser Gly145 150 155 160Pro Asp Arg Tyr Ser Tyr Gly Glu Gln Arg Asp Phe Leu Phe Ala Leu165 170 175Trp Asp Ala Leu Asp Leu Gly Asp His Val Val Leu Val Leu His Asp180 185 190Trp Gly Ser Ala Leu Gly Phe Asp Trp Ala Asn Gln His Arg Asp Arg195 200 205Val Gln Gly Ile Ala Phe Met Glu Ala Ile Val Thr Pro Met Thr Trp210 215 220Ala Asp Trp Pro Pro Ala Val Arg Gly Val Phe Gln Gly Phe Arg Ser225 230 235 240Pro Gln Gly Glu Pro Met Ala Leu Glu His Asn Ile Phe Val Glu Arg245 250 255Val Leu Pro Gly Ala Ile Leu Arg Gln Leu Ser Asp Glu Glu Met Asn260 265 270His Tyr Arg Arg Pro Phe Val Asn Gly Gly Glu Asp Arg Arg Pro Thr275 280 285Leu Ser Trp Pro Arg Asn Leu Pro Ile Asp Gly Glu Pro Ala Glu Val290 295 300Val Ala Leu Val Asn Glu Tyr Arg Ser Trp Leu Glu Glu Thr Asp Met305 310 315 320Pro Lys Leu Phe Ile Asn Ala Glu Pro Gly Ala Ile Ile Thr Gly Arg325 330 335Ile Arg Asp Tyr Val Arg Ser Trp Pro Asn Gln Thr Glu Ile Thr Val340 345 350Pro Gly Val His Phe Val Gln Glu Asp Ser Asp Gly Val Val Ser Trp355 360 365Ala Gly Ala Arg Gln His Arg Arg Pro Gly Ser Ala Leu Ile Ser Arg370 375 380Asp Gln Glu Cys Asp Phe Arg Arg Arg Arg Arg Pro Ala Cys Gln Leu385 390 395 400Ile Arg Leu Pro Ala Pro Gly Arg Asp Ser Gln Gly Lys Gly His Gln405 410 415Ser Gln Pro Leu Pro Ser Gln Arg Gly Arg Gln Ile Tyr Val Ala Gly420 425 430Gln Arg Ser Ser Tyr Leu Pro Ser Glu Leu Val Ala Ala Phe Leu Trp435 440 445Ala Gln Phe Glu Glu Ala Glu Arg Ile Thr Arg Ile Arg Leu Asp Leu450 455 460Trp Asn Arg Tyr His Glu Ser Phe Glu Ser Leu Glu Gln Arg Gly Leu465 470 475 480Leu Arg Arg Pro Ile Ile Pro Gln Gly Cys Ser His Asn Ala His Met485 490 495Tyr Tyr Val Leu Leu Ala Pro Ser Ala Asp Arg Glu Glu Val Leu Ala500 505 510Arg Leu Thr Ser Glu Gly Ile Gly Ala Val Phe His Tyr Val Pro Leu515 520 525His Asp Ser Pro Ala Gly Arg Arg530 535(2)SEQ ID NO:157的信息(ⅰ)序列特征(A)长度284氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:157:
Asn Glu Ser Ala Pro Arg Ser Pro Met Leu Pro Ser Ala Arg Pro Arg1 5 10 15Tyr Asp Ala Ile Ala Val Leu Leu Asn Glu Met His Ala Gly His Cys20 25 30Asp Phe Gly Leu Val Gly Pro Ala Pro Asp Ile Val Thr Asp Ala Ala35 40 45Gly Asp Asp Arg Ala Gly Leu Gly Val Asp Glu Gln Phe Arg His Val50 55 60Gly Phe Leu Glu Pro Ala Pro Val Leu Val Asp Gln Arg Asp Asp Leu65 70 75 80Gly Gly Leu Thr Val Asp Trp Lys Val Ser Trp Pro Arg Gln Arg Gly85 90 95Ala Thr Val Leu Ala Ala Val His Glu Trp Pro Pro Ile Val Val His100 105 110Phe Leu Val Ala Glu Leu Ser Gln Asp Arg Pro Gly Gln His Pro Phe115 120 125Asp Lys Asp Val Val Leu Gln Arg His Trp Leu Ala Leu Arg Arg Ser130 135 140Glu Thr Leu Glu His Thr Pro His Gly Arg Arg Pro Val Arg Pro Arg145 150 155 160His Arg Gly Asp Asp Arg Phe His Glu Arg Asp Pro Leu His Ser Val165 170 175Ala Met Leu Val Ser Pro Val Glu Ala Glu Arg Arg Ala Pro Val Val180 185 190Gln His Gln Tyr His Val Val Ala Glu Val Glu Arg Ile Pro Glu Arg195 200 205Glu Gln Lys Val Ser Leu Leu Ala Ile Ala Ile Ala Val Gly Ser Arg210 215 220Trp Ala Glu Leu Val Arg Arg Ala His Pro Asp Gln Ile Ala Gly His225 230 235 240Gln Pro Ala Gln Pro Phe Gln Val Arg His Asp Val Ala Pro Gln Val245 250 255Arg Arg Arg Gly Val Ala Val Leu Lys Asp Asp Gly Val Thr Leu Ala260 265 270Phe Val Asp Ile Arg His Ala Leu Pro Gly Asp Phe275 280(2)SEQ ID NO:158的信息(ⅰ)序列特征(A)长度264碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:158:ATGAACATGT CGTCGGTGGT GGGTCGCAAG GCCTTTGCGC GATTCGCCGG CTACTCCTCC 60GCCATGCACG CGATCGCCGG TTTCTCCGAT GCGTTGCGCC AAGAGCTGCG GGGTAGCGGA 120ATCGCCGTCT CGGTGATCCA CCCGGCGCTG ACCCAGACAC CGCTGTTGGC CAACGTCGAC 180CCCGCCGACA TGCCGCCGCC GTTTCGCAGC CTCACGCCCA TTCCCGTTCA CTGGGTCGCG 240GCAGCGGTGC TTGACGGTGT GGCG264(2)SEQ ID NO:159的信息(ⅰ)序列特征(A)长度1171碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:159:TAGTCGGCGA CGATGACGTC GCGGTCCAGG CCGACCGCTT CAAGCACCAG CGCGACCACG 60AAGCCGGTGC GATCCTTACC CGCGAAGCAG TGGGTGAGCA CCGGGCGTCC GGCGGCAAGC 120AGTGTGACGA CACGATGTAG CGCGCGCTGT GCTCCATTGC GCGTTGGGAA TTGGCGATAC 180TCGTCGGTCA TGTAGCGGGT GGCCGCGTCA TTTATCGACT GGCTGGATTC GCCGGACTCG 240CCGTTGGACC CGTCATTGGT TAGCAGCCTC TTGAATGCGG TTTCGTGCGG CGCTGAGTCG 300TCGGCGTCAT CATCGGCGAG GTCGGGGAAC GGCAGCAGGT GGACGTCGAT GCCGTCCGGA 360ACCCGTCCTG GACCGCGGCG GGCAACCTCC CGGGACGACC GCAGGTCGGC AACGTCGGTG 420ATCCCCAGCC GGCGCAGCGT TGCCCCTCGT GCCGAATTCG GCACGAGGCT GGCGAGCCAC 480CGGGCATCAC CAAGCAACGC TTGCCCAGTA CGGATCGTCA CTTCCGCATC CGGCAGACCA 540ATCTCCTCGC CGCCCATCGT CAGATCCCGC TCGTGCGTTG ACAAGAACGG CCGCAGATGT 600GCCAGCGGGT ATCGGAGATT GAACCGCGCA CGCAGTTCTT CAATCGCTGC GCGCTGCCGC 660ACTATTGGCA CTTTCCGGCG GTCGCGGTAT TCAGCAAGCA TGCGAGTCTC GACGAACTCG 720CCCCACGTAA CCCACGGCGT AGCTCCCGGC GTGACGCGGA GGATCGGCGG GTGATCTTTG 780CCGCCACGCT CGTAGCCGTT GATCCACCGC TTCGCGGTGC CGGCGGGGAG GCCGATCAGC 840TTATCGACCT CGGCGTATGC CGACGGCAAG CTGGGCGCGT TCGTCGAGGT CAAGAACTCC 900ACCATCGGCA CCGGCACCAA GGTGCCGCAC CTGACCTACG TCGGCGACGC CGACATCGGC 960GAGTACAGCA ACATCGGCGC CTCCAGCGTG TTCGTCAACT ACGACGGTAC GTCCAAACGG1020CGCACCACCG TCGGTTCGCA CGTACGGACC GGGTCCGACA CCATGTTCGT GGCCCCAGTA1080ACCATCGGCG ACGGCGCGTA TACCGGGGCC GGCACAGTGG TGCGGGAGGA TGTCCCGCCG1140GGGGCGCTGG CAGTGTCGGC GGGTCCGCAA C 1171(2)SEQ ID NO:160的信息(ⅰ)序列特征(A)长度227碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:160:GCAAAGGCGG CACCGGCGGG GCCGGCATGA ACAGCCTCGA CCCGCTGCTA GCCGCCCAAG 60ACGGCGGCCA AGGCGGCACC GGCGGCACCG GCGGCAACGC CGGCGCCGGC GGCACCAGCT 120TCACCCAAGG CGCCGACGGC AACGCCGGCA ACGGCGGTGA CGGCGGGGTC GGCGGCAACG 180GCGGAAACGG CGGAAACGGC GCAGACAACA CCACCACCGC CGCCGCC 227(2)SEQ ID NO:161的信息(ⅰ)序列特征(A)长度304碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:161:CCTCGCCACC ATGGGCGGGC AGGGCGGTAG CGGTGGCGCC GGCTCTACCC CAGGCGCCAA 60GGGCGCCCAC GGCTTCACTC CAACCAGCGG CGGCGACGGC GGCGACGGCG GCAACGGCGG 120CAACTCCCAA GTGGTCGGCG GCAACGGCGG CGACGGCGGC AATGGCGGCA ACGGCGGCAG 180CGCCGGCACG GGCGGCAACG GCGGCCGCGG CGGCGACGGC GCGTTTGGTG GCATGAGTGC 240CAACGCCACC AACCCTGGTG AAAACGGGCC AAACGGTAAC CCCGGCGGCA ACGGTGGCGC 300CGGC 304(2)SEQ ID NO:162的信息(ⅰ)序列特征(A)长度1439碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:162:GTGGGACGCT GCCGAGGCTG TATAACAAGG ACAACATCGA CCAGCGCCGG CTCGGTGAGC 60TGATCGACCT ATTTAACAGT GCGCGCTTCA GCCGGCAGGG CGAGCACCGC GCCCGGGATC 120TGATGGGTGA GGTCTACGAA TACTTCCTCG GCAATTTCGC TCGCGCGGAA GGGAAGCGGG 180GTGGCGAGTT CTTTACCCCG CCCAGCGTGG TCAAGGTGAT CGTGGAGGTG CTGGAGCCGT 240CGAGTGGGCG GGTGTATGAC CCGTGCTGCG GTTCCGGAGG CATGTTTGTG CAGACCGAGA 300AGTTCATCTA CGAACACGAC GGCGATCCGA AGGATGTCTC GATCTATGGC CAGGAAAGCA 360TTGAGGAGAC CTGGCGGATG GCGAAGATGA ACCTCGCCAT CCACGGCATC GACAACAAGG 420GGCTCGGCGC CCGATGGAGT GATACCTTCG CCCGCGACCA GCACCCGGAC GTGCAGATGG 480ACTACGTGAT GGCCAATCCG CCGTTCAACA TCAAAGACTG GGCCCGCAAC GAGGAAGACC 540CACGCTGGCG CTTCGGTGTT CCGCCCGCCA ATAACGCCAA CTACGCATGG ATTCAGCACA 600TCCTGTACAA CTTGGCGCCG GGAGGTCGGG CGGGCGTGGT GATGGCCAAC GGGTCGATGT 660CGTCGAACTC CAACGGCAAG GGGGATATTC GCGCGCAAAT CGTGGAGGCG GATTTGGTTT 720CCTGCATGGT CGCGTTACCC ACCCAGCTGT TCCGCAGCAC CGGAATCCCG GTGTGCCTGT 780GGTTTTTCGC CAAAAACAAG GCGGCAGGTA AGCAAGGGTC TATCAACCGG TGCGGGCAGG 840TGCTGTTCAT CGACGCTCGT GAACTGGGCG ACCTAGTGGA CCGGGCCGAG CGGGCGCTGA 900CCAACGAGGA GATCGTCCGC ATCGGGGATA CCTTCCACGC GAGCACGACC ACCGGCAACG 960CCGGCTCCGG TGGTGCCGGC GGTAATGGGG GCACTGGCCT CAACGGCGCG GGCGGTGCTG1020GCGGGGCCGG CGGCAACGCG GGTGTCGCCG GCGTGTCCTT CGGCAACGCT GTGGGCGGCG1080ACGGCGGCAA CGGCGGCAAC GGCGGCCACG GCGGCGACGG CACGACGGGC GGCGCCGGCG1140GCAAGGGCGG CAACGGCAGC AGCGGTGCCG CCAGCGGCTC AGGCGTCGTC AACGTCACCG1200CCGGCCACGG CGGCAACGGC GGCAATGGCG GCAACGGCGG CAACGGCTCC GCGGGCGCCG1260GCGGCCAGGG CGGTGCCGGC GGCAGCGCCG GCAACGGCGG CCACGGCGGC GGTGCCACCG1320GCGGCGCCAG CGGCAAGGGC GGCAACGGCA CCAGCGGTGC CGCCAGCGGC TCAGGCGTCA1380TCAACGTCAC CGCCGGCCAC GGCGGCAACG GCGGCAATGG CCGCAACGGC GGCAACGGC 1439(2)SEQ ID NO:163的信息(ⅰ)序列特征(A)长度329碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:163:GGGCCGGCGG GGCCGGATTT TCTCGTGCCT TGATTGTCGC TGGGGATAAC GGCGGTGATG 60GTGGTAACGG CGGGATGGGC GGGGCTGGCG GGGCTGGCGG CCCCGGCGGG GCCGGCGGCC 120TGATCAGCCT GCTGGGCGGC CAAGGCGCCG GCGGGGCCGG CGGGACCGGC GGGGCCGGCG 180GTGTTGGCGG TGACGGCGGG GCCGGCGGCC CCGGCAACCA GGCCTTCAAC GCAGGTGCCG 240GCGGGGCCGG CGGCCTGATC AGCCTGCTGG GCGGCCAAGG CGCCGGCGGG GCCGGCGGGA 300CCGGCGGGGC CGGCGGTGTT GGCGGTGAC 329(2)SEQ ID NO:164的信息(ⅰ)序列特征(A)长度80碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:164:GCAACGGTGG CAACGGCGGC ACCAGCACGA CCGTGGGGAT GGCCGGAGGT AACTGTGGTG 60CCGCCGGGCT GATCGGCAAC 80(2)SEQ ID NO:165的信息(ⅰ)序列特征(A)长度392碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:165:GGGCTGTGTC GCACTCACAC CGCCGCATTC GGCGACGTTG GCCGCCCAAT ATCCAGCTCA 60AGGCCTACTA CTTACCGTCG GAGGACCGCC GCATCAAGGT GCGGGTCAGC GCCCAAGGAA 120TCAAGGTCAT CGACCGCGAC GGGCATCGAG GCCGTCGTCG CGCGGCTCGG GCAGGATCCG 180CCCCGGCGCA CTTCGCGCGC CAAGCGGGCT CATCGCTCCG AACGGCGGCG ATCCTGTGAG 240CACAACTGAT GGCGCGCAAC GAGATTCGTC CAATTGTCAA GCCGTGTTCG ACCGCAGGGA 300CCGGTTATAC GTATGTCAAC CTATGTCACT CGCAAGAACC GGCATAACGA TCCCGTGATC 360CGCCGACAGC CCACGAGTGC AAGACCGTTA CA 392(2)SEQ ID NO:166的信息(ⅰ)序列特征(A)长度535碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:166:ACCGGCGCCA CCGGCGGCAC CGGGTTCGCC GGTGGCGCCG GCGGGGCCGG CGGGCAGGGC 60GGTATCAGCG GTGCCGGCGG CACCAACGGC TCTGGTGGCG CTGGCGGCAC CGGCGGACAA 120GGCGGCGCCG GGGGCGCTGG CGGGGCCGGC GCCGATAACC CCACCGGCAT CGGCGGCGCC 180GGCGGCACCG GCGGCACCGG CGGAGCGGCC GGAGCCGGCG GGGCCGGTGG CGCCATCGGT 240ACCGGCGGCA CCGGCGGCGC GGTGGGCAGC GTCGGTAACG CCGGGATCGG CGGTACCGGC 300GGTACGGGTG GTGTCGGTGG TGCTGGTGGT GCAGGTGCGG CTGCGGCCGC TGGCAGCAGC 360GCTACCGGTG GCGCCGGGTT CGCCGGCGGC GCCGGCGGAG AAGGCGGACC GGGCGGCAAC 420AGCGGTGTGG GCGGCACCAA CGGCTCCGGC GGCGCCGGCG GTGCAGGCGG CAAGGGCGGC 480ACCGGAGGTG CCGGCGGGTC CGGCGCGGAC AACCCCACCG GTGCTGGTTT CGCCG 535(2)SEQ ID NO:167的信息(ⅰ)序列特征(A)长度690碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:167:CCGACGTCGC CGGGGCGATA CGGGGGTCAC CGACTACTAC ATCATCCGCA CCGAGAATCG 60GCCGCTGCTG CAACCGCTGC GGGCGGTGCC GGTCATCGGA GATCCGCTGG CCGACCTGAT 120CCAGCCGAAC CTGAAGGTGA TCGTCAACCT GGGCTACGGC GACCCGAACT ACGGCTACTC 180GACGAGCTAC GCCGATGTGC GAACGCCGTT CGGGCTGTGG CCGAACGTGC CGCCTCAGGT 240CATCGCCGAT GCCCTGGCCG CCGGAACACA AGAAGGCATC CTTGACTTCA CGGCCGACCT 300GCAGGCGCTG TCCGCGCAAC CGCTCACGCT CCCGCAGATC CAGCTGCCGC AACCCGCCGA 360TCTGGTGGCC GCGGTGGCCG CCGCACCGAC GCCGGCCGAG GTGGTGAACA CGCTCGCCAG 420GATCATCTCA ACCAACTACG CCGTCCTGCT GCCCACCGTG GACATCGCCC TCGCCTGGTC 480ACCACCCTGC CGCTGTACAC CACCCAACTG TTCGTCAGGC AACTCGCTGC GGGCAATCTG 540ATCAACGCGA TCGGCTATCC CCTGGCGGCC ACCGTAGGTT TAGGCACGAT CGATAGCGGG 600CGGCGTGGAA TTGCTCACCC TCCTCGCGGC GGCCTCGGAC ACCGTTCGAA ACATCGAGGG 660CCTCGTCACC TAACGGATTC CCGACGGCAT 690(2)SEQ ID NO:168的信息(ⅰ)序列特征(A)长度407碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:168:ACGGTGACGG CGGTACTGGC GGCGGCCACG GCGGCAACGG CGGGAATCCC GGGTGGCTCT 60TGGGCACAGC CGGGGGTGGC GGCAACGGTG GCGCCGGCAG CACCGGTACT GCAGGTGGCG 120GCTCTGGGGG CACCGGCGGC GACGGCGGGA CCGGCGGGCG TGGCGGCCTG TTAATGGGCG 180CCGGCGCCGG CGGGCACGGT GGCACTGGCG GCGCGGGCGG TGCCGGTGTC GACGGTGGCG 240GCGCCGGCGG GGCCGGCGGG GCCGGCGGCA ACGGCGGCGC CGGGGGTCAA GCCGCCCTGC 300TGTTCGGGCG CGGCGGCACC GGCGGAGCCG GCGGCTACGG CGGCGATGGC GGTGGCGGCG 360GTGACGGCTT CGACGGCACG ATGGCCGGCC TGGGTGGTAC CGGTGGC 407(2)SEQ ID NO:169的信息(ⅰ)序列特征(A)长度468碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:169:GATCGGTCAG CGCATCGCCC TCGGCGGCAA GCGATTCCGC GGTCTCACCG AAGAACATCG 60TGCACGCGGC GGCGCGGACC AGCCCGCTGC GCTGCGGCGC GTCGAACGCC TCCAGCAGGC 120ACAGCCAGTC CTTGGCGGCC TGCGAGGCGA ACACGTCGGT GTCACCGGTG TAGATCGCCG 180GGATGCCCGC CTCCGCCAAC GCATTCCGGC ACGCCCGCGC GTCTTTGTGA TGCTCGACGA 240TCACCGCGAT GTCTGCGGCC ACCACGGGCC GCCCGGCGAA GGTGGCCCCG CTGGCCAGTA 300GCGCCGCGAC GTCGGCGGCC AGGTCGTCGG GGATGTGCCG GCGCAGCGCT CCGGCGCGAC 360GCCCGAAAAA CGACCCCTCA CCCAGCTGGG TCCCGCTGGC ATATCCCTTG CCGTCCTGGG 420CGATATTGGA CGCGCATGCC CCGACCGCGT ACAGGCCGGC CACCACCG 468(2)SEQ ID NO:170的信息(ⅰ)序列特征(A)长度219碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:170:GGTGGTAACG GCGGCCAGGG TGGCATCGGC GGCGCCGGCG AGAGAGGCGC CGACGGCGCC 60GGCCCCAATG CTAACGGCGC AAACGGCGAG AACGGCGGTA GCGGTGGTAA CGGTGGCGAC 120GGCGGCGCCG GCGGCAATGG CGGCGCGGGC GGCAACGCGC AGGCGGCCGG GTACACCGAC 180GGCGCCACGG GCACCGGCGG CGACGGCGGC AACGGCGGC219(2)SEQ ID NO:171的信息(ⅰ)序列特征(A)长度494碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:171:TAGCTCCGGC GAGGGCGGCA AGGGCGGCGA CGGTGGCCAC GGCGGTGACG GCGTCGGCGG 60CAACAGTTCC GTCACCCAAG GCGGCAGCGG CGGTGGCGGC GGCGCCGGCG GCGCCGGCGG 120CAGCGGCTTT TTCGGCGGCA AGGGCGGCTT CGGCGGCGAC GGCGGTCAGG GCGGCCCCAA 180CGGCGGCGGT ACCGTCGGCA CCGTGGCCGG TGGCGGCGGC AACGGCGGTG TCGGCGGCCG 240GGGCGGCGAC GGCGTCTTTG CCGGTGCCGG CGGCCAGGGC GGCCTCGGTG GGCAGGGCGG 300CAATGGCGGC GGCTCCACCG GCGGCAACGG CGGCCTTGGC GGCGCGGGCG GTGGCGGAGG 360CAACGCCCCG GCTCGTGCCG AATCCGGGCT GACCATGGAC AGCGCGGCCA AGTTCGCTGC 420CATCGCATCA GGCGCGTACT GCCCCGAACA CCTGGAACAT CACCCGAGTT AGCGGGGCGC 480ATTTCCTGAT CACC 494(2)SEQ ID NO:172的信息(ⅰ)序列特征(A)长度220碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:172:GGGCCGGTGG TGCCGCGGGC CAGCTCTTCA GCGCCGGAGG CGCGGCGGGT GCCGTTGGGG 60TTGGCGGCAC CGGCGGCCAG GGTGGGGCTG GCGGTGCCGG AGCGGCCGGC GCCGACGCCC 120CCGCCAGCAC AGGTCTAACC GGTGGTACCG GGTTCGCTGG CGGGGCCGGC GGCGTCGGCG 180GCCAGAGCGG CAACGCCATT GCCGGCGGCA TCAACGGCTC 220(2)SEQ ID NO:173的信息(ⅰ)序列特征(A)长度388碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:173:ATGGCGGCAA CGGGGGCCCC GGCGGTGCTG GCGGGGCCGG CGACTACAAT TTCCAACGGC 60GGGCAGGGTG GTGCCGGCGG CCAAGGCGGC CAAGGCGGCC TGGGCGGGGC AAGCACCACC 120TGATCGGCCT AGCCGCACCC GGGAAAGCCG ATCCAACAGG CGACGATGCC GCCTTCCTTG 180CCGCGTTGGA CCAGGCCGGC ATCACCTACG CTGACCCAGG CCACGCCATA ACGGCCGCCA 240AGGCGATGTG TGGGCTGTGT GCTAACGGCG TAACAGGTCT ACAGCTGGTC GCGGACCTGC 300GGGACTACAA TCCCGGGCTG ACCATGGACA GCGCGGCCAA GTTCGCTGCC ATCGCATCAG 360GCGCGTACTG CCCCGAACAC CTGGAACA388(2)SEQ ID NO:174的信息(ⅰ)序列特征(A)长度400碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:174:GCAAAGGCGG CACCGGCGGG GCCGGCATGA ACAGCCTCGA CCCGCTGCTA GCCGCCCAAG 60ACGGCGGCCA AGGCGGCACC GGCGGCACCG GCGGCAACGC CGGCGCCGGC GGCACCAGCT 120TCACCCAAGG CGCCGACGGC AACGCCGGCA ACGGCGGTGA CGGCGGGGTC GGCGGCAACG 180GCGGAAACGG CGGAAACGGC GCAGACAACA CCACCACCGC CGCCGCCGGC ACCACAGGCG 240GCGACGGCGG GGCCGGCGGG GCCGGCGGAA CCGGCGGAAC CGGCGGAGCC GCCGGCACCG 300GCACCGGCGG CCAACAAGGC AACGGCGGCA ACGGCGGCAC CGGCGGCAAA GGCGGCACCG 360GCGGCGACGG TGCACTCTCA GGCAGCACCG GTGGTGCCGG 400(2)SEQ ID NO:175的信息(ⅰ)序列特征(A)长度538碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:175:GGCAACGGCG GCAACGGCGG CATCGCCGGC ATTGGGCGGC AACGGCGTTC CGGGACGGGC 60AGCGGCAACG GCGGCCAACG GCGGCAGCGG CGGCAACGGC GGCAACGCCG GCATGGGCGG 120CAACAGCGGC ACCGGCAGCG GCGACGGCGG TGCCGGCGGG AACGGCGGCG CGGCGGGCAC 180GGGCGGCACC GGCGGCGACG GCGGCCTCAC CGGTACTGGC GGCACCGGCG GCAGCGGTGG 240CACCGGCGGT GACGGCGGTA ACGGCGGCAA CGGAGCAGAT AACACCGCAA ACATGACTGC 300GCAGGCGGGC GGTGACGGTG GCAACGGCGG CGACGGTGGC TTCGGCGGCG GGGCCGGGGC 360CGGCGGCGGT GGCTTGACCG CTGGCGCCAA CGGCACCGGC GGGCAAGGCG GCGCCGGCGG 420CGATGGCGGC AACGGGGCCA TCGGCGGCCA CGGCCCACTC ACTGACGACC CCGGCGGCAA 480CGGGGGCACC GGCGGCAACG GCGGCACCGG CGGCACCGGC GGCGCGGGCA TCGGCAGC 538(2)SEQ ID NO:176的信息(ⅰ)序列特征(A)长度239碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:176:GGGCCGGTGG TGCCGCGGGC CAGCTCTTCA GCGCCGGAGG CGCGGCGGGT GCCGTTGGGG 60TTGGCGGCAC CGGCGGCCAG GGTGGGGCTG GCGGTGCCGG AGCGGCCGGC GCCGACGCCC 120CCGCCAGCAC AGGTCTAACC GGTGGTACCG GGTTCGCTGG CGGGGCCGGC GGCGTCGGCG 180GCCACGGCGG CAACGCCATT GCCGGCGGCA TCAACGGCTC CGGTGGTGCC GGCGGCACC 239(2)SEQ ID NO:177的信息(ⅰ)序列特征(A)长度985碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:177:AGCAGCGCTA CCGGTGGCGC CGGGTTCGCC GGCGGCGCCG GCGGAGAAGG CGGAGCGGGC 60GGCAACAGCG GTGTGGGCGG CACCAACGGC TCCGGCGGCG CCGGCGGTGC AGGCGGCAAG 120GGCGGCACCG GAGGTGCCGG CGGGTCCGGC GCGGACAACC CCACCGGTGC TGGTTTCGCC 180GGTGGCGCCG GCGGCACAGG TGGCGCGGCC GGCGCCGGCG GGGCCGGCGG GGCGACCGGT 240ACCGGCGGCA CCGGCGGCGT TGTCGGCGCC ACCGGTAGTG CAGGCATCGG CGGGGCCGGC 300GGCCGCGGCG GTGACGGCGG CGATGGGGCC AGCGGTCTCG GCCTGGGCCT CTCCGGCTTT 360GACGGCGGCC AAGGCGGCCA AGGCGGGGCC GGCGGCAGCG CCGGCGCCGG CGGCATCAAC 420GGGGCCGGCG GGGCCGGCGG CAACGGCGGC GACGGCGGGG ACGGCGCAAC CGGTGCCGCA 480GGTCTCGGCG ACAACGGCGG GGTCGGCGGT GACGGTGGGG CCGGTGGCGC CGCCGGCAAC 540GGCGGCAACG CGGGCGTCGG CCTGACAGCC AAGGCCGGCG ACGGCGGCGC CGCGGGCAAT 600GGCGGCAACG GGGGCGCCGG CGGTGCTGGC GGGGCCGGCG ACAACAATTT CAACGGCGGC 660CAGGGTGGTG CCGGCGGCCA AGGCGGCCAA GGCGGCTTGG GCGGGGCAAG CACCACCTGA 720TCGGCCTAGC CGCACCCGGG AAAGCCGATC CAACAGGCGA CGATGCCGCC TTCCTTGCCG 780CGTTGGACCA GGCCGGCATC ACCTACGCTG ACCCAGGCCA CGCCATAACG GCCGCCAAGG 840CGATGTGTGG GCTGTGTGCT AACGGCGTAA CAGGTCTACA GCTGGTCGCG GACCTGCGGG 900AATACAATCC CGGGCTGACC ATGGACAGCG CGGCCAAGTT CGCTGCCATC GCATCAGGCG 960CGTACTGCCC CGAACACCTG GAACA 985(2)SEQ ID NO:178的信息(ⅰ)序列特征(A)长度2138碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:178:CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300CCATCACACC GTGCGAACTC ACGGCGGCTA AAAACGCCGC CCAACAGCTG GTATTGTCCG 360CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420CGCTGCGCAA CGCGGCCAAG GCGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTTTG 660CGGATGGGTG GAACACTTTC AACCTGACGC TGCAAGGCGA CGTCAAGCGG TTCCGGGGGT 720TTGACAACTG GGAAGGCGAT GCGGCTACCG CTTGCGAGGC TTCGCTCGAT CAACAACGGC 780AATGGATACT CCACATGGCC AAATTGAGCG CTGCGATGGC CAAGCAGGCT CAATATGTCG 840CGCAGCTGCA CGTGTGGGCT AGGCGGGAAC ATCCGACTTA TGAAGACATA GTCGGGCTCG 900AACGGCTTTA CGCGGAAAAC CCTTCGGCCC GCGACCAAAT TCTCCCGGTG TACGCGGAGT 960ATCAGCAGAG GTCGGAGAAG GTGCTGACCG AATACAACAA CAAGGCAGCC CTGGAACCGG1020TAAACCCGCC GAAGCCTCCC CCCGCCATCA AGATCGACCC GCCCCCGCCT CCGCAAGAGC1080AGGGATTGAT CCCTGGCTTC CTGATGCCGC CGTCTGACGG CTCCGGTGTG ACTCCCGGTA1140CCGGGATGCC AGCCGCACCG ATGGTTCCGC CTACCGGATC GCCGGGTGGT GGCCTCCCGG1200CTGACACGGC GGCGCAGCTG ACGTCGGCTG GGCGGGAAGC CGCAGCGCTG TCGGGCGACG1260TGGCGGTCAA AGCGGCATCG CTCGGTGGCG GTGGAGGCGG CGGGGTGCCG TCGGCGCCGT1320TGGGATCCGC GATCGGGGGC GCCGAATCGG TGCGGCCCGC TGGCGCTGGT GACATTGCCG1380GCTTAGGCCA GGGAAGGGCC GGCGGCGGCG CCGCGCTGGG CGGCGGTGGC ATGGGAATGC1440CGATGGGTGC CGCGCATCAG GGACAAGGGG GCGCCAAGTC CAAGGGTTCT CAGCAGGAAG1500ACGAGGCGCT CTACACCGAG GATCGGGCAT GGACCGAGGC CGTCATTGGT AACCGTCGGC1560GCCAGGACAG TAAGGAGTCG AAGTGAGCAT GGACGAATTG GACCCGCATG TCGCCCGGGC1620GTTGACGCTG GCGGCGCGGT TTCAGTCGGC CCTAGACGGG ACGCTCAATC AGATGAACAA1680CGGATCCTTC CGCGCCACCG ACGAAGCCGA GACCGTCGAA GTGACGATCA ATGGGCACCA1740GTGGCTCACC GGCCTGCGCA TCGAAGATGG TTTGCTGAAG AAGCTGGGTG CCGAGGCGGT1800GGCTCAGCGG GTCAACGAGG CGCTGCACAA TGCGCAGGCC GCGGCGTCCG CGTATAACGA1860CGCGGCGGGC GAGCAGCTGA CCGCTGCGTT ATCGGCCATG TCCCGCGCGA TGAACGAAGG1920AATGGCCTAA GCCCATTGTT GCGGTGGTAG CGACTACGCA CCGAATGAGC GCCGCAATGC1980GGTCATTCAG CGCGCCCGAC ACGGCGTGAG TACGCATTGT CAATGTTTTG ACATGGATCG2040GCCGGGTTCG GAGGGCGCCA TAGTCCTGGT CGCCAATATT GCCGCAGCTA GCTGGTCTTA2100GGTTCGGTTA CGCTGGTTAA TTATGACGTC CGTTACCA2138(2)SEQ ID NO:179的信息(ⅰ)序列特征(A)长度460氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:179:Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn1 5 10 15Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val20 25 30Pro Ile Thr Pro Cys Glu Leu Thr Ala Ala Lys Asn Ala Ala Gln Gln35 40 45Leu Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala50 55 60Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Ala65 70 75 80Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly85 90 95Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser100 105 110Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro115 120 125Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp130 135 140Gln Gly Ala Ser Leu Ala His Phe Ala Asp Gly Trp Asn Thr Phe Asn145 150 155 160Leu Thr Leu Gln Gly Asp Val Lys Arg Phe Arg Gly Phe Asp Asn Trp165 170 175Glu Gly Asp Ala Ala Thr Ala Cys Glu Ala Ser Leu Asp Gln Gln Arg180 185 190Gln Trp Ile Leu His Met Ala Lys Leu Ser Ala Ala Met Ala Lys Gln195 200 205Ala Gln Tyr Val Ala Gln Leu His Val Trp Ala Arg Arg Glu His Pro210 215 220Thr Tyr Glu Asp Ile Val Gly Leu Glu Arg Leu Tyr Ala Glu Asn Pro225 230 235 240Ser Ala Arg Asp Gln Ile Leu Pro Val Tyr Ala Glu Tyr Gln Gln Arg245 250 255Ser Glu Lys Val Leu Thr Glu Tyr Asn Asn Lys Ala Ala Leu Glu Pro260 265 270Val Asn Pro Pro Lys Pro Pro Pro Ala Ile Lys Ile Asp Pro Pro Pro275 280 285Pro Pro Gln Glu Gln Gly Leu Ile Pro Gly Phe Leu Met Pro Pro Ser290 295 300Asp Gly Ser Gly Val Thr Pro Gly Thr Gly Met Pro Ala Ala Pro Met305 310 315 320Val Pro Pro Thr Gly Ser Pro Gly Gly Gly Leu Pro Ala Asp Thr Ala325 330 335Ala Gln Leu Thr Ser Ala Gly Arg Glu Ala Ala Ala Leu Ser Gly Asp340 345 350Val Ala Val Lys Ala Ala Ser Leu Gly Gly Gly Gly Gly Gly Gly Val355 360 365Pro Ser Ala Pro Leu Gly Ser Ala Ile Gly Gly Ala Glu Ser Val Arg370 375 380Pro Ala Gly Ala Gly Asp Ile Ala Gly Leu Gly Gln Gly Arg Ala Gly385 390 395 400Gly Gly Ala Ala Leu Gly Gly Gly Gly Met Gly Met Pro Met Gly Ala405 410 415Ala His Gln Gly Gln Gly Gly Ala Lys Ser Lys Gly Ser Gln Gln Glu420 425 430Asp Glu Ala Leu Tyr Thr Glu Asp Arg Ala Trp Thr Glu Ala Val Ile435 440 445Gly Asn Arg Arg Arg Gln Asp Ser Lys Glu Ser Lys450 455 460(2)SEQ ID NO:180的信息(ⅰ)序列特征(A)长度277氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:180:Ala Gly Asn Val Thr Ser Ala Ser Gly Pro His Arg Phe Gly Ala Pro1 5 10 15Asp Arg Gly Ser Gln Arg Arg Arg Arg His Pro Ala Ala Ser Thr Ala20 25 30Thr Glu Arg Cys Arg Phe Asp Arg His Val Ala Arg Gln Arg Cys Gly35 40 45Phe Pro Pro Ser Arg Arg Gln Leu Arg Arg Arg Val Ser Arg Glu Ala50 55 60Thr Thr Arg Arg Ser Gly Arg Arg Asn His Arg Cys Gly Trp His Pro65 70 75 80Gly Thr Gly Ser His Thr Gly Ala Val Arg Arg Arg His Gln Glu Ala85 90 95Arg Asp Cln Ser Leu Leu Leu Arg Arg Arg Gly Arg Val Asp Leu Asp100 105 110Gly Gly Gly Arg Leu Arg Arg Val Tyr Arg Phe Gln Gly Cys Leu Val115 120 125Val Val Phe Gly Gln His Leu Leu Arg Pro Leu Leu Ile Leu Arg Val130 135 140His Arg Glu Asn Leu Val Ala Gly Arg Arg Val Phe Arg Val Lys Pro145 150 155 160Phe Glu Pro Asp Tyr Val Phe Ile Ser Arg Met Phe Pro Pro Ser Pro165 170 175His Val Gln Leu Arg Asp Ile Leu Ser Leu Leu Gly His Arg Ser Ala180 185 190Gln Phe Gly His Val Glu Tyr Pro Leu Pro Leu Leu Ile Glu Arg Ser195 200 205Leu Ala Ser Gly Ser Arg Ile Ala Phe Pro Val Val Lys Pro Pro Glu210 215 220Pro Leu Asp Val Ala Leu Gln Arg Gln Val Glu Ser Val Pro Pro Ile225 230 235 240Arg Lys Val Arg Glu Arg Cys Ala Leu Val Ala Arg Phe Glu Leu Pro245 250 255Cys Arg Phe Phe Glu Ile His Glu Val Gly Phe Thr Gly Arg Gly His
260265 270Pro Arg Arg Ile Gly275(2)SEQ ID NO:181的信息(ⅰ)序列特征(A)长度192氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:181:Arg Val Ala Ala Ser Phe Ile Asp Trp Leu Asp Ser Pro Asp Ser Pro1 5 10 15Leu Asp Pro Ser Leu Val Ser Ser Leu Leu Asn Ala Val Ser Cys Gly20 25 30Ala Glu Ser Ser Ala Ser Ser Ser Ala Arg Ser Gly Asn Gly Ser Arg35 40 45Trp Thr Ser Met Pro Ser Gly Thr Arg Pro Gly Pro Arg Arg Ala Thr50 55 60Ser Arg Asp Asp Arg Arg Ser Ala Thr Ser Val Ile Pro Ser Arg Arg65 70 75 80Ser Val Ala Pro Arg Ala Glu Phe Gly Thr Arg Leu Ala Ser His Arg85 90 95Ala Ser Pro Ser Asn Ala Cys Pro Val Arg Ile Val Thr Ser Ala Ser100 105 110Gly Arg Pro Ile Ser Ser Pro Pro Ile Val Arg Ser Arg Ser Cys Val115 120 125Asp Lys Asn Gly Arg Arg Cys Ala Ser Gly Tyr Arg Arg Leu Asn Arg130 135 140Ala Arg Ser Ser Ser Ile Ala Ala Arg Cys Arg Thr Ile Gly Thr Phe145 150 155 160Arg Arg Ser Arg Tyr Ser Ala Ser Met Arg Val Ser Thr Asn Ser Pro165 170 175His Val Thr His Gly Val Ala Pro Gly Val Thr Arg Arg Ile Gly Gly180 185 190(2)SEQ ID NO:182的信息(ⅰ)序列特征(A)长度196氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:182:Gln Glu Arg Pro Gln Met Cys Gln Arg Val Ser Glu Ile Glu Pro Arg1 5 10 15Thr Gln Phe Phe Asn Arg Cys Ala Leu Pro His Tyr Trp His Phe Pro20 25 30Ala Val Ala Val Phe Ser Lys His Ala Ser Leu Asp Glu Leu Ala Pro35 40 45Arg Asn Pro Arg Arg Ser Ser Arg Arg Asp Ala Glu Asp Arg Arg Val50 55 60Ile Phe Ala Ala Thr Leu Val Ala Val Asp Pro Pro Leu Arg Gly Ala65 70 75 80Gly Gly Glu Ala Asp Gln Leu Ile Asp Leu Gly Val Cys Arg Arg Gln85 90 95Ala Gly Arg Val Arg Arg Gly Gln Glu Leu His His Arg His Arg His100 105 110Gln Gly Ala Ala Pro Asp Leu Arg Arg Arg Arg Arg His Arg Arg Val115 120 125Gln Gln His Arg Arg Leu Gln Arg Val Arg Gln Leu Arg Arg Tyr Val130 135 140Gln Thr Ala His His Arg Arg Phe Ala Arg Thr Asp Arg Val Arg His145 150 155 160His Val Arg Gly Pro Ser Asn His Arg Arg Arg Arg Val Tyr Arg Gly165 170 175Arg His Ser Gly Ala Gly Gly Cys Pro Ala Gly Gly Ala Gly Ser Val180 185 190Gly Gly Ser Ala195(2)SEQ ID NO:183的信息(ⅰ)序列特征
(A)长度311氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:183:Val Arg Cys Gly Thr Leu Val Pro Val Pro Met Val Glu Phe Leu Thr1 5 10 15Ser Thr Asn Ala Pro Ser Leu Pro Ser Ala Tyr Ala Glu Val Asp Lys20 25 30Leu Ile Gly Leu Pro Ala Gly Thr Ala Lys Arg Trp Ile Asn Gly Tyr35 40 45Glu Arg Gly Gly Lys Asp His Pro Pro Ile Leu Arg Val Thr Pro Gly50 55 60Ala Thr Pro Trp Val Thr Trp Gly Glu Phe Val Glu Thr Arg Met Leu65 70 75 80Ala Glu Tyr Arg Asp Arg Arg Lys Val Pro Ile Val Arg Gln Arg Ala85 90 95Ala Ile Glu Glu Leu Arg Ala Arg Phe Asn Leu Arg Tyr Pro Leu Ala100 105 110His Leu Arg Pro Phe Leu Ser Thr His Glu Arg Asp Leu Thr Met Gly115 120 125Gly Glu Glu Ile Gly Leu Pro Asp Ala Glu Val Thr Ile Arg Thr Gly130 135 140Gln Ala Leu Leu Gly Asp Ala Arg Trp Leu Ala Ser Leu Val Pro Asn145 150 155 160Ser Ala Arg Gly Ala Thr Leu Arg Arg Leu Gly Ile Thr Asp Val Ala165 170 175Asp Leu Arg Ser Ser Arg Glu Val Ala Arg Arg Gly Pro Gly Arg Val180 185 190Pro Asp Gly Ile Asp Val His Leu Leu Pro Phe Pro Asp Leu Ala Asp195 200 205Asp Asp Ala Asp Asp Ser Ala Pro His Glu Thr Ala Phe Lys Arg Leu210 215 220Leu Thr Asn Asp Gly Ser Asn Gly Glu Ser Gly Glu Ser Ser Gln Ser225 230 235 240Ile Asn Asp Ala Ala Thr Arg Tyr Met Thr Asp Glu Tyr Arg Gln Phe245 250 255Pro Thr Arg Asn Gly Ala Gln Arg Ala Leu His Arg Val Val Thr Leu260 265 270Leu Ala Ala Gly Arg Pro Val Leu Thr His Cys Phe Ala Gly Lys Asp275 280 285Arg Thr Gly Phe Val Val Ala Leu Val Leu Glu Ala Val Gly Leu Asp290 295 300Arg Asp Val Ile Val Ala Asp305 310(2)SEQ ID NO:184的信息(ⅰ)序列特征(A)长度2072碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:184:CTCGTGCCGA TTCGGCACGA GCTGAGCAGC CCAAGGGGCC GTTCGGCGAA GTCATCGAGG 60CATTCGCCGA CGGGCTGGCC GGCAAGGGTA AGCAAATCAA CACCACGCTG AACAGCCTGT 120CGCAGGCGTT GAACGCCTTG AATGAGGGCC GCGGCGACTT CTTCGCGGTG GTACGCAGCC 180TGGCGCTATT CGTCAACGCG CTACATCAGG ACGACCAACA GTTCGTCGCG TTGAACAAGA 240ACCTTGCGGA GTTCACCGAC AGGTTGACCC ACTCCGATGC GGACCTGTCG AACGCCATCC 300AGCAATTCGA CAGCTTGCTC GCCGTCGCGC GCCCGTTCTT CGCCAAGAAC CGCGAGGTGC 360TGACGCATGA CGTCAATAAT CTCGCGACCG TGACCACCAC GTTGCTGCAG CCCGATCCGT 420TGGATGGGTT GGAGACCGTC CTGCACATCT TCCCGACGCT GGCGGCGAAC ATTAACCAGC 480TTTACCATCC GACACACGGT GGCGTGGTGT CGCTTTCCGC GTTCACGAAT TTCGCCAACC 540CGATGGAGTT CATCTGCAGC TCGATTCAGG CGGGTAGCCG GCTCGGTTAT CAAGAGTCGG 600CCGAACTCTG TGCGCAGTAT CTGGCGCCAG TCCTCGATGC GATCAAGTTC AACTACTTTC 660CGTTCGGCCT GAACGTGGCC AGCACCGCCT CGACACTGCC TAAAGAGATC GCGTACTCCG 720AGCCCCGCTT GCAGCCGCCC AACGGGTACA AGGACACCAC GGTGCCCGGC ATCTGGGTGC 780CGGATACGCC GTTGTCACAC CGCAACACGC AGCCCGGTTG GGTGGTGGCA CCCGGGATGC 840AAGGGGTTCA GGTGGGACCG ATCACGCAGG GTTTGCTGAC GCCGGAGTCC CTGGCCGAAC 900TCATGGGTGG TCCCGATATC GCCCCTCCGT CGTCAGGGCT GCAAACCCCG CCCGGACCCC 960CGAATGCGTA CGACGAGTAC CCCGTGCTGC CGCCGATCGG TTTACAGGCC CCACAGGTGC1020CGATACCACC GCCGCCTCCT GGGCCCGACG TAATCCCGGG TCCGGTGCCA CCGGTCTTGG1080CGGCGATCGT GTTCCCAAGA GATCGCCCGG CAGCGTCGGA AAACTTCGAC TACATGGGCC1140TCTTGTTGCT GTCGCCGGGC CTGGCGACCT TCCTGTTCGG GGTGTCATCT AGCCCCGCCC1200GTGGAACGAT GGCCGATCGG CACGTGTTGA TACCGGCGAT CACCGGCCTG GCGTTGATCG1260CGGCATTCGT CGCACATTCG TGGTACCGCA CAGAACATCC GCTCATAGAC ATGCGCTTGT1320TCCAGAACCG AGCGGTCGCG CAGGCCAACA TGACGATGAC GGTGCTCTCC CTCGGGCTGT1380TTGGCTCCTT CTTGCTGCTC CCGAGCTACC TCCAGCAAGT GTTGCACCAA TCACCGATGC1440AATCGGGGGT GCATATCATC CCACAGGGCC TCGGTGCCAT GCTGGCGATG CCGATCGCCG1500GAGCGATGAT GGACCGACGG GGACCGGCCA AGATCGTGCT GGTTGGGATC ATGCTGATCG1560CTGCGGGGTT GGGCACCTTC GCCTTTGGTG TCGCGCGGCA AGCGGACTAC TTACCCATTC1620TGCCGACCGG GCTGGCAATC ATGGGCATGG GCATGGGCTG CTCCATGATG CCACTGTCCG1680GGGCGGCAGT GCAGACCCTG GCCCCACATC AGATCGCTCG CGGTTCGACG CTGATCAGCG1740TCAACCAGCA GGTGGGCGGT TCGATAGGGA CCGCACTGAT GTCGGTGCTG CTCACCTACC1800AGTTCAATCA CAGCGAAATC ATCGCTACTG CAAAGAAAGT CGCACTGACC CCAGAGAGTG1860GCGCCGGGCG GGGGGCGGCG GTTGACCCTT CCTCGCTACC GCGCCAAACC AACTTCGCGG1920CCCAACTGCT GCATGACCTT TCGCACGCCT ACGCGGTGGT ATTCGTGATA GCGACCGCGC1980TAGTGGTCTC GACGCTGATC CCCGCGGCAT TCCTGCCGAA ACAGCAGGCT AGTCATCGAA2040GAGCACCGTT GCTATCCGCA TGACGTCTGC TT 2072(2)SEQ ID NO:185的信息(ⅰ)序列特征(A)长度1923碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:185:TCACCCCGGA GAAGTCGTTC GTCGACGACC TGGACATCGA CTCGCTGTCG ATGGTCGAGA 60TCGCCGTGCA GACCGAGGAC AAGTACGGCG TCAAGATCCC CGACGAGGAC CTCGCCGGTC 120TGCGTACCGT CGGTGACGTT GTCGCCTACA TCCAGAAGCT CGAGGAAGAA AACCCGGAGG 180CGGCTCAGGC GTTGCGCGCG AAGATTGAGT CGGAGAACCC CGATGCGGCA CGAGCAGATC 240GGTGCGTTTC ACCCACATCG CAAGCTCGAG ACGCCCGTCG TCCTCTTGCA CGCTCAGCCA 300GGTTGGCGTG TCGCCGCCTT CCAGCAAGTG TTCCCACCAC ACGAAGGGAC CCTCGCGAAA 360GGTGACTGAT CCGCGGACCA CATAGTCGAT GCCACCGTGG CTGACAATTG CGCCGGGTCC 420GAGTTGGCGG GGGCCGAATT GCGGCATTGC GTCGAAGGCC AGCGGATCCC GGCGCCCGCC 480CGGCGTGGCT GGTGTTTTGG GCCGCCGGAT GGCCACGACG AGAACGACGA TGGCGGCGAT 540GAACAGCGCC ACGGCAATCA CGACCAGCAG ATTTCCCACG CATACCCTCT CGTACCGCTG 600CGCCGCGGTT GGTCGATCGG TCGCATATCG ATGGCGCCGT TTAACGTAAC AGCTTTCGCG 660GGACCGGGGG TCACAACGGG CGAGTTGTCC GGCCGGGAAC CCGGCAGGTC TCGGCCGCGG 720TCACCCCAGC TCACTGGTGC ACCATCCGGG TGTCGGTGAG CGTGCAACTC AAACACACTC 780AACGGCAACG GTTTCTCAGG TCACCAGCTC AACCTCGACC CGCAATCGCT CGTACGTTTC 840GACCGCGCGC AGGTCGCGAG TCAGCAGCTT TGCGCCGGCA GCTTTCGCCG TGAAGCCGAC 900CAGGGCATCG TAGGTTGCGC CACCGGTGAC ATCGTGCTCG GCGAGGTGGT CGGTCAAGCC 960GCGATATGAG CAGGCATCCA GTGCCAGGTA GTTGCTGGAG GTGATGTCCG CCAAGTAGGC1020GTGGACGGCA ACAGGGGCAA TACGATGCGG CGGTGGTAGC CGGGTCAAGA CCGAATAGGT1080TTCCACAGCC GCGTGCGCGA TCAGATGGAC GCCACGGTTG AGCGCGCGCA CGGCGGCCTC1140GTGCCCTTCG TGCCAGGTCG CGAATCCGGC AACCAGCACG CTGGTGTCTG GTGCGATCAC1200CGCCGTGTGC GATCGAGCGT TTCCCGAACG ATTTCGTCGG TCAACGGGGG CAGGGGACGT1260TCTGGCCGTG CGACGAGAAC CGAGCCTTCC CGAACGAGTT CGACACCGGT CGGGGCCGGC1320TCAATCTCGA TGCGCCCATC GCGCTCGGTG ATCTCCACCT GGTCGTTCCC GCGCAAGCCA1380AGGCGCTCGC GAATCCGCTT GGGAATCACC AGACGTCCTG CGACATCGAT GGTTGTTCGC1440ATGGTAGGAA ATTTACCATC GCACGTTCCA TAGGCGTGTC CTGCGCGGGA TGTCGGGACG1500ATCCGCTAGC GTATCGAACG ATTGTTTCGG AAATGGCTGA GGGAGCGTGC GGTGCGGGTG1560ATGGGTGTCG ATCCCGGGTT GACCCGATGC GGGCTGTCGC TCATCGAGAG TGGGCGTGGT1620CGGCAGCTCA CCGCGCTGGA TGTCGACGTG GTGCGCACAC CGTCGGATGC GGCCTTGGCG1680CAGCGCCTGT TGGCCATCAG CGATGCCGTC GAGCACTGGC TGGACACCCA TCATCCGGAG1740GTGGTGGCTA TCGAACGGGT GTTCTCTCAG CTCAACGTGA CCACGGTGAT GGGCACCGCG1800CAGGCCGGCG GCGTGATCGC CCTGGCGGCG GCCAAACGTG GTGTCGACGT GCATTTCCAT1860ACCCCCAGCG AGGTCAAGGC GGCGGTCACT GGCAACGGTT CCGCAGACAA GGCTCAGGTC1920ACC 1923(2)SEQ ID NO:186的信息(ⅰ)序列特征(A)长度1055碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:186:CTGGCGTGCC AGTGTCACCG GCGATATGAC GTCGGCATTC AATTTCGCGG CCCCGCCGGA 60CCCGTCGCCA CCCAATCTGG ACCACCCGGT CCGTCAATTG CCGAAGGTCG CCAAGTGCGT 120GCCCAATGTG GTGCTGGGTT TCTTGAACGA AGGCCTGCCG TATCGGGTGC CCTACCCCCA 180AACAACGCCA GTCCAGGAAT CCGGTCCCGC GCGGCCGATT CCCAGCGGCA TCTGCTAGCC 240GGGGATGGTT CAGACGTAAC GGTTGGCTAG GTCGAAACCC GCGCCAGGGC CGCTGGACGG 300GCTCATGGCA GCGAAATTAG AAAACCCGGG ATATTGTCCG CGGATTGTCA TACGATGCTG 360AGTGCTTGGT GGTTCGTGTT TAGCCATTGA GTGTGGATGT GTTGAGACCC TGGCCTGGAA 420GGGGACAACG TGCTTTTGCC TCTTGGTCCG CCTTTGCCGC CCGACGCGGT GGTGGCGAAA 480CGGGCTGAGT CGGGAATGCT CGGCGGGTTG TCGGTTCCGC TCAGCTGGGG AGTGGCTGTG 540CCACCCGATG ATTATGACCA CTGGGCGCCT GCGCCGGAGG ACGGCGCCGA TGTCGATGTC 600CAGGCGGCCG AAGGGGCGGA CGCAGAGGCC GCGGCCATGG ACGAGTGGGA TGAGTGGCAG 660GCGTGGAACG AGTGGGTGGC GGAGAACGCT GAACCCCGCT TTGAGGTGCC ACGGAGTAGC 720AGCAGCGTGA TTCCGCATTC TCCGGCGGCC GGCTAGGAGA GGGGGCGCAG ACTGTCGTTA 780TTTGACCAGT GATCGGCGGT CTCGGTGTTC CCGCGGCCGG CTATGACAAC AGTCAATGTG 840CATGACAAGT TACAGGTATT AGGTCCAGGT TCAACAAGGA GACAGGCAAC ATGGCAACAC 900GTTTTATGAC GGATCCGCAC GCGATGCGGG ACATGGCGGG CCGTTTTGAG GTGCACGCCC 960AGACGGTGGA GGACGAGGCT CGCCGGATGT GGGCGTCCGC GCAAAACATC TCGGGNGCGG 1020GCTGGAGTGG CATGGCCGAG GCGACCTCGC TAGAC1055(2)SEQ ID NO:187的信息(ⅰ)序列特征(A)长度359碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:187:CCGCCTCGTT GTTGGCATAC TCCGCCGCGG CCGCCTCGAC CGCACTGGCC GTGGCGTGTG 60TCCGGGCTGA CCACCGGGAT CGCCGAACCA TCCGAGATCA CCTCGCAATG ATCCACCTCG 120CGCAGCTGGT CACCCAGCCA CCGGGCGGTG TGCGACAGCG CCTGCATCAC CTTGGTATAG 180CCGTCGCGCC CCAGCCGCAG GAAGTTGTAG TACTGGCCCA CCACCTGGTT ACCGGGACGG 240GAGAAGTTCA GGGTGAAGGT CGGCATGTCG CCGCCGAGGT AGTTGACCCG GAAAACCAGA 300TCCTCCGGCA GGTGCTCGGG CCCGCGCCAC ACGACAAACC CGACGCCGGG ATAGGTCAG 359(2)SEQ ID NO:188的信息(ⅰ)序列特征(A)长度350碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:188:AACGGGCCCG TGGGCACCGC TCCTCTAAGG GCTCTCGTTG GTCGCATGAA GTGCTGGAAG 60GATGCATCTT GGCAGATTCC CGCCAGAGCA AAACAGCCGC TAGTCCTAGT CCGAGTCGCC 120CGCAAAGTTC CTCGAATAAC TCCGTACCCG GAGCGCCAAA CCGGGTCTCC TTCGCTAAGC 180TGCGCGAACC ACTTGAGGTT CCGGGACTCC TTGACGTCCA GACCGATTCG TTCGAGTGGC 240TGATCGGTTC GCCGCGCTGG CGCGAATCCG CCGCCGAGCG GGGTGATGTC AACCCAGTGG 300GTGGCCTGGA AGAGGTGCTC TACGAGCTGT CTCCGATCGA GGACTTCTCC350(2)SEQ ID NO:189的信息(ⅰ)序列特征(A)长度679氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:189:Glu Gln Pro Lys Gly Pro Phe Gly Glu Val Ile Glu Ala Phe Ala Asp1 5 10 15Gly Leu Ala Gly Lys Gly Lys Gln Ile Asn Thr Thr Leu Asn Ser Leu20 25 30Ser Gln Ala Leu Asn Ala Leu Asn Glu Gly Arg Gly Asp Phe Phe Ala35 40 45Val Val Arg Ser Leu Ala Leu Phe Val Asn Ala Leu His Gln Asp Asp50 55 60Gln Gln Phe Val Ala Leu Asn Lys Asn Leu Ala Glu Phe Thr Asp Arg65 70 75 80Leu Thr His Ser Asp Ala Asp Leu Ser Asn Ala Ile Gln Gln Phe Asp85 90 95Ser Leu Leu Ala Val Ala Arg Pro Phe Phe Ala Lys Asn Arg Glu Val100 105 110Leu Thr His Asp Val Asn Asn Leu Ala Thr Val Thr Thr Thr Leu Leu115 120 125Gln Pro Asp Pro Leu Asp Gly Leu Glu Thr Val Leu His Ile Phe Pro130 135 140Thr Leu Ala Ala Asn Ile Asn Gln Leu Tyr His Pro Thr His Gly Gly145 150 155 160Val Val Ser Leu Ser Ala Phe Thr Asn Phe Ala Asn Pro Met Glu Phe165 170 175Ile Cys Ser Ser Ile Gln Ala Gly Ser Arg Leu Gly Tyr Gln Glu Ser180 185 190Ala Glu Leu Cys Ala Gln Tyr Leu Ala Pro Val Leu Asp Ala Ile Lys195 200 205Phe Asn Tyr Phe Pro Phe Gly Leu Asn Val Ala Ser Thr Ala Ser Thr210 215 220Leu Pro Lys Glu Ile Ala Tyr Ser Glu Pro Arg Leu Gln Pro Pro Asn225 230 235 240Gly Tyr Lys Asp Thr Thr Val Pro Gly Ile Trp Val Pro Asp Thr Pro245 250 255Leu Ser His Arg Asn Thr Gln Pro Gly Trp Val Val Ala Pro Gly Met260 265 270Gln Gly Val Gln Val Gly Pro Ile Thr Gln Gly Leu Leu Thr Pro Glu275 280 285Ser Leu Ala Glu Leu Met Gly Gly Pro Asp Ile Ala Pro Pro Ser Ser290 295 300Gly Leu Gln Thr Pro Pro Gly Pro Pro Asn Ala Tyr Asp Glu Tyr Pro305 310 315 320Val Leu Pro Pro Ile Gly Leu Gln Ala Pro Gln Val Pro Ile Pro Pro325 330 335Pro Pro Pro Gly Pro Asp Val Ile Pro Gly Pro Val Pro Pro Val Leu340 345 350Ala Ala Ile Val Phe Pro Arg Asp Arg Pro Ala Ala Ser Glu Asn Phe355 360 365Asp Tyr Met Gly Leu Leu Leu Leu Ser Pro Gly Leu Ala Thr Phe Leu370 375 380Phe Gly Val Ser Ser Ser Pro Ala Arg Gly Thr Met Ala Asp Arg His385 390 395 400Val Leu Ile Pro Ala Ile Thr Gly Leu Ala Leu Ile Ala Ala Phe Val405 410 415Ala His Ser Trp Tyr Arg Thr Glu His Pro Leu Ile Asp Met Arg Leu420 425 430Phe Gln Asn Arg Ala Val Ala Gln Ala Asn Met Thr Met Thr Val Leu435 440 445Ser Leu Gly Leu Phe Gly Ser Phe Leu Leu Leu Pro Ser Tyr Leu Gln450 455 460Gln Val Leu His Gln Ser Pro Met Gln Ser Gly Val His Ile Ile Pro465 470 475 480Gln Gly Leu Gly Ala Met Leu Ala Met Pro Ile Ala Gly Ala Met Met485 490 495Asp Arg Arg Gly Pro Ala Lys Ile Val Leu Val Gly Ile Met Leu Ile500 505 510Ala Ala Gly Leu Gly Thr Phe Ala Phe Gly Val Ala Arg Gln Ala Asp515 520 525Tyr Leu Pro Ile Leu Pro Thr Gly Leu Ala Ile Met Gly Met Gly Met530 535 540Gly Cys Ser Met Met Pro Leu Ser Gly Ala Ala Val Gln Thr Leu Ala545 550 555 560Pro His Gln Ile Ala Arg Gly Ser Thr Leu Ile Ser Val Asn Gln Gln565 570 575Val Gly Gly Ser Ile Gly Thr Ala Leu Met Ser Val Leu Leu Thr Tyr580 585 590Gln Phe Asn His Ser Glu Ile Ile Ala Thr Ala Lys Lys Val Ala Leu595 600 605Thr Pro Glu Ser Gly Ala Gly Arg Gly Ala Ala Val Asp Pro Ser Ser610 615 620Leu Pro Arg Gln Thr Asn Phe Ala Ala Gln Leu Leu His Asp Leu Ser625 630 635 640His Ala Tyr Ala Val Val Phe Val Ile Ala Thr Ala Leu Val Val Ser645 650 655Thr Leu Ile Pro Ala Ala Phe Leu Pro Lys Gln Gln Ala Ser His Arg660 665 670Arg Ala Pro Leu Leu Ser Ala675(2)SEQ ID NO:190的信息(ⅰ)序列特征(A)长度120氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:190:Thr Pro Glu Lys Ser Phe Val Asp Asp Leu Asp Ile Asp Ser Leu Ser1 5 10 15Met Val Glu Ile Ala Val Gln Thr Glu Asp Lys Tyr Gly Val Lys Ile20 25 30Pro Asp Glu Asp Leu Ala Gly Leu Arg Thr Val Gly Asp Val Val Ala35 40 45Tyr Ile Gln Lys Leu Glu Glu Glu Asn Pro Glu Ala Ala Gln Ala Leu50 55 60Arg Ala Lys Ile Glu Ser Glu Asn Pro Asp Ala Ala Arg Ala Asp Arg65 70 75 80Cys Val Ser Pro Thr Ser Gln Ala Arg Asp Ala Arg Arg Pro Leu Ala85 90 95Arg Ser Ala Arg Leu Ala Cys Arg Arg Leu Pro Ala Ser Val Pro Thr100 105 110Thr Arg Arg Asp Pro Arg Glu Arg115 120(2)SEQ ID NO:191的信息(ⅰ)序列特征(A)长度89氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:191:Leu Ala Cys Gln Cys His Arg Arg Tyr Asp Val Gly Ile Gln Phe Arg1 5 10 15Gly Pro Ala Gly Pro Val Ala Thr Gln Ser Gly Pro Pro Gly Pro Ser20 25 30Ile Ala Glu Gly Arg Gln Val Arg Ala Gln Cys Gly Ala Gly Phe Leu35 40 45Glu Arg Arg Pro Ala Val Ser Gly Ala Leu Pro Pro Asn Asn Ala Ser50 55 60Pro Gly Ile Arg Ser Arg Ala Ala Asp Ser Gln Arg His Leu Leu Ala65 70 75 80Gly Asp Gly Ser Asp Val Thr Val Gly85(2)SEQ ID NO:192的信息(ⅰ)序列特征(A)长度119氨基酸(B)类型氨基酸(C)链型
(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:192:Ala Ser Leu Leu Ala Tyr Ser Ala Ala Ala Ala Ser Thr Ala Leu Ala1 5 10 15Val Ala Cys Val Arg Ala Asp His Arg Asp Arg Arg Thr Ile Arg Asp20 25 30His Leu Ala Met Ile His Leu Ala Gln Leu Val Thr Gln Pro Pro Gly35 40 45Gly Val Arg Gln Arg Leu His His Leu Gly Ile Ala Val Ala Pro Gln50 55 60Pro Gln Glu Val Val Val Leu Ala His His Leu Val Thr Gly Thr Gly65 70 75 80Glu Val Gln Gly Glu Gly Arg His Val Ala Ala Glu Val Val Asp Pro85 90 95Glu Asn Gln Ile Leu Arg Gln Val Leu Gly Pro Ala Pro His Asp Lys100 105 110Pro Asp Ala Gly Ile Gly Gln115(2)SEQ ID NO:193的信息(ⅰ)序列特征(A)长度116氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:193:Arg Ala Arg Gly His Arg Ser Ser Lys Gly Ser Arg Trp Ser His Glu15 10 15Val Leu Glu Gly Cys Ile Leu Ala Asp Ser Arg Gln Ser Lys Thr Ala20 25 30Ala Ser Pro Ser Pro Ser Arg Pro Gln Ser Ser Ser Asn Asn Ser Val35 40 45Pro Gly Ala Pro Asn Arg Val Ser Phe Ala Lys Leu Arg Glu Pro Leu50 55 60Glu Val Pro Gly Leu Leu Asp Val Gln Thr Asp Ser Phe Glu Trp Leu65 70 75 80Ile Gly Ser Pro Arg Trp Arg Glu Ser Ala Ala Glu Arg Gly Asp Val85 90 95Asn Pro Val Gly Gly Leu Glu Glu Val Leu Tyr Glu Leu Ser Pro lle100 105 110Glu Asp Phe Ser115(2)SEQ ID NO:194的信息(ⅰ)序列特征(A)长度811碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:194:TGCTACGCAG CAATCGCTTT GGTGACAGAT GTGGATGCCG GCGTCGCTGC TGGCGATGGC 60GTGAAAGCCG CCGACGTGTT CGCCGCATTC GGGGAGAACA TCGAACTGCT CAAAAGGCTG 120GTGCGGGCCG CCATCGATCG GGTCGCCGAC GAGCGCACGT GCACGCACTG TCAACACCAC 180GCCGGTGTTC CGTTGCCGTT CGAGCTGCCA TGAGGGTGCT GCTGACCGGC GCGGCCGGCT 240TCATCGGGTC GCGCGTGGAT GCGGCGTTAC GGGCTGCGGG TCACGACGTG GTGGGCGTCG 300ACGCGCTGCT GCCCGCCGCG CACGGGCCAA ACCCGGTGCT GCCACCGGGC TGCCAGCGGG 360TCGACGTGCG CGACGCCAGC GCGCTGGCCC CGTTGTTGGC CGGTGTCGAT CTGGTGTGTC 420ACCAGGCCGC CATGGTGGGT GCCGGCGTCA ACGCCGCCGA CGCACCCGCC TATGGCGGCC 480ACAACGATTT CGCCACCACG GTGCTGCTGG CGCAGATGTT CGCCGCCGGG GTCCGCCGTT 540TGGTGCTGGC GTCGTCGATG GTGGTTTACG GGCAGGGGCG CTATGACTGT CCCCAGCATG 600GACCGGTCGA CCCGCTGCCG CGGCGGCGAG CCGACCTGGA CAATGGGGTC TTCGAGCACC 660GTTGCCCGGG GTGCGGCGAG CCAGTCATCT GGCAATTGGT CGACGAAGAT GCCCCGTTGC 720GCCCGCGCAG CCTGTACGCG GCAGCAAGAC CGCGCAGGAG CACTACGCGC TGGCGTGGTC 780GGAAACGAAT GGCGGTTCCG TGGTGGCGTT G811(2)SEQ ID NO:195的信息(ⅰ)序列特征(A)长度966碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅱ)序列描述SEQ ID NO:195:GTCCCGCGAT GTGGCCGAGC ATGACTTTCG GCAACACCGG CGTAGTAGTC GAAGATATCG 60GACTTTGTGG TCCCGGTGGC GGGATAGAGC ACCTGTCGGC GTTGGTCAGC GTCACCCGTT 120GCTCGGACGC CGAACCCATG CTTTCAACGT AGCCTGTCGG TCACACAAGT CGCGAGCGTA 180ACGTCACGGT CAAATATCGC GTGGAATTTC GCCGTGACGT TCCGCTCGCG GACAATCAAG 240GCATACTCAC TTACATGCGA GCCATTTGGA CGGGTTCGAT CGCCTTCGGG CTGGTGAACG 300TGCCGGTCAA GGTGTACAGC GCTACCGCAG ACCACGACAT CAGGTTCCAC CAGGTGCACG 360CCAAGGACAA CGGACGCATC CGGTACAAGC GCGTCTGCGA GGCGTGTGGC GAGGTGGTCG 420ACTACCGCGA TCTTGCCCGG GCCTACGAGT CCGGCGACGG CCAAATGGTG GCGATCACCG 480ACGACGACAT CGCCAGCTTG CCTGAAGAAC GCAGCCGGGA GATCGAGGTG TTGGAGTTCG 540TCCCCGCCGC CGACGTGGAC CCGATGATGT TCGACCGCAG CTACTTTTTG GAGCCTGATT 600CGAAGTCGTC GAAATCGTAT GTGCTGCTGG CTAAGACACT CGCCGAGACC GACCGGATGG 660CGATCGTGGA TCGCCCCACC GGCCGTGAAT GCAGGAAAAA TAAGAGCCGC TATCCACAAT 720TCGGCGTCGA GCTCGGCTAC CACAAACGGT AGAACGATCG AGACATTCCC GAGCTGAAGT 780GCGGCGCTAT AGAAGCCGCT CTGCGCGATT ATCAAACGCA AAATACGCTT ACTCATGCCA 840TCGGCGCTGC TCACCCGATG CGACGTTTTT GCCACGCTCC ACCGCCTGCC GCGCGACCTC 900AAGTGGGCAT GCATCCCACC CGTTCCCGGA AACCGGTTCC GGCGGGTCGG CTCATCGCTT 960CATCCT966(2)SEQ ID NO:196的信息(ⅰ)序列特征(A)长度2367碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:196:CCGCACCGCC GGCAATACCG CCAGCGCCAC CGTTACCGCC GTTTGCGCCG TTGCCCCCGT 60TGCCGCCCGT CCCGCCGGCC CCGCCGATGG AGTTCTCATC GCCAAAAGTA CTGGCGTTGC 120CACCGGAGCC GCCGTTGCCG CCGTCACCGC CAGCCCCGCC GACTCCACCG GCCCCACCGA 180CTCCGCCGCT GCCACCGTTG CCGCCGTTGC CGATCAACAT GCCGCTGGCG CCACCCTTGC 240CACCCACGCC ACCGGCTCCG CCCACCCCGC CGACACCAAG CGAGCTGCCG CCGGAGCCAC 300CATCACCACC TACGCCACCG ACCGCCCAGA CACCAGCGAC CGGGTCTTCG TGAAACGTCG 360CGGTGCCACC ACCGCCGCCG TTACCGCCAA CCCCACCGGC AACGCCGGCG CCGCCATCCC 420CGCCGGCCCC GGCGTTGCCG CCGTTGCCGC CGTTGCCGAA CAACAACCCG CCGGCGCCGC 480CGTTGCCGCC CGCGCCGCCG GTCCCGCCGG CGCCGCCGAC GCCAAGGCCG CTGCCGCCCT 540TGCCGCCATC ACCACCCTTG CCGCCGACCA CATCGGGTTC TGCCTCGGGG TCTGGGCTGT 600CAAACCTCGC GATGCCAGCG TTGCCGCCGC TTCCCCCGGG CCCCCCCGTG GCGCCGTCAC 660CACCGATACC ACCCGCGCCA CCGGCGCCAC CGTTGCCGCC ATCACCGAAT AGCAACCCGC 720CGGCGCCACC ATTGCCGCCA GCTCCCCCTG CGCCACCGTC GGCGCCGGAG GCGGCACTGG 780CAGCCCCGTT ACCACCGAAA CCGCCGCTAC CACCGGTAGA GGTGGCAGTG GCGATGTGTA 840CGAAAGCGCC GCCTCCGGCG CCGCCGCTAC CACCCCCACT GCCGGCGGCT ACACCGTCGG 900ACCCGTTGCC ACCATCACCG CCAAAGGCGC TCGCAATGTC GCCCTGCGCG ACTCCGCCGT 960CGCCGCCGTT GCCGCCGCCG CCACCGGCAG CGGCGGTACC GCCGTCACCA CCGGCACCGC1020CGGTGGCCTT GCCCGAGCCT GCCGTCGCGG TGGCACCGTC GCCGCCGGTG CCACCGGTCG1080GCGTGCCGGC AGTGCCATGG CCGCCCGTGC CGCCGTCGCC GCCGGTTTGA TCACCGATGC1140CGGACACATC TGCCGGGCTG TCCCCGGTGC TGGCCGCGGG GCCGGGCGTG GGATTGACCC1200CGTTTGCCCC GGCGAGGCCG GCGCCGCCGG TACCACCGGC GCCGCCATGG CCGAACAGCC1260CGGCGTTGCC GCCGTTACCG CCCGCACCCC CGATGCCTGC GGCCACGCTG GTGCCGCCGA1320CACCGCCGTT GCCGCCGTTG CCCCACAACC ACCCCCCGTT CCCACCGGCA CCGCCGGCCG1380CGCCGGTACC ACCGGCCCCG CCGTTGCCGC CGTTGCCGAT CAACCCGGCC GCGCCTCCGC1440TGCCGCCGGT TTGACCGAAC CCGCCAGCCG CGCCGTTGCC ACCGTTGCCA AACAGCAACC1500CGCCGGCCGC GCCAGGCTGC CCGGGTGCCG TCCCGTCGGC GCCGTTTCCG ATCAACGGGC1560GCCCCAAAAG CGCCTCGGTG GGCGCATTCA CCGCACCCAG CAGACTCCGC TCAACAGCGG1620CTTCAGTGCT GGCATACCGA CCCGCGGCCG CAGTCAACGC CTGCACAAAC TGCTCGTGAA1680ACGCTGCCAC CTGTACGCTG AGCGCCTGAT ACTGCCGAGC ATGGGCCCCG AACAACCCCG1740CAATCGCCGC CGACACTTCA TCGGCAGCCG CAGCCACCAC TTCCGTCGTC GGGATCGCCG1800CGGCCGCATT AGCCGCGCTC ACCTGCGAAC CAATAGTCGA TAAATCCAAA GCCGCAGTTG1860CCAGCAGCTG CGGCGTCGCG ATCACCAAGG ACACCTCGCA CCTCCGGATA CCCCATATCG1920CCGCACCGTG TCCCCAGCGG CCACGTGACC TTTGGTCGCT GGCTGGCGGC CCTGACTATG1980GCCGCGACGG CCCTCGTTCT GATTCGCCCC GGCGCGCAGC TTGTTGCGCG AGTTGAAGAC2040GGGAGGACAG GCCGAGCTTG GTGTAGACGT GGGTCAAGTG GGAATGCACG GTCCGCGGCG2100AGATGAATAG GCGGACGCCG ATCTCCTTGT TGCTGAGTCC CTCACCGACC AGTAGAGCCA2160CCTCAAGCTC TGTCGGTGTC AACGCGCCCC AGCCACTTGT CGGGCGTTTC CGTGCACCGC2220GGCCTCGTTG CGCGTACGCG ATCGCCTCAT CGATCGATAA CGCAGTTCCT TCGGCCCAGG2280CATCGTCGAA CTCGCTGTCA CCCATGGATT TTCGAAGGGT GGCTAGCGAC GAGTTACAGC2340CCGCCTGGTA GATCCCGAAG CGGACCG2367(2)SEQ ID NO:197的信息(ⅰ)序列特征(A)长度376氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:197:Gln Pro Ala Gly Ala Thr Ile Ala Ala Ser Ser Pro Cys Ala Thr Val1 5 10 15Gly Ala Gly Gly Gly Thr Gly Ser Pro Val Thr Thr Glu Thr Ala Ala20 25 30Thr Thr Gly Arg Gly Gly Ser Gly Asp Val Tyr Glu Ser Ala Ala Ser35 40 45Gly Ala Ala Ala Thr Thr Pro Thr Ala Gly Gly Tyr Thr Val Gly Pro50 55 60Val Ala Thr Ile Thr Ala Lys Gly Ala Arg Asn Val Ala Leu Arg Asp65 70 75 80Ser Ala Val Ala Ala Val Ala Ala Ala Ala Thr Gly Ser Gly Gly Thr
85 90 95Ala Val Thr Thr Gly Thr Ala Gly Gly Leu Ala Arg Ala Cys Arg Arg100 105 110Gly Gly Thr Val Ala Ala Gly Ala Thr Gly Arg Arg Ala Gly Ser Ala115 120 125Met Ala Ala Arg Ala Ala Val Ala Ala Gly Leu Ile Thr Asp Ala Gly130 135 140His Ile Cys Arg Ala Val Pro Gly Ala Gly Arg Gly Ala Gly Arg Gly145 150 155 160Ile Asp Pro Val Cys Pro Gly Glu Ala Gly Ala Ala Gly Thr Thr Gly165 170 175Ala Ala Met Ala Glu Gln Pro Gly Val Ala Ala Val Thr Ala Arg Thr180 185 190Pro Asp Ala Cys Gly His Ala Gly Ala Ala Asp Thr Ala Val Ala Ala195 200 205Val Ala Pro Gln Pro Pro Pro Val Pro Thr Gly Thr Ala Gly Arg Ala210 215 220Gly Thr Thr Gly Pro Ala Val Ala Ala Val Ala Asp Gln Pro Gly Arg225 230 235 240Ala Ser Ala Ala Ala Gly Leu Thr Glu Pro Ala Ser Arg Ala Val Ala245 250 255Thr Val Ala Lys Gln Gln Pro Ala Gly Arg Ala Arg Leu Pro Gly Cys260 265 270Arg Pro Val Gly Ala Val Ser Asp Gln Arg Ala Pro Gln Lys Arg Leu275 280 285Gly Gly Arg Ile His Arg Thr Gln Gln Thr Pro Leu Asn Ser Gly Phe290 295 300Ser Ala Gly Ile Pro Thr Arg Gly Arg Ser Gln Arg Leu His Lys Leu305 310 315 320Leu Val Lys Arg Cys His Leu Tyr Ala Glu Arg Leu Ile Leu Pro Ser325 330 335Met Gly Pro Glu Gln Pro Arg Asn Arg Arg Arg His Phe Ile Gly Ser340 345 350Arg Ser His His Phe Arg Arg Arg Asp Arg Arg Gly Arg lle Ser Arg355 360 365
Ala His Leu Arg Thr Asn Ser Arg370 375(2)SEQ ID NO:198的信息(ⅰ)序列特征(A)长度2852碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:198:GGCCAAAACG CCCCGGCGAT CGCGGCCACC GAGGCCGCCT ACGACCAGAT GTGGGCCCAG 60GACGTGGCGG CGATGTTTGG CTACCATGCC GGGGCTTCGG CGGCCGTCTC GGCGTTGACA 120CCGTTCGGCC AGGCGCTGCC GACCGTGGCG GGCGGCGGTG CGCTGGTCAG CGCGGCCGCG 180GCTCAGGTGA CCACGCGGGT CTTCCGCAAC CTGGGCTTGG CGAACGTCCG CGAGGGCAAC 240GTCCGCAACG GTAATGTCCG GAACTTCAAT CTCGGCTCGG CCAACATCGG CAACGGCAAC 300ATCGGCAGCG GCAACATCGG CAGCTCCAAC ATCGGGTTTG GCAACGTGGG TCCTGGGTTG 360ACCGCAGCGC TGAACAACAT CGGTTTCGGC AACACCGGCA GCAACAACAT CGGGTTTGGC 420AACACCGGCA GCAACAACAT CGGGTTCGGC AATACCGGAG ACGGCAACCG AGGTATCGGG 480CTCACGGGTA GCGGTTTGTT GGGGTTCGGC GGCCTGAACT CGGGCACCGG CAACATCGGT 540CTGTTCAACT CGGGCACCGG AAACGTCGGC ATCGGCAACT CGGGTACCGG GAACTGGGGC 600ATTGGCAACT CGGGCAACAG CTACAACACC GGTTTTGGCA ACTCCGGCGA CGCCAACACG 660GGCTTCTTCA ACTCCGGAAT AGCCAACACC GGCGTCGGCA ACGCCGGCAA CTACAACACC 720GGTAGCTACA ACCCGGGCAA CAGCAATACC GGCGGCTTCA ACATGGGCCA GTACAACACG 780GGCTACCTGA ACAGCGGCAA CTACAACACC GGCTTGGCAA ACTCCGGCAA TGTCAACACC 840GGCGCCTTCA TTACTGGCAA CTTCAACAAC GGCTTCTTGT GGCGCGGCGA CCACCAAGGC 900CTGATTTTCG GGAGCCCCGG CTTCTTCAAC TCGACCAGTG CGCCGTCGTC GGGATTCTTC 960AACAGCGGTG CCGGTAGCGC GTCCGGCTTC CTGAACTCCG GTGCCAACAA TTCTGGCTTC1020TTCAACTCTT CGTCGGGGGC CATCGGTAAC TCCGGCCTGG CAAACGCGGG CGTGCTGGTA1080TCGGGCGTGA TCAACTCGGG CAACACCGTA TCGGGTTTGT TCAACATGAG CCTGGTGGCC1140ATCACAACGC CGGCCTTGAT CTCGGGCTTC TTCAACACCG GAAGCAACAT GTCGGGATTT1200TTCGGTGGCC CACCGGTCTT CAATCTCGGC CTGGCAAACC GGGGCGTCGT GAACATTCTC1260GGCAACGCCA ACATCGGCAA TTACAACATT CTCGGCAGCG GAAACGTCGG TGACTTCAAC1320ATCCTTGGCA GCGGCAACCT CGGCAGCCAA AACATCTTGG GCAGCGGCAA CGTCGGCAGC1380TTCAATATCG GCAGTGGAAA CATCGGAGTA TTCAATGTCG GTTCCGGAAG CCTGGGAAAC1440TACAACATCG GATCCGGAAA CCTCGGGATC TACAACATCG GTTTTGGAAA CGTCGGCGAC1500TACAACGTCG GCTTCGGGAA CGCGGGCGAC TTCAACCAAG GCTTTGCCAA CACCGGCAAC1560AACAACATCG GGTTCGCCAA CACCGGCAAC AACAACATCG GCATCGGGCT GTCCGGCGAC1620AACCAGCAGG GCTTCAATAT TGCTAGCGGC TGGAACTCGG GCACCGGCAA CAGCGGCCTG1680TTCAATTCGG GCACCAATAA CGTTGGCATC TTCAACGCGG GCACCGGAAA CGTCGGCATC1740GCAAACTCGG GCACCGGGAA CTGGGGTATC GGGAACCCGG GTACCGACAA TACCGGCATC1800CTCAATGCTG GCAGCTACAA CACGGGCATC CTCAACGCCG GCGACTTCAA CACGGGCTTC1860TACAACACGG GCAGCTACAA CACCGGCGGC TTCAACGTCG GTAACACCAA CACCGGCAAC1920TTCAACGTGG GTGACACCAA TACCGGCAGC TATAACCCGG GTGACACCAA CACCGGCTTC1980TTCAATCCCG GCAACGTCAA TACCGGCGCT TTCGACACGG GCGACTTCAA CAATGGCTTC2040TTGGTGGCGG GCGATAACCA GGGCCAGATT GCCATCGATC TCTCGGTCAC CACTCCATTC2100ATCCCCATAA ACGAGCAGAT GGTCATTGAC GTACACAACG TAATGACCTT CGGCGGCAAC2160ATGATCACGG TCACCGAGGC CTCGACCGTT TTCCCCCAAA CCTTCTATCT GAGCGGTTTG2220TTCTTCTTCG GCCCGGTCAA TCTCAGCGCA TCCACGCTGA CCGTTCCGAC GATCACCCTC2280ACCATCGGCG GACCGACGGT GACCGTCCCC ATCAGCATTG TCGGTGCTCT GGAGAGCCGC2340ACGATTACCT TCCTCAAGAT CGATCCGGCG CCGGGCATCG GAAATTCGAC CACCAACCCC2400TCGTCCGGCT TCTTCAACTC GGGCACCGGT GGCACATCTG GCTTCCAAAA CGTCGGCGGC2460GGCAGTTCAG GCGTCTGGAA CAGTGGTTTG AGCAGCGCGA TAGGGAATTC GGGTTTCCAG2520AACCTCGGCT CGCTGCAGTC AGGCTGGGCG AACCTGGGCA ACTCCGTATC GGGCTTTTTC2580AACACCAGTA CGGTGAACCT CTCCACGCCG GCCAATGTCT CGGGCCTGAA CAACATCGGC2640ACCAACCTGT CCGGCGTGTT CCGCGGTCCG ACCGGGACGA TTTTCAACGC GGGCCTTGCC2700AACCTGGGCC AGTTGAACAT CGGCAGCGCC TCGTGCCGAA TTCGGCACGA GTTAGATACG2760GTTTCAACAA TCATATCCGC GTTTTGCGGC AGTGCATCAG ACGAATCGAA CCCGGGAAGC2820GTAAGCGAAT AAACCGAATG GCGGCCTGTC AT 2852(2)SEQ ID NO:199的信息(ⅰ)序列特征(A)长度943氨基酸(B)类型氨基酸(C)链型(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:199:Gly Gln Asn Ala Pro Ala Ile Ala Ala Thr Glu Ala Ala Tyr Asp Gln1 5 10 15Met Trp Ala Gln Asp Val Ala Ala Met Phe Gly Tyr His Ala Gly Ala20 25 30Ser Ala Ala Val Ser Ala Leu Thr Pro Phe Gly Gln Ala Leu Pro Thr35 40 45Val Ala Gly Gly Gly Ala Leu Val Ser Ala Ala Ala Ala Gln Val Thr50 55 60Thr Arg Val Phe Arg Asn Leu Gly Leu Ala Asn Val Arg Glu Gly Asn65 70 75 80Val Arg Asn Gly Asn Val Arg Asn Phe Asn Leu Gly Ser Ala Asn Ile85 90 95Gly Asn Gly Asn Ile Gly Ser Gly Asn Ile Gly Ser Ser Asn Ile Gly100 105 110Phe Gly Asn Val Gly Pro Gly Leu Thr Ala Ala Leu Asn Asn Ile Gly115 120 125Phe Gly Asn Thr Gly Ser Asn Asn Ile Gly Phe Gly Asn Thr Gly Ser130 135 140Asn Asn Ile Gly Phe Gly Asn Thr Gly Asp Gly Asn Arg Gly Ile Gly145 150 155 160Leu Thr Gly Ser Gly Leu Leu Gly Phe Gly Gly Leu Asn Ser Gly Thr165 170 175Gly Asn Ile Gly Leu Phe Asn Ser Gly Thr Gly Asn Val Gly Ile Gly180 185 190Asn Ser Gly Thr Gly Asn Trp Gly Ile Gly Asn Ser Gly Asn Ser Tyr195 200 205Asn Thr Gly Phe Gly Asn Ser Gly Asp Ala Asn Thr Gly Phe Phe Asn210 215 220Ser Gly Ile Ala Asn Thr Gly Val Gly Asn Ala Gly Asn Tyr Asn Thr225 230 235 240Gly Ser Tyr Asn Pro Gly Asn Ser Asn Thr Gly Gly Phe Asn Met Gly245 250 255Gln Tyr Asn Thr Gly Tyr Leu Asn Ser Gly Asn Tyr Asn Thr Gly Leu260 265 270Ala Asn Ser Gly Asn Val Asn Thr Gly Ala Phe Ile Thr Gly Asn Phe275 280 285Asn Asn Gly Phe Leu Trp Arg Gly Asp His Gln Gly Leu Ile Phe Gly290 295 300Ser Pro Gly Phe Phe Asn Ser Thr Ser Ala Pro Ser Ser Gly Phe Phe305 310 315 320Asn Ser Gly Ala Gly Ser Ala Ser Gly Phe Leu Asn Ser Gly Ala Asn325 330 335Asn Ser Gly Phe Phe Asn Ser Ser Ser Gly Ala Ile Gly Asn Ser Gly340 345 350Leu Ala Asn Ala Gly Val Leu Val Ser Gly Val Ile Asn Ser Gly Asn355 360 365Thr Val Ser Gly Leu Phe Asn Met Ser Leu Val Ala Ile Thr Thr Pro370 375 380Ala Leu Ile Ser Gly Phe Phe Asn Thr Gly Ser Asn Met Ser Gly Phe385 390 395 400Phe Gly Gly Pro Pro Val Phe Asn Leu Gly Leu Ala Asn Arg Gly Val405 410 415Val Asn Ile Leu Gly Asn Ala Asn Ile Gly Asn Tyr Asn Ile Leu Gly420 425 430Ser Gly Asn Val Gly Asp Phe Asn Ile Leu Gly Ser Gly Asn Leu Gly435 440 445Ser Gln Asn Ile Leu Gly Ser Gly Asn Val Gly Ser Phe Asn Ile Gly450 455 460Ser Gly Asn Ile Gly Val Phe Asn Val Gly Ser Gly Ser Leu Gly Asn465 470 475 480Tyr Asn Ile Gly Ser Gly Asn Leu Gly Ile Tyr Asn Ile Gly Phe Gly485 490 495Asn Val Gly Asp Tyr Asn Val Gly Phe Gly Asn Ala Gly Asp Phe Asn500 505 510Gln Gly Phe Ala Asn Thr Gly Asn Asn Asn Ile Gly Phe Ala Asn Thr515 520 525Gly Asn Asn Asn Ile Gly Ile Gly Leu Ser Gly Asp Asn Gln Gln Gly530 535 540Phe Ash Ile Ala Ser Gly Trp Asn Ser Gly Thr Gly Asn Ser Gly Leu545 550 555 560Phe Asn Ser Gly Thr Asn Asn Val Gly Ile Phe Asn Ala Gly Thr Gly565 570 575Asn Val Gly Ile Ala Asn Ser Gly Thr Gly Asn Trp Gly Ile Gly Asn580 585 590Pro Gly Thr Asp Asn Thr Gly Ile Leu Asn Ala Gly Ser Tyr Asn Thr595 600 605Gly Ile Leu Asn Ala Gly Asp Phe Asn Thr Gly Phe Tyr Asn Thr Gly610 615 620Ser Tyr Asn Thr Gly Gly Phe Asn Val Gly Asn Thr Asn Thr Gly Asn625 630 635 640Phe Asn Val Gly Asp Thr Asn Thr Gly Ser Tyr Asn Pro Gly Asp Thr645 650 655Asn Thr Gly Phe Phe Asn Pro Gly Asn Val Asn Thr Gly Ala Phe Asp660 665 670Thr Gly Asp Phe Asn Asn Gly Phe Leu Val Ala Gly Asp Asn Gln Gly675 680 685Gln Ile Ala Ile Asp Leu Ser Val Thr Thr Pro Phe Ile Pro Ile Asn690 695 700Glu Gln Met Val Ile Asp Val His Asn Val Met Thr Phe Gly Gly Asn705 710 715 720Met Ile Thr Val Thr Glu Ala Ser Thr Val Phe Pro Gln Thr Phe Tyr725 730 735Leu Ser Gly Leu Phe Phe Phe Gly Pro Val Asn Leu Ser Ala Ser Thr740 745 750Leu Thr Val Pro Thr Ile Thr Leu Thr Ile Gly Gly Pro Thr Val Thr755 760 765Val Pro Ile Ser Ile Val Gly Ala Leu Glu Ser Arg Thr Ile Thr Phe770 775 780Leu Lys Ile Asp Pro Ala Pro Gly Ile Gly Asn Ser Thr Thr Asn Pro785 790 795 800Ser Ser Gly Phe Phe Asn Ser Gly Thr Gly Gly Thr Ser Gly Phe Gln805 810 815Asn Val Gly Gly Gly Ser Ser Gly Val Trp Asn Ser Gly Leu Ser Ser820 825 830Ala Ile Gly Asn Ser Gly Phe Gln Asn Leu Gly Ser Leu Gln Ser Gly835 840 845Trp Ala Asn Leu Gly Asn Ser Val Ser Gly Phe Phe Asn Thr Ser Thr850 855 860Val Asn Leu Ser Thr Pro Ala Asn Val Ser Gly Leu Asn Asn Ile Gly865 870 875 880Thr Asn Leu Ser Gly Val Phe Arg Gly Pro Thr Gly Thr Ile Phe Asn885 890 895Ala Gly Leu Ala Asn Leu Gly Gln Leu Asn Ile Gly Ser Ala Ser Cys900 905 910Arg Ile Arg His Glu Leu Asp Thr Val Ser Thr Ile Ile Ser Ala Phe915 920 925Cys Gly Ser Ala Ser Asp Glu Ser Asn Pro Gly Ser Val Ser Glu930 935 940(2)SEQ ID NO:200的信息(ⅰ)序列特征(A)长度53碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:200:GGATCCATAT GGGCCATCAT CATCATCATC ACGTGATCGA CATCATCGGG ACC 53(2)SEQ ID NO:201的信息(ⅰ)序列特征
(A)长度42碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:201:CCTGAATTCA GGCCTCGGTT GCGCCGGCCT CATCTTGAAC GA 42(2)SEQ ID NO:202的信息(ⅰ)序列特征(A)长度31碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:202:GGATCCTGCA GGCTCGAAAC CACCGAGCGG T 31(2)SEQ ID NO:203的信息(ⅰ)序列特征(A)长度31碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:203:CTCTGAATTC AGCGCTGGAA ATCGTCGCGA T 31(2)SEQ ID NO:204的信息(ⅰ)序列特征(A)长度33碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:204:GGATCCAGCG CTGAGATGAA GACCGATGCC GCT 33(2)SEQ ID NO:205的信息(ⅰ)序列特征(A)长度38碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ⅹⅰ)序列描述SEQ ID NO:205:GGATATCTGC AGAATTCAGG TTTAAAGCCC ATTTGCGA 38(2)SEQ ID NO:206的信息(ⅰ)序列特征(A)长度30碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:206:CCGCATGCGA GCCACGTGCC CACAACGGCC 30(2)SEQ ID NO:207的信息(ⅰ)序列特征(A)长度37碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:207:CTTCATGGAA TTCTCAGGCC GGTAAGGTCC GCTGCGG 37(2)SEQ ID NO:208的信息(ⅰ)序列特征(A)长度7676碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:208:TGGCGAATGG GACGCGCCCT GTAGCGGCGC ATTAAGCGCG GCGGGTGTGG TGGTTACGCG 60CAGCGTGACC GCTACACTTG CCAGCGCCCT AGCGCCCGCT CCTTTCGCTT TCTTCCCTTC 120CTTTCTCGCC ACGTTCGCCG GCTTTCCCCG TCAAGCTCTA AATCGGGGGC TCCCTTTAGG 180GTTCCGATTT AGTGCTTTAC GGCACCTCGA CCCCAAAAAA CTTGATTAGG GTGATGGTTC 240ACGTAGTGGG CCATCGCCCT GATAGACGGT TTTTCGCCCT TTGACGTTGG AGTCCACGTT 300CTTTAATAGT GGACTCTTGT TCCAAACTGG AACAACACTC AACCCTATCT CGGTCTATTC 360TTTTGATTTA TAAGGGATTT TGCCGATTTC GGCCTATTGG TTAAAAAATG AGCTGATTTA 420ACAAAAATTT AACGCGAATT TTAACAAAAT ATTAACGTTT ACAATTTCAG GTGGCACTTT 480TCGGGGAAAT GTGCGCGGAA CCCCTATTTG TTTATTTTTC TAAATACATT CAAATATGTA 540TCCGCTCATG AATTAATTCT TAGAAAAACT CATCGAGCAT CAAATGAAAC TGCAATTTAT 600TCATATCAGG ATTATCAATA CCATATTTTT GAAAAAGCCG TTTCTGTAAT GAAGGAGAAA 660ACTCACCGAG GCAGTTCCAT AGGATGGCAA GATCCTGGTA TCGGTCTGCG ATTCCGACTC 720GTCCAACATC AATACAACCT ATTAATTTCC CCTCGTCAAA AATAAGGTTA TCAAGTGAGA 780AATCACCATG AGTGACGACT GAATCCGGTG AGAATGGCAA AAGTTTATGC ATTTCTTTCC 840AGACTTGTTC AACAGGCCAG CCATTACGCT CGTCATCAAA ATCACTCGCA TCAACCAAAC 900CGTTATTCAT TCGTGATTGC GCCTGAGCGA GACGAAATAC GCGATCGCTG TTAAAAGGAC 960AATTACAAAC AGGAATCGAA TGCAACCGGC GCAGGAACAC TGCCAGCGCA TCAACAATAT1020TTTCACCTGA ATCAGGATAT TCTTCTAATA CCTGGAATGC TGTTTTCCCG GGGATCGCAG1080TGGTGAGTAA CCATGCATCA TCAGGAGTAC GGATAAAATG CTTGATGGTC GGAAGAGGCA1140TAAATTCCGT CAGCCAGTTT AGTCTGACCA TCTCATCTGT AACATCATTG GCAACGCTAC1200CTTTGCCATG TTTCAGAAAC AACTCTGGCG CATCGGGCTT CCCATACAAT CGATAGATTG1260TCGCACCTGA TTGCCCGACA TTATCGCGAG CCCATTTATA CCCATATAAA TCAGCATCCA1320TGTTGGAATT TAATCGCGGC CTAGAGCAAG ACGTTTCCCG TTGAATATGG CTCATAACAC1380CCCTTGTATT ACTGTTTATG TAAGCAGACA GTTTTATTGT TCATGACCAA AATCCCTTAA1440CGTGAGTTTT CGTTCCACTG AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA1500GATCCTTTTT TTCTGCGCGT AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG1560GTGGTTTGTT TGCCGGATCA AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC1620AGAGCGCAGA TACCAAATAC TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG1680AACTCTGTAG CACCGCCTAC ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC1740AGTGGCGATA AGTCGTGTCT TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG1800CAGCGGTCGG GCTGAACGGG GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC1860ACCGAACTGA GATACCTACA GCGTGAGCTA TGAGAAAGCG CCACGCTTCC CGAAGGGAGA1920AAGGCGGACA GGTATCCGGT AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT1980CCAGGGGGAA ACGCCTGGTA TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG2040CGTCGATTTT TGTGATGCTC GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG2100GCCTTTTTAC GGTTCCTGGC CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA2160TCCCCTGATT CTGTGGATAA CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC2220AGCCGAACGA CCGAGCGCAG CGAGTCAGTG AGCGAGGAAG CGGAAGAGCG CCTGATGCGG2280TATTTTCTCC TTACGCATCT GTGCGGTATT TCACACCGCA TATATGGTGC ACTCTCAGTA2340CAATCTGCTC TGATGCCGCA TAGTTAAGCC AGTATACACT CCGCTATCGC TACGTGACTG2400GGTCATGGCT GCGCCCCGAC ACCCGCCAAC ACCCGCTGAC GCGCCCTGAC GGGCTTGTCT2460GCTCCCGGCA TCCGCTTACA GACAAGCTGT GACCGTCTCC GGGAGCTGCA TGTGTCAGAG2520GTTTTCACCG TCATCACCGA AACGCGCGAG GCAGCTGCGG TAAAGCTCAT CAGCGTGGTC2580GTGAAGCGAT TCACAGATGT CTGCCTGTTC ATCCGCGTCC AGCTCGTTGA GTTTCTCCAG2640AAGCGTTAAT GTCTGGCTTC TGATAAAGCG GGCCATGTTA AGGGCGGTTT TTTCCTGTTT2700GGTCACTGAT GCCTCCGTGT AAGGGGGATT TCTGTTCATG GGGGTAATGA TACCGATGAA2760ACGAGAGAGG ATGCTCACGA TACGGGTTAC TGATGATGAA CATGCCCGGT TACTGGAACG2820TTGTGAGGGT AAACAACTGG CGGTATGGAT GCGGCGGGAC CAGAGAAAAA TCACTCAGGG2880TCAATGCCAG CGCTTCGTTA ATACAGATGT AGGTGTTCCA CAGGGTAGCC AGCAGCATCC2940TGCGATGCAG ATCCGGAACA TAATGGTGCA GGGCGCTGAC TTCCGCGTTT CCAGACTTTA3000CGAAACACGG AAACCGAAGA CCATTCATGT TGTTGCTCAG GTCGCAGACG TTTTGCAGCA3060GCAGTCGCTT CACGTTCGCT CGCGTATCGG TGATTCATTC TGCTAACCAG TAAGGCAACC3120CCGCCAGCCT AGCCGGGTCC TCAACGACAG GAGCACGATC ATGCGCACCC GTGGGGCCGC3180CATGCCGGCG ATAATGGCCT GCTTCTCGCC GAAACGTTTG GTGGCGGGAC CAGTGACGAA3240GGCTTGAGCG AGGGCGTGCA AGATTCCGAA TACCGCAAGC GACAGGCCGA TCATCGTCGC3300GCTCCAGCGA AAGCGGTCCT CGCCGAAAAT GACCCAGAGC GCTGCCGGCA CCTGTCCTAC3360GAGTTGCATG ATAAAGAAGA CAGTCATAAG TGCGGCGACG ATAGTCATGC CCCGCGCCCA3420CCGGAAGGAG CTGACTGGGT TGAAGGCTCT CAAGGGCATC GGTCGAGATC CCGGTGCCTA3480ATGAGTGAGC TAACTTACAT TAATTGCGTT GCGCTCACTG CCCGCTTTCC AGTCGGGAAA3540CCTGTCGTGC CAGCTGCATT AATGAATCGG CCAACGCGCG GGGAGAGGCG GTTTGCGTAT3600TGGGCGCCAG GGTGGTTTTT CTTTTCACCA GTGAGACGGG CAACAGCTGA TTGCCCTTCA3660CCGCCTGGCC CTGAGAGAGT TGCAGCAAGC GGTCCACGCT GGTTTGCCCC AGCAGGCGAA3720AATCCTGTTT GATGGTGGTT AACGGCGGGA TATAACATGA GCTGTCTTCG GTATCGTCGT3780ATCCCACTAC CGAGATATCC GCACCAACGC GCAGCCCGGA CTCGGTAATG GCGCGCATTG3840CGCCCAGCGC CATCTGATCG TTGGCAACCA GCATCGCAGT GGGAACGATG CCCTCATTCA3900GCATTTGCAT GGTTTGTTGA AAACCGGACA TGGCACTCCA GTCGCCTTCC CGTTCCGCTA3960TCGGCTGAAT TTGATTGCGA GTGAGATATT TATGCCAGCC AGCCAGACGC AGACGCGCCG4020AGACAGAACT TAATGGGCCC GCTAACAGCG CGATTTGCTG GTGACCCAAT GCGACCAGAT4080GCTCCACGCC CAGTCGCGTA CCGTCTTCAT GGGAGAAAAT AATACTGTTG ATGGGTGTCT4140GGTCAGAGAC ATCAAGAAAT AACGCCGGAA CATTAGTGCA GGCAGCTTCC ACAGCAATGG4200CATCCTGGTC ATCCAGCGGA TAGTTAATGA TCAGCCCACT GACGCGTTGC GCGAGAAGAT4260TGTGCACCGC CGCTTTACAG GCTTCGACGC CGCTTCGTTC TACCATCGAC ACCACCACGC4320TGGCACCCAG TTGATCGGCG CGAGATTTAA TCGCCGCGAC AATTTGCGAC GGCGCGTGCA4380GGGCCAGACT GGAGGTGGCA ACGCCAATCA GCAACGACTG TTTGCCCGCC AGTTGTTGTG4440CCACGCGGTT GGGAATGTAA TTCAGCTCCG CCATCGCCGC TTCCACTTTT TCCCGCGTTT4500TCGCAGAAAC GTGGCTGGCC TGGTTCACCA CGCGGGAAAC GGTCTGATAA GAGACACCGG4560CATACTCTGC GACATCGTAT AACGTTACTG GTTTCACATT CACCACCCTG AATTGACTCT4620CTTCCGGGCG CTATCATGCC ATACCGCGAA AGGTTTTGCG CCATTCGATG GTGTCCGGGA4680TCTCGACGCT CTCCCTTATG CGACTCCTGC ATTAGGAAGC AGCCCAGTAG TAGGTTGAGG4740CCGTTGAGCA CCGCCGCCGC AAGGAATGGT GCATGCAAGG AGATGGCGCC CAACAGTCCC4800CCGGCCACGG GGCCTGCCAC CATACCCACG CCGAAACAAG CGCTCATGAG CCCGAAGTGG4860CGAGCCCGAT CTTCCCCATC GGTGATGTCG GCGATATAGG CGCCAGCAAC CGCACCTGTG4920GCGCCGGTGA TGCCGGCCAC GATGCGTCCG GCGTAGAGGA TCGAGATCTC GATCCCGCGA4980AATTAATACG ACTCACTATA GGGGAATTGT GAGCGGATAA CAATTCCCCT CTAGAAATAA5040TTTTGTTTAA CTTTAAGAAG GAGATATACA TATGGGCCAT CATCATCATC ATCACGTGAT5100CGACATCATC GGGACCAGCC CCACATCCTG GGAACAGGCG GCGGCGGAGG CGGTCCAGCG5160GGCGCGGGAT AGCGTCGATG ACATCCGCGT CGCTCGGGTC ATTGAGCAGG ACATGGCCGT5220GGACAGCGCC GGCAAGATCA CCTACCGCAT CAAGCTCGAA GTGTCGTTCA AGATGAGGCC5280GGCGCAACCG AGGGGCTCGA AACCACCGAG CGGTTCGCCT GAAACGGGCG CCGGCGCCGG5340TACTGTCGCG ACTACCCCCG CGTCGTCGCC GGTGACGTTG GCGGAGACCG GTAGCACGCT5400GCTCTACCCG CTGTTCAACC TGTGGGGTCC GGCCTTTCAC GAGAGGTATC CGAACGTCAC5460GATCACCGCT CAGGGCACCG GTTCTGGTGC CGGGATCGCG CAGGCCGCCG CCGGGACGGT5520CAACATTGGG GCCTCCGACG CCTATCTGTC GGAAGGTGAT ATGGCCGCGC ACAAGGGGCT5580GATGAACATC GCGCTAGCCA TCTCCGCTCA GCAGGTCAAC TACAACCTGC CCGGAGTGAG5640CGAGCACCTC AAGCTGAACG GAAAAGTCCT GGCGGCCATG TACCAGGGCA CCATCAAAAC5700CTGGGACGAC CCGCAGATCG CTGCGCTCAA CCCCGGCGTG AACCTGCCCG GCACCGCGGT5760AGTTCCGCTG CACCGCTCCG ACGGGTCCGG TGACACCTTC TTGTTCACCC AGTACCTGTC5820CAAGCAAGAT CCCGAGGGCT GGGGCAAGTC GCCCGGCTTC GGCACCACCG TCGACTTCCC8880GGCGGTGCCG GGTGCGCTGG GTGAGAACGG CAACGGCGGC ATGGTGACCG GTTGCGCCGA5940GACACCGGGC TGCGTGGCCT ATATCGGCAT CAGCTTCCTC GACCAGGCCA GTCAACGGGG6000ACTCGGCGAG GCCCAACTAG GCAATAGCTC TGGCAATTTC TTGTTGCCCG ACGCGCAAAG6060CATTCAGGCC GCGGCGGCTG GCTTCGCATC GAAAACCCCG GCGAACCAGG CGATTTCGAT6120GATCGACGGG CCCGCCCCGG ACGGCTACCC GATCATCAAC TACGAGTACG CCATCGTCAA6180CAACCGGCAA AAGGACGCCG CCACCGCGCA GACCTTGCAG GCATTTCTGC ACTGGGCGAT6240CACCGACGGC AACAAGGCCT CGTTCCTCGA CCAGGTTCAT TTCCAGCCGC TGCCGCCCGC6300GGTGGTGAAG TTGTCTGACG CGTTGATCGC GACGATTTCC AGCGCTGAGA TGAAGACCGA6360TGCCGCTACC CTCGCGCAGG AGGCAGGTAA TTTCGAGCGG ATCTCCGGCG ACCTGAAAAC6420CCAGATCGAC CAGGTGGAGT CGACGGCAGG TTCGTTGCAG GGCCAGTGGC GCGGCGCGGC6480GGGGACGGCC GCCCAGGCCG CGGTGGTGCG CTTCCAAGAA GCAGCCAATA AGCAGAAGCA6540GGAACTCGAC GAGATCTCGA CGAATATTCG TCAGGCCGGC GTCCAATACT CGAGGGCCGA6600CGAGGAGCAG CAGCAGGCGC TGTCCTCGCA AATGGGCTTT GTGCCCACAA CGGCCGCCTC6660GCCGCCGTCG ACCGCTGCAG CGCCACCCGC ACCGGCGACA CCTGTTGCCC CCCCACCACC6720GGCCGCCGCC AACACGCCGA ATGCCCAGCC GGGCGATCCC AACGCAGCAC CTCCGCCGGC6780CGACCCGAAC GCACCGCCGC CACCTGTCAT TGCCCCAAAC GCACCCCAAC CTGTCCGGAT6840CGACAACCCG GTTGGAGGAT TCAGCTTCGC GCTGCCTGCT GGCTGGGTGG AGTCTGACGC6900CGCCCACTTC GACTACGGTT CAGCACTCCT CAGCAAAACC ACCGGGGACC CGCCATTTCC6960CGGACAGCCG CCGCCGGTGG CCAATGACAC CCGTATCGTG CTCGGCCGGC TAGACCAAAA7020GCTTTACGCC AGCGCCGAAG CCACCGACTC CAAGGCCGCG GCCCGGTTGG GCTCGGACAT7080GGGTGAGTTC TATATGCCCT ACCCGGGCAC CCGGATCAAC CAGGAAACCG TCTCGCTTGA7140CGCCAACGGG GTGTCTGGAA GCGCGTCGTA TTACGAAGTC AAGTTCAGCG ATCCGAGTAA7200GCCGAACGGC CAGATCTGGA CGGGCGTAAT CGGCTCGCCC GCGGCGAACG CACCGGACGC7260CGGGCCCCCT CAGCGCTGGT TTGTGGTATG GCTCGGGACC GCCAACAACC CGGTGGACAA7320GGGCGCGGCC AAGGCGCTGG CCGAATCGAT CCGGCCTTTG GTCGCCCCGC CGCCGGCGCC7380GGCACCGGCT CCTGCAGAGC CCGCTCCGGC GCCGGCGCCG GCCGGGGAAG TCGCTCCTAC7440CCCGACGACA CCGACACCGC AGCGGACCTT ACCGGCCTGA GAATTCTGCA GATATCCATC7500ACACTGGCGG CCGCTCGAGC ACCACCACCA CCACCACTGA GATCCGGCTG CTAACAAAGC7560CCGAAAGGAA GCTGAGTTGG CTGCTGCCAC CGCTGAGCAA TAACTAGCAT AACCCCTTGG7620GGCCTCTAAA CGGGTCTTGA GGGGTTTTTT GCTGAAAGGA GGAACTATAT CCGGAT7676(2)SEQ ID NO:209的信息(ⅰ)序列特征(A)长度802氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅹⅰ)序列描述SEQ ID NO:209:Met Gly His His His His His His Val Ile Asp Ile Ile Gly Thr Ser1 5 10 15Pro Thr Ser Trp Glu Gln Ala Ala Ala Glu Ala Val Gln Arg Ala Arg20 25 30Asp Ser Val Asp Asp Ile Arg Val Ala Arg Val Ile Glu Gln Asp Met
35 40 45Ala Val Asp Ser Ala Gly Lys Ile Thr Tyr Arg Ile Lys Leu Glu Val50 55 60Ser Phe Lys Met Arg Pro Ala Gin Pro Arg Gly Ser Lys Pro Pro Ser65 70 75 80Gly Ser Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro85 90 95Ala Ser Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr100 105 110Pro Leu Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn115 120 125Val Thr Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln130 135 140Ala Ala Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser145 150 155160Glu Gly Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala165 170 175Ile Ser Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His180 185 190Leu Lys Leu Ash Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile195 200 205Lys Thr Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn210 215 220Leu Pro Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly225 230 235 240Asp Thr Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly245 250 255Trp Gly Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val260 265 270Pro Gly Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys275 280 285Ala Glu Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp290 295 300Gln Ala Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser305 310 315 320Gly Asn Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala325 330 335Gly Phe Ala Ser Lys Thr Pro Ala Asn G1n Ala Ile Ser Met Ile Asp340 345 350Gly Pro Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile355 360 365Val Asn Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala370 375 380Phe Leu His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp385 390 395 400Gln Val His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp405 410 415Ala Leu Ile Ala Thr Ile Ser Ser Ala Glu Met Lys Thr Asp Ala Ala420 425 430Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile Ser Gly Asp Leu435 440 445Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly Ser Leu Gln Gly450 455 460Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala Ala Val Val Arg465 470 475 480Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu Asp Glu Ile Ser485 490 495Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg Ala Asp Glu Glu500 505 510Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe Val Pro Thr Thr Ala515 520 525Ala Ser Pro Pro Ser Thr Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro530 535 540Val Ala Pro Pro Pro Pro Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro545 550 555 560Gly Asp Pro Asn Ala Ala Pro Pro Pro Ala Asp Pro Ash Ala Pro Pro565 570 575Pro Pro Val Ile Ala Pro Ash Ala Pro Gln Pro Val Arg Ile Asp Asn580 585 590
Pro Val Gly Gly Phe Ser Phe Ala Leu Pro Ala Gly Trp Val Glu Ser595 600 605Asp Ala Ala His Phe Asp Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr610 615 620Gly Asp Pro Pro Phe Pro Gly Gln Pro Pro Pro Val Ala Asn Asp Thr625 630 635 640Arg Ile Val Leu Gly Arg Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu645 650 655Ala Thr Asp Ser Lys Ala Ala Ala Arg Leu Gly Ser Asp Met Gly Glu660 665 670Phe Tyr Met Pro Tyr Pro Gly Thr Arg Ile Asn Gln Glu Thr Val Ser675 680 685Leu Asp Ala Asn Gly Val Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys690 695 700Phe Ser Asp Pro Ser Lys Pro Asn Gly Gln Ile Trp Thr Gly Val Ile705 710 715 720Gly Ser Pro Ala Ala Asn Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp725 730 735Phe Val Val Trp Leu Gly Thr Ala Asn Asn Pro Val Asp Lys Gly Ala740 745 750Ala Lys Ala Leu Ala Glu Ser Ile Arg Pro Leu Val Ala Pro Pro Pro755 760 765Ala Pro Ala Pro Ala Pro Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala770 775 780Gly Glu Val Ala Pro Thr Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu785 790 795 800Pro Ala(2)SEQ ID NO:210的信息(ⅰ)序列特征(A)长度454碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:210:GTGGCGGCGC TGCGGCCGGC CAGCAGAGCG ATGTGCATCC GTTCGCGAAC CTGATCGCGG 60TCGACGATGA GCGCGCCGAA CGCCGCGACG ACGAAGAACG TCAGGAAGCC GTCCAGCAGC120GCGGTCCGCG CGGTGACGAA GCTGACCCCG TCGCAGATCA GCAGCACCCC GGCGATGGCG180CCGACCAATG TCGACCGGCT GATCCGCCGC ACGATCCGCA CCACCAGCGC CACCAGGACC240ACACCCAGCA GGGCGCCGGT GAACCGCCAG CCGAATCCGT TGTGACCGAA GATGGCCTCC300CCGATCGCGA TCAGCTGCTT ACCGACCGGC GGGTGAACCA CCAGGCCGTA CCCGGGGTTG360TCTTCCACCC CATGGTTGTT CAGCACCTGC CAGGCCTGGC GGTGCGTAAT GCTTCTCGTC420GAAGATGGGG GTGCCGGCAT CCGTCACCGA GCCC454(2)SEQ ID NO:211的信息(ⅰ)序列特征(A)长度470碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:211:TGCAGAAGTA CGGCGGATCC TCGGTGGCCG ACGCCGAACG GATTCGCCGC GTCGCCGAAC 60GCATCGTCGC CACCAAGAAG CAAGGCAATG ACGTCGTCGT CGTCGTCTCT GCCATGGGGG120ATACCACCGA CGACCTGCTG GATCTGGCTC AGCAGGTGTG CCCGGCGCCG CCGCCTCGGG180AGCTGGACAT GCTGCTTACC GCCGGTGAAC GCATCTCGAA TGCGTTGGTG GCCATGGCCA240TCGAGTCGCT CGGCGCGCAT GCCCGGTCGT TCACCGGTTC GCAGGCCGGG GTGATCACCA300CCGGCACCCA CGGCAACGCC AAGATCATCG ACGTCACGCC GGGGCGGCTG CAAACCGCCC360TTGAGGAAGG GCGGGTCGTC TTGGTGGCCG GATTCCAAGG GGTCAGCCAG GACACCAAGG420ATGTCACGAC GTTGGGCCGC GGCGGCTCGG ACACCACCGC CGTCGCCATG 470(2)SEQ ID NO:212的信息(ⅰ)序列特征(A)长度279碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:212:GGCCGGCGTA CCCGGCCGGG ACAAACAACG ATCGATTGAT ATCGATGAGA GACGGAGGAA 60TCGTGGCCCT TCCCCAGTTG ACCGACGAGC AGCGCGCGGC CGCGTTGGAG AAGGCTGCTG120CCGCACGTCG AGCGCGAGCA GAGCTCAAGG ATCGGCTCAA GCGTGGCGGC ACCAACCTCA180CCCAGGTCCT CAAGGACGCG GAGAGCGATG AAGTCTTGGG CAAAATGAAG GTGTCTGCGC240TGCTTGAGGC CTTGCCAAAG GTGGGCAAGG TCCAGGCGC 279(2)SEQ ID NO:213的信息(ⅰ)序列特征
(A)长度219碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:213:ACACGGTCGA ACTCGACGAG CCCCTCGTGG AGGTGTCGAC CGACAAGGTC GACACCGAAA 60TCCCTCGCCG GCCGCGGGTG TGCTGACCAA GATCATCGCC CAAGAAGATG ACACGGTCGA120GGTCGGCGGC GAGCTCTCTG TCATTGGCGA CGCCCATGAT GCCGGCGAGG CCGCGGTCCC180GGCACCCCAG AAAGTCTCTG CCGGCCCAAC CCGAATCCA 219(2)SEQ ID NO:214的信息(ⅰ)序列特征(A)长度342碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:214:TCGCTGCCGA CATCGGCGCC GCGCCCGCCC CCAAGCCCGC ACCCAAGCCC GTCCCCGAGC 60CAGCGCCGAC GCCGAAGGCC GAACCCGCAC CATCGCCGCC GGCGGCCCAG CCAGCCGGTG120CGGCCGAGGG CGCACCGTAC GTGACGCCGC TGGTGCGAAA GCTGGCGTCG GAAAACAACA180TCGACCTCGC CGGGGTGACC GGCACCGGAG TGGGTGGTCG CATCCGCAAA CAGGATGTGC240TGGCCGCGGC TGAACAAAAG AAGCGGGCGA AAGCACCGGC GCCGGCCGCC CAGGCCGCCG300CCGCGCCGGC CCCGAAAGCG CCGCCTGAAG ATCCGATGCC GC 342(2)SEQ ID NO:215的信息(ⅰ)序列特征(A)长度515碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:215:GGGTCTTGGT CAGTATCAGC GCCGACGAGG ACGCCACGGT GCCCGTCGGC GGCGAGTTGG 60CCCGGATCGG TGTCGCTGCC GACATCGGCG CCGCGCCCGC CCCCAAGCCC GCACCCAAGC120CCGTCCCCGA GCCAGCGCCG ACGCCGAAGG CCGAACCCGC ACCATCGCCG CCGGCGGCCC180AGCCAGCCGG TGCGGCCGAG GGCGCACCGT ACGTGACGCC GCTGGTGCGA AAGCTGGCGT240CGGAAAACAA CATCGACCTC GCCGGGGTGA CCGGCACCGG AGTGGGTGGT CGCATCCGCA300AACAGGATGT GCTGGCCGCG GCTGAACAAA AGAAGCGGGC GAAAGCACCG GCGCCCTGAG360CGCTTCATCA CCCGGTTAAC CAGCTTGCCC CAGAAGCCGG CTTCGACCTC TTCGCGGGTC420TTGGTCCGCT GCAGGCGGTC GGCGAGCCAG TTCAGGTTAG GCGGCCGAAA TCTTCCAGTT480CGCCAGGAAG GGCACCCGGA ACAGGGTCCG CACCC 515(2)SEQ ID NO:216的信息(ⅰ)序列特征(A)长度557碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:216:CCGACCCCAA GGTGCAGATT CAACAGGCCA TTGAGGAAGC ACAGCGCACC CACCAAGCGC 60TGACTCAACA GGCGGCGCAA GTGATCGGTA ACCAGCGTCA ATTGGAGATG CGACTCAACC120GACAGCTGGC GGACATCGAA AAGCTTCAGG TCAATGTGCG CCAAGCCCTG ACGCTGGCCG180ACCAGGCCAC CGCCGCCGGA GACGCTGCCA AGGCCACCGA ATACAACAAC GCCGCCGAGG240CGTTCGCAGC CCAGCTGGTG ACCGCCGAGC AGAGCGTCGA AGACCTCAAG ACGCTGCATG300ACCAGGCGCT TAGCGCCGCA GCTCAGGCCA AGAAGGCCGT CGAACGAAAT GCGATGGTGC360TGCAGCAGAA GATCGCCGAG CGAACCAAGC TGCTCAGCCA GCTCGAGCAG GCGAAGATGC420AGGAGCAGGT CAGCGCATCG TTGCGGTCGA TGAGTGAGCT CGCCGCGCCA GGCAACACGC480CGAGCCTCGA CGAGGTGCGC GACAAGATCG AGCGTCGCTA CGCCAACGCG ATCGGTTCGG540CTGAACTTGC CGAGAGT 557(2)SEQ ID NO:217的信息(ⅰ)序列特征(A)长度223碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:217:CAGGATAGGT TTCGACATCC ACCTGGGTTC CGCACCCGGT GCGCGACCGT GTGATAGGCC 60AGAGGTGGAC CTGCGCCGAC CGACGATCGA TCGAGGAGTC AACAGAAATG GCCTTCTCCG120TCCAGATGCC GGCACTCGGT GAGAGCGTCA CCGAGGGGAC GGTTACCCGC TGGCTCAAAC180AGGAAGGCGA CACGGTCGAA CTCGACGAGC CCCTCGTGGA GGT 223(2)SEQ ID NO:218的信息(ⅰ)序列特征(A)长度578碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA
(ⅹⅰ)序列描述SEQ ID NO:218:AAGAAGTACA TCTGCCGGTC GATGTCGGCG AACCACGGCA GCCAACCGGC GCAGTAGCCG 60ACCAGGACCA CCGCATAACG CCAGTCCCGG CGCACAAACA TACGCCACCC CGCGTATGCC120AGGACTGGCA CCGCCAGCCA CCACATCGCG GGCGTGCCGA CCAGCATCTC GGCCTTGACG180CACGACTGTG CGCCGCAGCC TGCAACGTCT TGCTGGTCGA TGGCGTACAG CACCGGCCGC240AACGACATGG GCCAGGTCCA CGGTTTGGAT TCCCAAGGGT GGTAGTTGCC TGCGGAATTC300GTCAGGCCCG CGTGGAAGTG GAACGCTTTG GCGGTGTATT GCCAGAGCGA GCGCACGGCG360TCGGGCAGCG GAACAACCGA GTTGCGACCG ACCGCTTGAC CGACCGCATG CCGATCGATC420GCGGTCTCGG ACGCGAACCA CGGAGCGTAG GTGGCCAGAT AGACCGCGAA CGGGATCAAC480CCCAGCGCAT ACCCGCTGGG AAGCACGTCA CGCCGCACTG TTCCCAGCCA CGGTCTTTGC540ACTTGGTATG AACGTCGCGC CGCCACGTCA ACGCCAGC578(2)SEQ ID NO:219的信息(ⅰ)序列特征(A)长度484碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:219:ACAACGATCG ATTGATATCG ATGAGAGACG GAGGAATCGT GGCCCTTCCC CAGTTGACCG 60ACGAGCAGCG CGCGGCCGCG TTGGAGAAGG CTGCTGCCGC ACGTCGAGCG CGAGCAGAGC120TCAAGGATCG GCTCAAGCGT GGCGGCACCA ACCTCACCCA GGTCCTCAAG GACGCGGAGA180GCGATGAAGT CTTGGGCAAA ATGAAGGTGT CTGCGCTGCT TGAGGCCTTG CCAAAGGTGG240GCAAGGTCAA GGCGCAGGAG ATCATGACCG AGCTGGAAAT TGCGCCCCAC CCCGCCGCCT300TCGTGGCCTC GGTGACCGTC AGCGCAAGGC CCTGCTGGAA AAGTTCGGCT CCGCCTAACC360CCGCCGGCCG ACGATGCGGG CCGGAAGGCC TGTGGTGGGC GTACCCCCGC ATACGGGGGA420GAAGCGGCCT GACAGGGCCA GCTCACAATT CAGGCCGAAC GCCCCGGTGG GGGGGAACCC480GCCC 484(2)SEQ ID NO:220的信息(ⅰ)序列特征(A)长度537碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:220:AGGACTGGCA CCGCCAGCCA CCACATCGCG GGCGTGCCGA CCAGCATCTC GGCCTTGACG 60CACGACTGTG CGCCGCAGCC TGCAACGTCT TGCTGGTCGA TGGCGTACAG CACCGGCCGC120AACGACATGG GCCAGGTCCA CGGTTTGGAT TCCCAAGGGT GGTAGTTGCC TGCGGAATTC180GTCAGGCCCG CGTGGAAGTG GAACGCTTTG GCGGTGTAGT GCCAGAGCGA GCGCACGGCG240TCGGGCAGCG GAACAACCGA GTTGCGACCG ACCGCTTGAC CGACCGCATG CCGATCGATC300GCGGTCTCGG ACGCGAACCA CGGAGCGTAG GTGGCCAGAT AGACCGCGAA CGGGATCAAC360CCCAGCGCAT ACCCGCTGGG AAGCACGTCA CGCCGCACTG TCCCCAGCCA CGGTCTTTGC420ACTTGGTACT GACGTCGCGC CGCCACGTCG AACGCCAGCG CCATCGCGCC GAAGAACAGC480ACGAAGTACA CGCCGGACCA CTTGGTGGCG CAAGCCAATC CCAAGCAGCA CCCCGGC 537(2)SEQ ID NO:221的信息(ⅰ)序列特征(A)长度135氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:221:Gly Gly Ala Ala Ala Gly Gln Gln Ser Asp Val His Pro Phe Ala Asn1 5 10 15Leu lle Ala Val Asp Asp Glu Arg Ala Glu Arg Arg Asp Asp Glu Glu20 25 30Arg Gln Glu Ala Val Gln Gln Arg Gly Pro Arg Gly Asp Glu Ala Asp35 40 45Pro Val Ala Asp Gln Gln His Pro Gly Asp Gly Ala Asp Gln Cys Arg50 55 60Pro Ala Asp Pro Pro His Asp Pro His His Gln Arg His Gln Asp His65 70 75 80Thr Gln Gln Gly Ala Gly Glu Pro Pro Ala Glu Ser Val Val Thr Glu85 90 95Asp Gly Leu Pro Asp Arg Asp Gln Leu Leu Thr Asp Arg Arg Val Asn100 105 110His Gln Ala Val Pro Gly Val Val Phe His Pro Met Val Val Gln His115 120 125Leu Pro Gly Leu Ala Val Arg130 135(2)SEQ ID NO:222的信息(ⅰ)序列特征(A)长度156氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:222:Gln Lys Tyr Gly Gly Ser Ser Val Ala Asp Ala Glu Arg Ile Arg Arg1 5 10 15Val Ala Glu Arg Ile Val Ala Thr Lys Lys Gln Gly Asn Asp Val Val
20 25 30Val Val Val Ser Ala Met Gly Asp Thr Thr Asp Asp Leu Leu Asp Leu35 40 45Ala Gln Gln Val Cys Pro Ala Pro Pro Pro Arg Glu Leu Asp Met Leu50 55 60Leu Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu Val Ala Met Ala Ile65 70 75 80Glu Ser Leu Gly Ala His Ala Arg Ser Phe Thr Gly Ser Gln Ala Gly85 90 95Val Ile Thr Thr Gly Thr His Gly Ash Ala Lys Ile Ile Asp Val Thr100 105 110Pro Gly Arg Leu Gln Thr Ala Leu Glu Glu Gly Arg Val Val Leu Val115 120 125Ala Gly Phe Gln Gly Val Ser Gln Asp Thr Lys Asp Val Thr Thr Leu130 135 140Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala Met145 150 155(2)SEQ ID NO:223的信息(ⅰ)序列特征(A)长度92氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:223:Pro Ala Tyr Pro Ala Gly Thr Asn Asn Asp Arg Leu Ile Ser Met Arg1 5 10 15Asp Gly Gly Ile Val Ala Leu Pro Gln Leu Thr Asp Glu Gln Arg Ala20 25 30Ala Ala Leu Glu Lys Ala Ala Ala Ala Arg Arg Ala Arg Ala Glu Leu35 40 45Lys Asp Arg Leu Lys Arg Gly Gly Thr Asn Leu Thr Gln Val Leu Lys50 55 60Asp Ala Glu Ser Asp Glu Val Leu Gly Lys Met Lys Val Ser Ala Leu65 70 75 80Leu Glu Ala Leu Pro Lys Val Gly Lys Val Gln Ala85 90(2)SEQ ID NO:224的信息(ⅰ)序列特征(A)长度72氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质
(ⅹⅰ)序列描述SEQ ID NO:224:Thr Val Glu Leu Asp Glu Pro Leu Val Glu Val Ser Thr Asp Lys Val1 5 10 15Asp Thr Glu Ile Pro Ser Pro Ala Ala Gly Val Leu Thr Lys Ile Ile20 25 30Ala Gln Glu Asp Asp Thr Val Glu Val Gly Gly Glu Leu Ser Val Ile35 40 45Gly Asp Ala His Asp Ala Gly Glu Ala Ala Val Pro Ala Pro Gln Lys50 55 60Val Ser Ala Gly Pro Thr Arg Ile65 70(2)SEQ ID NO:225的信息(ⅰ)序列特征(A)长度113氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:225:Ala Ala Asp Ile Gly Ala Ala Pro Ala Pro Lys Pro Ala Pro Lys Pro1 5 10 15Val Pro Glu Pro Ala Pro Thr Pro Lys Ala Glu Pro Ala Pro Ser Pro20 25 30Pro Ala Ala Gln Pro Ala Gly Ala Ala Glu Gly Ala Pro Tyr Val Thr35 40 45Pro Leu Val Arg Lys Leu Ala Ser Glu Asn Asn Ile Asp Leu Ala Gly50 55 60Val Thr Gly Thr Gly Val Gly Gly Arg Ile Arg Lys Gln Asp Val Leu65 70 75 80Ala Ala Ala Glu Gln Lys Lys Arg Ala Lys Ala Pro Ala Pro Ala Ala85 90 95Gln Ala Ala Ala Ala Pro Ala Pro Lys Ala Pro Pro Glu Asp Pro Met100 105 110Pro(2)SEQ ID NO:226的信息(ⅰ)序列特征(A)长度118氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质
(ⅹⅰ)序列描述SEQ ID NO:226:Val Leu Val Ser Ile Ser Ala Asp Glu Asp Ala Thr Val Pro Val Gly1 5 10 15Gly Glu Leu Ala Arg Ile Gly Val Ala Ala Asp Ile Gly Ala Ala Pro20 25 30Ala Pro Lys Pro Ala Pro Lys Pro Val Pro Glu Pro Ala Pro Thr Pro35 40 45Lys Ala Glu Pro Ala Pro Ser Pro Pro Ala Ala Gln Pro Ala Gly Ala50 55 60Ala Glu Gly Ala Pro Tyr Val Thr Pro Leu Val Arg Lys Leu Ala Ser65 70 75 80Glu Asn Asn Ile Asp Leu Ala Gly Val Thr Gly Thr Gly Val Gly Gly85 90 95Arg Ile Arg Lys Gln Asp Val Leu Ala Ala Ala Glu Gln Lys Lys Arg100 105 110Ala Lys Ala Pro Ala Pro115(2)SEQ ID NO:227的信息(ⅰ)序列特征(A)长度185氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:227:Asp Pro Lys Val Gln Ile Gln Gln Ala Ile Glu Glu Ala Gln Arg Thr15 10 15His Gln Ala Leu Thr Gln Gln Ala Ala Gln Val Ile Gly Asn Gln Arg20 25 30Gln Leu Glu Met Arg Leu Asn Arg Gln Leu Ala Asp Ile Glu Lys Leu35 40 45Gln Val Asn Val Arg Gln Ala Leu Thr Leu Ala Asp Gln Ala Thr Ala50 55 60Ala Gly Asp Ala Ala Lys Ala Thr Glu Tyr Asn Asn Ala Ala Glu Ala65 70 75 80Phe AIa Ala Gln Leu Val Thr Ala Glu Gln Ser Val Glu Asp Leu Lys85 90 95Thr Leu His Asp Gln Ala Leu Ser Ala Ala Ala Gln Ala Lys Lys Ala100 105 110Val Glu Arg Asn Ala Met Val Leu Gln Gln Lys Ile Ala Glu Arg Thr115 120 125Lys Leu Leu Ser Gln Leu Glu Gln Ala Lys Met Gln Glu Gln Val Ser130 135 140Ala Ser Leu Arg Ser Met Ser Glu Leu Ala Ala Pro Gly Asn Thr Pro145 150 155 160Ser Leu Asp Glu Val Arg Asp Lys Ile Glu Arg Arg Tyr Ala Asn Ala165 170 175Ile Gly Ser Ala Glu Leu Ala Glu Ser180 185(2)SEQ ID NO:228的信息(ⅰ)序列特征(A)长度71氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:228:Val Ser Thr Ser Thr Trp Val Pro His Pro Val Arg Asp Arg Val Ile1 5 10 15Gly Gln Arg Trp Thr Cys Ala Asp Arg Arg Ser Ile Glu Glu Ser Thr20 25 30Glu Met Ala Phe Ser Val Gln Met Pro Ala Leu Gly Glu Ser Val Thr35 40 45Glu Gly Thr Val Thr Arg Trp Leu Lys Gln Glu Gly Asp Thr Val Glu50 55 60Leu Asp Glu Pro Leu Val Glu65 70(2)SEQ ID NO:229的信息(ⅰ)序列特征(A)长度182氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:229:Glu Val His Leu Pro Val Asp Val Gly Glu Pro Arg Gln Pro Thr Gly1 5 10 15Ala Val Ala Asp Gln Asp His Arg Ile Thr Pro Val Pro Ala His Lys20 25 30His Thr Pro Pro Arg Val Cys Gln Asp Trp His Arg Gln Pro Pro His35 40 45Arg Gly Arg Ala Asp Gln His Leu Gly Leu Asp Ala Arg Leu Cys Ala50 55 60Ala Ala Cys Asn Val Leu Leu Val Asp Gly Val Gln His Arg Pro Gln65 70 75 80Arg His Gly Pro Gly Pro Arg Phe Gly Phe Pro Arg Val Val Val Ala85 90 95Cys Gly Ile Arg Gln Ala Arg Val Glu Val Glu Arg Phe Gly Gly Val100 105 110Leu Pro Glu Arg Ala His Gly Val Gly Gln Arg Asn Asn Arg Val Ala115 120 125Thr Asp Arg Leu Thr Asp Arg Met Pro Ile Asp Arg Gly Leu Gly Arg130 135 140Glu Pro Arg Ser Val Gly Gly Gln Ile Asp Arg Glu Arg Asp Gln Pro145 150 155 160Gln Arg Ile Pro Ala Gly Lys His Val Thr Pro His Cys Ser Gln Pro165 170 175Arg Ser Leu His Leu Val180(2)SEC)ID N0:230的信息(ⅰ)序列特征(A)长度160氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:230:Asn Asp Arg Leu Ile Ser Met Arg Asp Gly Gly Ile Val Ala Leu Pro1 5 10 15Gln Leu Thr Asp Glu Gln Arg Ala Ala Ala Leu Glu Lys Ala Ala Ala20 25 30Ala Arg Arg Ala Arg Ala Glu Leu Lys Asp Arg Leu Lys Arg Gly Gly35 40 45Thr Asn Leu Thr Gln Val Leu Lys Asp Ala Glu Ser Asp Glu Val Leu50 55 60Gly Lys Met Lys Val Ser Ala Leu Leu Glu Ala Leu Pro Lys Val Gly65 70 75 80Lys Val Lys Ala Gln Glu Ile Met Thr Glu Leu Glu Ile Ala Pro His85 90 95Pro Ala Ala Phe Val Ala Ser Val Thr Val Ser Ala Arg Pro Cys Trp100 105 110Lys Ser Ser Ala Pro Pro Asn Pro Ala Gly Arg Arg Cys Gly Pro Glu115 120 125Gly Leu Trp Trp Ala Tyr Pro Arg Ile Arg Gly Arg Ser Gly Leu Thr130 135 140Gly Pro Ala His Asn Ser Gly Arg Thr Pro Arg Trp Gly Gly Thr Arg145 150 155 160(2)SEQ ID NO:231的信息(ⅰ)序列特征(A)长度178氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:231:Asp Trp His Arg Gln Pro Pro His Arg Gly Arg Ala Asp Gln His Leu1 5 10 15Gly Leu Asp Ala Arg Leu Cys Ala Ala Ala Cys Asn Val Leu Leu Val20 25 30Asp Gly Val Gln His Arg Pro Gin Arg His Gly Pro Gly Pro Arg Phe35 40 45Gly Phe Pro Arg Val Val Val Ala Cys Gly Ile Arg Gln Ala Arg Val50 55 60Glu Val Glu Arg Phe Gly Gly Val Val Pro Glu Arg Ala His Gly Val65 70 75 80Gly Gln Arg Asn Asn Arg Val Ala Thr Asp Arg Leu Thr Asp Arg Met85 90 95Pro Ile Asp Arg Gly Leu Gly Arg Glu Pro Arg Ser Val Gly Gly Gln100 105 110Ile Asp Arg Glu Arg Asp Gln Pro Gln Arg Ile Pro Ala Gly Lys His115 120 125Val Thr Pro His Cys Pro Gln Pro Arg Ser Leu His Leu Val Leu Thr130 135 140Ser Arg Arg His Val Glu Arg Gln Arg His Arg Ala Glu Glu Gln His145 150 155 160Glu Val His Ala Gly Pro Leu Gly Gly Ala Ser Gln Ser Gln Ala Ala165 170 175Pro Arg(2)SEQ ID NO:232的信息(ⅰ)序列特征(A)长度271碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:232:ATGCCAAGCC GGTGCTGATG CCCGAGCTCG GCGAATCGGT GACCGAGGGG ACCGTCATTC 60GTTGGCTGAA GAAGATCGGG GATTCGGTTC AGGTTGACGA GCCACTCGTG GAGGTGTCCA120CCGACAAGGT GGACACCGAG ATCCCGTCCC CGGTGGCTGG GGTCTTGGTC AGTATCAGCG180CCGACGAGGA CGCCACGGTG CCCGTCGGCG GCGAGTTGGC CCGGATCGGT GTCGCTGCCG240AGATCGGCGC CGCGCCCGCC CCCAAGCCCC C 271(2)SEQ ID NO:233的信息(ⅰ)序列特征
(A)长度89氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:233:Ala Lys Pro Val Leu Met Pro Glu Leu Gly Glu Ser Val Thr Glu Gly1 5 10 15Thr Val Ile Arg Trp Leu Lys Lys Ile Gly Asp Ser Val Gln Val Asp20 25 30Glu Pro Leu Val Glu Val Ser Thr Asp Lys Val Asp Thr Glu Ile Pro35 40 45Ser Pro Val Ala Gly Val Leu Val Ser Ile Ser Ala Asp Glu Asp Ala50 55 60Thr Val Pro Val Gly Gly Glu Leu Ala Arg Ile Gly Val Ala Ala Glu65 70 75 80Ile Gly Ala Ala Pro Ala Pro Lys Pro85(2)SEQ ID NO:234的信息(ⅰ)序列特征(A)长度107碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:234:GAGGTAGCGG ATGGCCGGAG GAGCACCCCA GGACCGCGCC CGAACCGCGG GTGCCGGTCA 60TCGATATGTG GGCACCGTTC GTTCCGTCCG CCGAGGTCAT TGACGAT 107(2)SEQ ID NO:235的信息(ⅰ)序列特征(A)长度339碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:235:ATGAAGTTGA AGTTTGCTCG CCTGAGTACT GCGATACTGG GTTGTGCAGC GGCGCTTGTG 60TTTCCTGCCT CGGTTGCCAG CGCAGATCCA CCTGACCCGC ATCAGCCGGA CATGACGAAA120GGCTATTGCC CGGGTGGCCG ATGGGGTTTT GGCGACTTGG CCGTGTGCGA CGGCGAGAAG180TACCCCGACG GCTCGTTTTG GCACCAGTGG ATGCAAACGT GGTTTACCGG CCCACAGTTT240TACTTCGATT GTGTCAGCGG CGGTGAGCCC CTCCCCGGCC CGCCGCCACC GGGTGGTTGC300GGTGGGGCAA TTCCGTCCGA GCAGCCCAAC GCTCCCTGA 339(2)SEQ ID NO:236的信息(ⅰ)序列特征(A)长度112氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:236:Met Lys Leu Lys Phe Ala Arg Leu Ser Thr Ala Ile Leu Gly Cys Ala1 5 10 15Ala Ala Leu Val Phe Pro Ala Ser Val Ala Ser Ala Asp Pro Pro Asp20 25 30Pro His Gln Pro Asp Met Thr Lys Gly Tyr Cys Pro Gly Gly Arg Trp35 40 45Gly Phe Gly Asp Leu Ala Val Cys Asp Gly Glu Lys Tyr Pro Asp Gly50 55 60Ser Phe Trp His Gln Trp Met Gln Thr Trp Phe Thr Gly Pro Gln Phe65 70 75 80Tyr Phe Asp Cys Val Ser Gly Gly Glu Pro Leu Pro Gly Pro Pro Pro85 90 95Pro Gly Gly Cys Gly Gly Ala Ile Pro Ser Glu Gln Pro Asn Ala Pro100 105 110(2)SEQ ID NO:237的信息(ⅰ)序列特征(A)长度371碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:237:GTGACCACGG TGGGCCTGCC ACCAACCCGG GCAGCGGCAG CCGCGGCGGC GCCGGCGGCT 60CCGGCGGCAA CGGTGGCGCC GGGGGTAACG CCACCGGCTC AGGCGGCAAG GGCGGCGCCG120GTGGCAATGG CGGTGATGGG AGCTTCGGCG CTACCAGCGG CCCCGCCTCC ATCGGGGTCA180CGGGCGCCCC CGGCGGCAAC GGCGGCAAGG GCGGCGCCGG TGGCAGCAAC CCCAACGGCT240CAGGTGGCGA CGGCGGCAAA GGCGGCAACG GCGGTGCCGG CGGCAACGGG GGCTCGATCG300GCGCCAACAG CGGCATCGTC GGCGGTTCCG GTGGGGCCGG TGGCGCTGGC GGCGCCGGCG360GAAACGGCAG C 371(2)SEQ ID NO:238的信息
(ⅰ)序列特征(A)长度424碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:238:GTCCGGGTCC CACCACCGCG CCGGCGCGCC CCTAGCGGCC GGGCGCACCA GCCCCTTTTC 60TTGACTCGTT CAAGAAAAGG GCCTTCTGTT TGGTCGGCCA TGTTGGCATG ATCGTGACCC120ATGGGCAACA TCGACGTCGA CATCTCGGCC AAGGTCTAGC TCCATGCGAA TCGCCGCCGC180GGTGGTGAGC ATCGGTCTAG CCGTCATAGC AGGGTTCGCG GTACCTGTTG CCGACGCACA240CCCGTCGGAG CCCGGGGTTG TGTCCTACGC GGTGCTCGGA AAGGGGTCGG TCGGCAACAT300CGTCGGCGCC CCAATGGGGT GGGAGGCGGT GTTCACCAAG CCGTTCCAGG CGTTTTGGGT360CGAACTACCG GCGTGCAACA ACTGGGTGGA CATCGGGCTG CCCGAGGTGT ACGACGATCC420CGAC 424(2)SEQ ID NO:239的信息(ⅰ)序列特征(A)长度317碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:239:GCGATGGCGG CCGCGGGTAC CACCGCCAAT GTGGAACGGT TTCCCAACCC CAACGATCCT 60TTGCATCTGG CGTCAATTGA CTTCAGCCCG GCCGATTTCG TCACCGAGGG CCACCGTCTA120AGGGCGGATG CGATCCTACT GCGCCGTACC GACCGGCTGC CTTTCGCCGA GCCGCCGGAT180TGGGACTTGG TGGAGTCGCA GTTGCGCACG ACCGTCACCG CCGACACGGT GCGCATCGAC240GTCATCGCCG ACGATATGCG TCCCGAACTG GCGGCGGCGT CCAAACTCAC CGAATCGCTG300CGGCTCTACG ATTCGTC 317(2)SEQ ID NO:240的信息(ⅰ)序列特征(A)长度422碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:240:TGGCGTATGC GCTTCGCAGC CGGTGCCGCG TCAACGCGCC GGAGGCAATC GCTTCGCTGC 60CGAGGAATGG TTCGATCACG ATCGCAGTGT GCCGTCGTGC ACCGACACCG CCGTCCAACG120TGAACTGAGG GCGGAAAATC GGCCGAAATC TCGCCCTCAG TTCACGCTCG GCGCCTAACG180GTTCTGGAAG TTGGGTGCGC GCTTCTCGGC GAACGCGCGC GGGCCTTCCT TGGCGTCGTC240GGACAGGAAG ACCTTGATGC CGATCTGGGT GTCGATCTTG AACGCCTCGT TTTCGGGCAT300GCACTCGGTC TCGCGGATGG ACCGCAAGAT GGCCTGCACG GCCAGGGGTC CGTTAGCCGA360GATGGCGTCG GCAAGTTCTA GAACCTTGGT CAACGCCTGG CCGTCGGGCA CACGTGGCCG420AT 422(2)SEQ ID NO:241的信息(ⅰ)序列特征(A)长度426碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:241:GCGTGCCGCT GAACACCAGC CCGCGGCTGC CAGATCTCCC GGACTCGGTA GTGCCGCCGG 60TGGCGTCGTT GCTCTCCTGA CGGGGCGCGG CGACCATAAG GTCGCTAATG CCCAGGTAGC120GGCCCAGGTG CATGGAGTCG ATGATGATGC GACTCTCCAG CTCGCCGACC GGGAGCTTGG180CATCGGGCCT GATCAGCCAG GACGCGTAGG ACAAGTCGAT CGAATGCATA GTGGCCTCCA240GAGTGGCCGT GCCACTTCCG GCGTGCTCCA CGGCAAATGC CTTGATTTCT AGCTCCGCGT300AGTGTTCCCG CATCGCCTGC GGGATGAATG GGAACCGCAG GATGGCGACA AACGGGTCTG360ACCTCAGGTT TGCCGCTTTG CGCACAGTGG TCGACAGCCG GTACTCGGCA TAAATGCTGG420CCCCGA 426(2)SEQ ID NO:242的信息(ⅰ)序列特征(A)长度327碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:242:AGACCGGCGA GGGTGTGGTC GCTGCCCGCG GCATTGTCGA TAATCTGCGC TGGGTCGACG 60CGCCGATCAA CTAGTGAGGC GCAACGCTAG GCTTTGGGAT ACCCACAGCT AAAAAGTTTA120TCAAAGAAAC GAAGAAGGTT GCCATGAGCA CTGTTGCCGC CTACGCCGCC ATGTCGGCGA180CCGAACCCCT GACCAAGACC ACGATCACCC GTCGCGACCC GGGCCCGCAC GACATGGCGA240TCGACATCAA ATTCGCCGGA ATCTGTCGCT CGGACATCCA TACCGTCCAA ACCGAATGGG300GGCAACCGAA TTTACCTGTG GTCCCTG327(2)SEQ ID NO:243的信息(ⅰ)序列特征(A)长度123氨基酸
(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:243:Asp His Gly Gly Pro Ala Thr Asn Pro Gly Ser Gly Ser Arg Gly Gly1 5 10 15Ala Gly Gly Ser Gly Gly Asn Gly Gly Ala Gly Gly Asn Ala Thr Gly20 25 30Ser Gly Gly Lys Gly Gly Ala Gly Gly Asn Gly Gly Asp Gly Ser Phe35 40 45Gly Ala Thr Ser Gly Pro Ala Ser Ile Gly Val Thr Gly Ala Pro Gly50 55 60Gly Asn Gly Gly Lys Gly Gly Ala Gly Gly Ser Asn Pro Asn Gly Ser65 70 75 80Gly Gly Asp Gly Gly Lys Gly Gly Asn Gly Gly Ala Gly Gly Asn Gly85 90 95Gly Ser Ile Gly Ala Asn Ser Gly Ile Val Gly Gly Ser Gly Gly Ala100 105 110Gly Gly Ala Gly Gly Ala Gly Gly Asn Gly Ser115 120(2)SEQ ID NO:244的信息(ⅰ)序列特征(A)长度104氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:244:Met Ala Ala Ala Gly Thr Thr Ala Asn Val Glu Arg Phe Pro Asn Pro1 5 10 15Asn Asp Pro Leu His Leu Ala Ser Ile Asp Phe Ser Pro Ala Asp Phe20 25 30Val Thr Glu Gly His Arg Leu Arg Ala Asp Ala Ile Leu Leu Arg Arg35 40 45Thr Asp Arg Leu Pro Phe Ala Glu Pro Pro Asp Trp Asp Leu Val Glu50 55 60Ser Gln Leu Arg Thr Thr Val Thr Ala Asp Thr Val Arg Ile Asp Val65 70 75 80Ile Ala Asp Asp Met Arg Pro Glu Leu Ala Ala Ala Ser Lys Leu Thr85 90 95Glu Ser Leu Arg Leu Tyr Asp Ser100
(2)SEQ ID NO:245的信息(ⅰ)序列特征(A)长度41氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:245:Ala Tyr Ala Leu Arg Ser Arg Cys Arg Val Asn Ala Pro Glu Ala Ile1 5 10 15Ala Ser Leu Pro Arg Asn Gly Ser Ile Thr Ile Ala Val Cys Arg Arg20 25 30Ala Pro Thr Pro Pro Ser Asn Val Ash35 40(2)SEQ ID NO:246的信息(ⅰ)序列特征(A)长度25氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:246:Val Pro Leu Asn Thr Ser Pro Arg Leu Pro Asp Leu Pro Asp Ser Val1 5 10 15Val Pro Pro Val Ala Ser Leu Leu Ser20 25(2)SEQ ID NO:247的信息(ⅰ)序列特征(A)长度61氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白(ⅹⅰ)序列描述SEQ ID NO:247:Met Ser Thr Val Ala Ala Tyr Ala Ala Met Ser Ala Thr Glu Pro Leu1 5 10 15Thr Lys Thr Thr Ile Thr Arg Arg Asp Pro Gly Pro His Asp Met Ala20 25 30Ile Asp Ile Lys Phe Ala Gly Ile Cys Arg Ser Asp Ile His Thr Val35 40 45Gln Thr Glu Trp Gly Gln Pro Ash Leu Pro Val Val Pro50 55 60(2)SEQ ID NO:248的信息(ⅰ)序列特征(A)长度213碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:248:GCTTGGAGCC CTGGAGCGAC GGTGTGGGTC TGGGGGTCGA TTCGTTCTCG GCGAAAGTCA 60ACTAAAGACC ACGTTGACAC CCAACCGGCG GCCCGGCATG GGCCGTCGCG GCGTAGAAGC120TTTGACCGCG GCGCGAAACG TTCGCTGCTG CGGCCCATGC AGATCGCACA CGCTTGCTTG180AACATCGGGT GGAGCCGGTG GTAACGCCAG GCT 213(2)SEQ ID NO:249的信息(ⅰ)序列特征(A)长度367碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:249:CCGAGCTGCT GTTCGGCGCC GGCGGTGCGG GCGGCGCGGG TGGGGCGGGC ACCGACGGCG 60GGCCCGGTGC TACCGGCGGG ACCGGCGGAC ACGGCGGAGT CGGCGGCGAC GGCGGATGGC120TGGCACCCGG CGGGGCCGGC GGGGCCGGCG GGCAAGGCGG GGCAGGTGGT GCCCGCAGCG180ATGGTGGCGC GTTGGGTGGT ACCGGCGGGA CGGGCGGTAC CGGCGGCGCC GGTGGCGCCG240GCGGTCGCGG CACACTGCTG CTGGGCGCTG GCGGACAGGG CGGCCTCGGC GGCGCCGGCG300GACAAGGCGG CACCGGCGGG GGCCGGCGGA GATGGCGTTC TGGGGGGTGT CAGTGGCACT360GGTGGTA 367(2)SEQ ID NO:250的信息(ⅰ)序列特征(A)长度420碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA
(ⅹⅰ)序列描述SEQ ID NO:250:AAGGCGTGAT TGGCAAGGCG ACCGCGCAGC GGCCCGTAGC CGCGGGACGG CCCAGGCCCC 60GACCGCAGCG GCCGGTGTCT GACCGGGTCA GCGACCAGCG GCGCTGACCG TGCCGCTCGT120CTACTTCGAC GCCAGCGCCT TCGTCAAACT TCTCACCACC GAGACAGGGA GCTCGCTGGC180GTCCGCTCTA TGGGACGGCT GCGACGCCGC ATTGTCCAAC CGCCTGGCCT ACCCCGAAGT240CCGCGCCGCA CTCGCTGCAA CGGGCCGCAA TCACGACCTA ACCGAATCCG AGCTCGCCGA300CGCCGAGCGT GACTGGGAGG ACTTCTGGGC CGCACCCGCC CAGTCGAACT CACCGCGACG360GTTGAACAGC ACGCCGGGCA CCTCGCCCGA ACACATGCCT TACGCGGAGC CGACACCGTT420(2)SEQ ID NO:251的信息(ⅰ)序列特征(A)长度299碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:251:CTCTTGTCGG TGGCATCGGC GGTACCGGCG GAACCGGCGG CAACGCCGGT ATGCTCGCCG 60GCGCCGCCGG GGCCGGCGGT GCCGGCGGGT TCAGCTTCAG CACTGCCGGT GGGGCTGGCG120GCGCCGGCGG GGCCGGTGGG CTGTTCACCA CCGGCGGTGT CGGCGGCGCC GGTGGGCAGG180GTCACACGGG CGGGGCGGGC GGCGCCGGCG GGGCCGGCGG GTTGTTTGGT GCCGGCGGCA240TGGGCGGGGC GGGCGGATTC GGGGATCACG GAACGCTCGG CACCGGCGGG GCCGGCGGG 299(2)SEQ ID NO:252的信息(ⅰ)序列特征(A)长度20氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:252:Leu Glu Pro Trp Ser Asp Gly Val Gly Leu Gly Val Asp Ser Phe Ser1 5 10 15Ala Lys Val Asn20(2)SEQ ID NO:253的信息(ⅰ)序列特征(A)长度121氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性
(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:253:Glu Leu Leu Phe Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly1 5 10 15Thr Asp Gly Gly Pro Gly Ala Thr Gly Gly Thr Gly Gly His Gly Gly20 25 30Val Gly Gly Asp Gly Gly Trp Leu Ala Pro Gly Gly Ala Gly Gly Ala35 40 45Gly Gly Gln Gly Gly Ala Gly Gly Ala Arg Ser Asp Gly Gly Ala Leu50 55 60Gly Gly Thr Gly Gly Thr Gly Gly Thr Gly Gly Ala Gly Gly Ala Gly65 70 75 80Gly Arg Gly Thr Leu Leu Leu Gly Ala Gly Gly Gln Gly Gly Leu Gly85 90 95Gly Ala Gly Gly Gln Gly Gly Thr Gly Gly Gly Arg Arg Arg Trp Arg100 105 110Ser Gly Gly Cys Gln Trp His Trp Trp115 120(2)SEQ ID NO:254的信息(ⅰ)序列特征(A)长度34氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:254:Gly Val Ile Gly Lys Ala Thr Ala Gln Arg Pro Val Ala Ala Gly Arg1 5 10 15Pro Arg Pro Arg Pro Gln Arg Pro Val Ser Asp Arg Val Ser Asp Gln20 25 30Arg Arg(2)SEQ ID NO:255的信息(ⅰ)序列特征(A)长度99氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:255:Leu Val Gly Gly Ile Gly Gly Thr Gly Gly Thr Gly Gly Asn Ala Gly1 5 10 15Met Leu Ala Gly Ala Ala Gly Ala Gly Gly Ala Gly Gly Phe Ser Phe20 25 30Ser Thr Ala Gly Gly Ala Gly Gly Ala Gly Gly Ala Gly Gly Leu Phe35 40 45Thr Thr Gly Gly Val Gly Gly Ala Gly Gly Gln Gly His Thr Gly Gly50 55 60Ala Gly Gly Ala Gly Gly Ala Gly Gly Leu Phe Gly Ala Gly Gly Met65 70 75 80Gly Gly Ala Gly Gly Phe Gly Asp His Gly Thr Leu Gly Thr Gly Gly85 90 95Ala Gly Gly(2)SEQ ID NO:256的信息(ⅰ)序列特征(A)长度282碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:256:TCCTGTTCGG CGCCGGCGGG GTGGGCGGTG TTGGCGGTGA CGGTGTGGCA TTCCTGGGCA 60CCGCCCCCGG CGGGCCCGGT GGTGCCGGCG GGGCCGGTGG GCTGTTCAGC GTCGGTGGGG120CCGGCGGCGC CGGCGGAATC GGATTGGTCG GGAACAGCGG TGCCGGGGGG TCCGGCGGGT180CCGCCCTGCT CTGGGGCGAC GGCGGTGCCG GCGGCGCGGG TGGGGTCGGG TCCACTACCG240GCGGTGCCGG CGGGGCGGGC GGCAACGCCA GCCTGCTGGT AA 282(2)SEQ ID NO:257的信息(ⅰ)序列特征(A)长度415碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:257:CGGCACGAGC CGTGCTACTG GTCAACTGAT GCCCTGATTG TGACCTTCCC GGCGCCGGAT 60CAGTGCTTCT CAGGACCGAC GTAATATTCG AAAACCAATC CGGCCGCCGA GGCGAGGATG120AATGCCACAC CGGCGGCGAT CAGCCACGGG AGCCACAACG CGATGCCGAC CGCTGCCACC180GAGCCGGACA ACGCGACCAT GATCGGCCAC CAGCTATGCG GACTGAAGAA TCCAAGTTCT240CCTGCGCCGT CGCTGATTTC AGCGCCTTCG TAGTCCTCGG GCCGGGAATC TAACCGGCGG300GCCACAAACC GGAAGAAGGT GGCGACGATC AACGCCATGC CGCCGGTGAG CGCCAACGCA360ATGGTGCCAG CCCACTCGAC ACCACCGGTG GCGAACATCG AGGTCAACAC GCCGT 415
(2)SEQ ID NO:258的信息(ⅰ)序列特征(A)长度373碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:258:TCACCGCGTG AACGGTTCGT AACACTGATA CGTATGCTTG TCAGCGAGCA GATCAAGTCC 60AGTCCGACCA ATGCCAGGAG ATCATCGGCT AGGCTCACGG TTTCGCCTGG GACGAGACGG120TATTGAGTTC TGGCGTTGGA CGGTCCGTGG CGTGGTGGGA AGTCTGACGC GGCATCAGAA180CGGTTGTCAA TACCAGTCTT TGGGGGATAT GGCCTATTTG GTGTCGTCGG GCCGCTCCAC240CGGATCCCTT TTCGAACGTT GCGCAAGCGC GGTCCAGTTA CGGCCTGTTC ACTGCGCGCT300GGCGTAGCTG CGCGGCCTCG ATCGGTTTGA ACGTCATCGC AATTCCCGCA ATGGGTGAGT360ACCTGACGCT CCT 373(2)SEQ ID NO:259的信息(ⅰ)序列特征(A)长度423碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SECQID NO:259:CCAAACCGGA CAGGCCGGCA GCGACGGTCG GAAGTTGCAC CACGGTGCGC GCTCCATGTA 60GCCAACCGGT GACCACGGCG TAGACAGCAG ATCCGTGGAT CGCGCGTTCG GTGTCGTCCG120GGCCGAGTAC CCGCGGGCCG AACCGCAGCG ACCAAAGCAA CGCGATCGAT ACGGGGATCG180CCACTCGTGC CGAATTCGAG CTCCGTCGAC AAGCTTGCGG CCGCACTCGA ACCCGGGTGA240ATGATTGAGT TTAAACCGCT TAGCAATAAC TAGCATAACC CCTTGGGGCC TCTAAACGGG300TCTTGAGGGG TTTTTTGCTG AAAGGAGGAA CTATATCCGG ATAACCTGGC GTAGTAGCGA360AGAGGCCCGC ACCGATCGCC CTTCCCAACA GTTGCGCAGC CTGAATGGCG AATGGACGCG420CCC 423(2)SEQ ID NO:260的信息(ⅰ)序列特征(A)长度404碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA
(ⅹⅰ)序列描述SEQ ID NO:260:AGTGGCCAGC CGGTCGGCCA ATGCATCCAG CTCCCGGTAC GTCAGCTGAC CATCCGCCCA 60ACTGACCGCC ACCGAGTCAG GCTGTGCCGC AGCGATTTCG GCGAACCGGG TATGCACCGC120GGGTGCCGAC GTCGTCACAT CCGGCAGGCC GGGTGCGGTC GGATCGTGCT CGCCGTCCAG180CAGAATGTCG ACGTCGCGCA GCGGCCGATC CCACCGGCTG ACCAAGCGCT GTAACACAGC240CAGCACCCGC CTGCCGAGGC TTTCGGGCGC CATCGTGCCC AGCGCACCGT CGAGCACCTC300CACTAGCAGC GTGAGCTCAC CGGTGCTGCG GTGCGCGGCG ACGGTCACCG GAAAGTGCGA360CAAACTCTCT AGCGCCACCG GACGGAACGT CACCCCGTTT GCGA 404(2)SEQ ID NO:261的信息(ⅰ)序列特征(A)长度421碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:261:GTCCTGGTCG CAGGCTGTTC TTCGAACCCG CTGGCTAACT TCGCACCCGG GTATCCGCCC 60ACCATCGAAC CCGCCCAACC GGCGGTGTCA CCGCCTACTT CGCAAGACCC GGCCGGTGCA120GTGCGACCAC TGAGCGGCCA CCCCCGGGCG GCACTATTCG ACAACGGCAC CCGCCAATTG180GTGGCTCTGC GCCCGGGCGC CGATTCGGCG GCACCCGCCA GCATCATGGT CTTCGATGAC240ATGCACGTTG CACCGCGCGT CATTTTTCTG CCGGGCCCGG CAGCCGCGTT GACCAGCGAC300GACCACGGCA CGGCCTTCCT TGCCGCCCGC GGCGGCTACT TCGTGGCCGA CCTGTCCTCC360GGTCACACCG CACGAGTGAA TGTCGCTGAC GCAGCGCACA CCGATTTCAC CGCGATCGCC420C421(2)SEQ ID NO:262的信息(ⅰ)序列特征(A)长度426碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:262:ATGCATATCA CGCTCAACGC CATCCTGCGT GCGATCTTCG GGGCCGGCGG CAGTGAACTA 60GACGAGCTGC GCCGCCTCAT TCCGCCGTGG GTCACGCTGG GCTCGCGCCT GGCGGCGCTA120CCGAAACCCA AACGCGACTA TGGCCGCCTT AGCCCGTGGG GCCGGCTGGC CGAGTGGCGG180CGCCAGTACG ACACTGTCAT CGACGAGCTC ATCGAAGCCG AGCGGGCCGA CCCGAACTTC240GCCGATCGGA CCGACGTTTT GGCGTTGATG CTGCGCAGCA CTTACGACGA CGGTTCCATC300ATGTCGCGCA AGGACATTGG CGACGAACTG CTCACGCTGC TTGCCGCCGG GCACGAAACC360ACGGCGGCGA CATGGGCTGG GCGTTCGAAC GGCTCAACCG GCACCCCGAC GTGCTCGCGG420CTCTGG 426
(2)SEQ ID NO:263的信息(ⅰ)序列特征(A)长度522碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:263:GTCCTGGTCG CAGGCTGTTC TTCGAACCCG CTGGCTAACT TCGCACCCGG GTATCCGCCC 60ACCATCGAAC CCGCCCAACC GGCGGTGTCA CCGCCTACTT CGCAAGACCC GGCCGGTGCA120GTGCGACCAC TGAGCGGCCA CCCCCGGGCG GCACTATTCG ACAACGGCAC CCGCCAATTG180GTGGCTCTGC GCCCGGGCGC CGATTCGGCG GCACCCGCCA GCATCATGGT CTTCGATGAC240GTGCACGTTG CACCGCGCGT CATTTTTCTG CCGGGCCCGG CAGCCGCGTT GACCAGCGAC300GACCACGGCA CGGCCTTCCT TGCCGCCCGC GGCGGCTACT TCGTGGCCGA CCTGTCCTCC360GGTCACACCG CACGAGTGAA TGTCGCTGAC GCAGCGCACA CCGATTTCAC CGCGATCGCC420CGCCGCTCCG ACGGCAAGCT GGTGCTGGGC AGCGCAGATG GCGCCGTCTA CACGCTTGCC480AAGAACCCGC AGTTGACCGG CGTCGGCGCC GCCACCGTAG CC 522(2)SEQ ID NO:264的信息(ⅰ)序列特征(A)长度739碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:264:GCTGGGGCGC ACCGCCGTCC GGCGGCCCCA GCCCCTGGGC CCAGACCCCG CGCAAAACCA 60ACCCGTGGCC CTTAGTGGCC GGCGCCGCCG CCGTCGTGCT CGTCCTCGTG TTGGGCGCCA120TCGGCATCTG GATCGCCATC CGGCCCAAGC CGGTACAGCC GCCTCAGCCG GTTGCGGAGG180AGCGCCTTAG CGCCCTACTG CTGAACTCCT CAGAAGTCAA CGCCGTGATG GGCTCGTCGT240CCATGCAGCC GGGCAAACCG ATCACATCGA TGGACTCTTC GCCGGTGACG GTGTCCCTGC300CGGACTGCCA GGGCGCGCTG TATACCAGCC AGGATCCGGT GTATGCCGGC ACCGGCTACA360CCGCCATCAA CGGCTTGATT TCATCCGAGC CGGGCGACAA CTACGAACAT TGGGTGAACC420AAGCCGTCGT CGCCTTTCCG ACCGCCGACA AAGCCCGCGC GTTCGTGCAG ACTTCGGCCG480ACAAATGGAA GAACTGCGCA GGCAAGACGG TCACCGTCAC GAATAAGGCC AAGACCTACC540GGTGGACGTT TGCCGACGTC AAAGGCAGCC CGCCGACGAT CACGGTGATA GACACCCAAG600AAGGCGCTGA GGGCTGGGAA TGCCAACGCG CGATGAGCGT GGCCAACAAT GTGGTTGTCG660ACGTCAACGC ATGCGGGTAC CAGATCACCA ATCAAGCAGG CCAGATCGCC GCCAAGATCT720GTTGACAAAG TCAACAAGG 739(2)SEQ ID NO:265的信息(ⅰ)序列特征(A)长度69碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:265:AGACGTCGTC GAGGCCGCCA TCGCCCGCGC CGAAGCCGTT AACCCGGCAC TGAACGCGTT 60GGCGTATGC 69(2)SEQ ID NO:266的信息(ⅰ)序列特征(A)长度523碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:266:ACTGCACCCG GCAGGCGCGA CCAACGGATC GGGTCAACTA GCACTGCCGG TGGAGGCGCC 60CCCGCGGTCT GTGCCTTCCC ACGGGGAACC CTTGGGCAGC GCGGCTCCAG AAGGGTTGGA120GGGAGAGTTC GACGACCGTA TCGACGAGCG GTTCCCGGTC TTCAGCTCGG CCAGTCTCGC180CGAAGCGCTG CCGGGTCCGC TGACCCCGAT GACGCTGGAT GTCCAGTTGA GTGGACTGCG240CGCGGCCGGT CGGGCGATGG GTCGGGTACT GGCGCTTGGC GGTGTCGTTG CCGATGAGTG300GGAGAGAAGA GCCATCGCGG TGTTCGGTCA CCGCCCGTAT ATCGGAGTGT CGGCCAATAT360TGTGGCCGCC GCCCAACTGC CGGGGTGGGA CGCGCAGGCC GTAACCCGGC GGGCACTGGG420CGAGCAACCG CAGGTCACTG AGCTGCTTCC GTTTGGTCGA CCGCAACTTG CGGGCGGACC480GCTCGGCTCG GTCGCGAAGG TGGTCGTGAC GGCACGGTCG CTG 523(2)SEQ ID NO:267的信息(ⅰ)序列特征(A)长度224碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:267:GTGTCGGTGT CGTCGGGGTA GGAGCGACTT CCCCGGCCGG CGCCGGCGCC GGAGCGGGCT 60CTGCAGGAAC CGGTGCCGGC GCCGGCGGCG GGGCGACCAA AGGCCGGATC GATTCGGCCA120GCGCCTTGGC CGCGCCCTTG TCCACCGGGT TGTTGGCGGT CCCGAGCCAT ACCACAAACC180AACGCTGAAG GGGCCCGGCG TCCGGTGCGT TCGCCGCGGG CGAC 224(2)SEQ ID NO:268的信息
(ⅰ)序列特征(A)长度521碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:268:TGAACTGACT GCCCCGCTCG ATCGGCGGCG GCGGCGTGTC ATAGCTGCGC CGCCAGGCCA 60TGAACTGCTC TTCGCCATAG CGGGCCTTGG TCTCGGCCTT GTCCAAACCC TGCAGCGCGC120CGTAGTGGCG TTCGTTGAGC CGCCAGCTAC GCCGCACGGG AATCCAGAGC CGATCGGCGC180TGTCCAACGC CAGATGCGCG GTGGTGATCG CGCGCCGCAG CAACGAGGTG TAGAGCACGT240CGGGCAATAG GTCGTGTTCC GCGATCAGCT CGCCGCTTCG AACCGCCTCT GCCTGGCCCT300TGTCCGTCAG GCCGACATCG ACCCAGCCGG TGAACAGGTT GAGGGCATTC CAGTCGCTCT360CGCCGTGGCG CAGCAACACC AGGCTGCCAG TGTTTGCCAT ACCGGCAAGT CTCTCACGCA420CTCCCGCACT CCTCATCGTG GACCAAAATG CCCGAATTCT CCTCGGTCCG CTGCGCAGCG480CGTTCATACC GCCGAGGTGG TCGGCACCGT AACGGCCGGT T521(2)SEQ ID NO:269的信息(ⅰ)序列特征(A)长度426碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:269:CTCCAGGCTC ATTCGCTCGA ACAAAGCCAC CCGGCCGTAC AGCGGACGCC CCCATTCGTT 60GTCGTGATAG TCGCGGTACA GCTGGGCATC GGGCCCTGGA CGAACCTCCG CCCAGGGGCA120GCGAACCAGC CCGTCGCCGC TCACGCGGGG TCAGAACGGT AGTGCACGAC AGTCTCGCCG180CGCGAAGGGT TTGACGCGTC AGACTCGGCC TCGGCGTCTT CCGACGAGGC GTGGATCGCC240CCGAGCTGAG AGCGTAGCGC CTCGAGCTCA CGGCCGAGCC GTTCCAGCAC CCAGTCCACC300TCGCTGGTCT TGTTCCCGCG CAGCACCTGC GTGAACTTGA CCGCGTCGAC ATCGGCGCGG360GTGACCCCGA ACGCCGGCAG CGTCGTCGCC GTCGTCGCCC GCGGCAGGGG CGGCAACTGC420TCGCCA 426(2)SEQ ID NO:270的信息(ⅰ)序列特征(A)长度219碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:270:GCGGACACGG CGGACAAAGC GCAATCGGCC TCGGCGGCGG CGCCGGCGGC GACGGGGGCC 60AGGGCGGCGC CGGCCGCGGA CTGTGGGGTA CTGGCGGCGC CGGCGGACAC GGCGGGGCAA120GGCGGTGGTA CCGGGGGCCC ACCGCTGCCC GGTCAGGCAG GCATGGGCGC CGCGGGTGGC180GCCGGTGGGC TGATCGGCAA CGGCGGGGCC GGCGGCGAC 219(2)SEQ ID NO:271的信息(ⅰ)序列特征(A)长度571碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:271:AAGATCATCG GCGCCGCTCC TTAGCATCGC TGCGCTCTGC ATCGTCGCCG GCGCGGATCA 60CGGAGGTCCG GCCTTGTACC CCACTCCTCG AACGGTCAGC ACCACAGTCG GGTTCTCGGG120ATCCTTTTCG ACCTTGGCCC GCAGACGCTG GACATGCACG TTCACCAGCC TGGTATCGGC180TGGGTGCCGG TAACCCCATA CCTGTTCGAG CAGCACATCA CGAGTAAACA CCTGGCGCGG240CTTGCGCGCC AATGCGACCA ACAGGTCGAA TTCCAGCGGT GTCAACGAGA TCTGCTCACC300GTTGCGAGTG ACCTTGTGCG CCGGTACGTC GATTTCTACG TCGGCGATGG ACAGCATCTC360GGCGGGTTCG TCGTCGTTGC GGCGCAGCCG CGCCCGCACC CGCGCAACCA GCTCCTTGGG420CTTGAACGGC TTCATGATGT AGTCGTCGGC GCCCGACTCC AGACCCAGCA CCACATCCAC480GGTGTCGGTC TTTGCGGTGA GCATCACGAT CGGAACACCG GAATCGGCGC GCAACACCCG540GCACACGTCG ATGCCGTTCA TACCGGGGCA A 571(2)SEQ ID NO:272的信息(ⅰ)序列特征(A)长度93氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:272:Leu Phe Gly Ala Gly Gly Val Gly Gly Val Gly Gly Asp Gly Val Ala1 5 10 15Phe Leu Gly Thr Ala Pro Gly Gly Pro Gly Gly Ala Gly Gly Ala Gly20 25 30Gly Leu Phe Ser Val Gly Gly Ala Gly Gly Ala Gly Gly Ile Gly Leu35 40 45Val Gly Asn Ser Gly Ala Gly Gly Ser Gly Gly Ser Ala Leu Leu Trp50 55 60Gly Asp Gly Gly Ala Gly Gly Ala Gly Gly Val Gly Ser Thr Thr Gly65 70 75 80Gly Ala Gly Gly Ala Gly Gly Asn Ala Ser Leu Leu Val
85 90(2)SEQ ID NO:273的信息(ⅰ)序列特征(A)长度26氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:273:Met Pro Pro Val Ser Ala Asn Ala Met Val Pro Ala His Ser Thr Pro1 5 10 15Pro Val Ala Asn Ile Glu Val Asn Thr Pro20 25(2)SEQ ID NO:274的信息(ⅰ)序列特征(A)长度26氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:274:Lys Pro Asp Arg Pro Ala Ala Thr Val Gly Ser Cys Thr Thr Val Arg1 5 10 15Ala Pro Cys Ser Gln Pro Val Thr Thr Ala20 25(2)SEQ ID NO:275的信息(ⅰ)序列特征(A)长度20氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:275:Trp Pro Ala Gly Arg Pro Met His Pro Ala Pro Gly Thr Ser Ala Asp1 5 10 15His Pro Pro Asn20
(2)SEQ ID NO:276的信息(ⅰ)序列特征(A)长度140氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:276:Val Leu Val Ala Gly Cys Ser Ser Asn Pro Leu Ala Asn Phe Ala Pro1 5 10 15Gly Tyr Pro Pro Thr Ile Glu Pro Ala Gln Pro Ala Val Ser Pro Pro20 25 30Thr Ser Gln Asp Pro Ala Gly Ala Val Arg Pro Leu Ser Gly His Pro35 40 45Arg Ala Ala Leu Phe Asp Asn Gly Thr Arg Gln Leu Val Ala Leu Arg50 55 60Pro Gly Ala Asp Ser Ala Ala Pro Ala Ser Ile Met Val Phe Asp Asp65 70 75 80Met His Val Ala Pro Arg Val Ile Phe Leu Pro Gly Pro Ala Ala Ala85 90 95Leu Thr Ser Asp Asp His Gly Thr Ala Phe Leu Ala Ala Arg Gly Gly100 105 110Tyr Phe Val Ala Asp Leu Ser Ser Gly His Thr Ala Arg Val Asn Val115 120 125Ala Asp Ala Ala His Thr Asp Phe Thr Ala Ile Ala130 135 140(2)SEQ ID NO:277的信息(ⅰ)序列特征(A)长度142氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:277:Met His Ile Thr Leu Asn Ala Ile Leu Arg Ala Ile Phe Gly Ala Gly1 5 10 15Gly Ser Glu Leu Asp Glu Leu Arg Arg Leu Ile Pro Pro Trp Val Thr20 25 30Leu Gly Ser Arg Leu Ala Ala Leu Pro Lys Pro Lys Arg Asp Tyr Gly35 40 45Arg Leu Ser Pro Trp Gly Arg Leu Ala Glu Trp Arg Arg Gln Tyr Asp50 55 60Thr Val Ile Asp Glu Leu Ile Glu Ala Glu Arg Ala Asp Pro Ash Phe65 70 75 80Ala Asp Arg Thr Asp Val Leu Ala Leu Met Leu Arg Ser Thr Tyr Asp85 90 95Asp Gly Ser Ile Met Ser Arg Lys Asp Ile Gly Asp Glu Leu Leu Thr100 105 110Leu Leu Ala Ala Gly His Glu Thr Thr Ala Ala Thr Trp Ala Gly Arg115 120 125Ser Asn Gly Ser Thr Gly Thr Pro Thr Cys Ser Arg Leu Trp130 135 140(2)SEQ ID NO:278的信息(ⅰ)序列特征(A)长度163氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:278:Val Leu Val Ala Gly Cys Ser Ser Asn Pro Leu Ala Asn Phe Ala Pro1 5 10 15Gly Tyr Pro Pro Thr Ile Glu Pro Ala Gln Pro Ala Val Ser Pro Pro20 25 30Thr Ser Gln Asp Pro Ala Gly Ala Val Arg Pro Leu Ser Gly His Pro35 40 45Arg Ala Ala Leu Phe Asp Asn Gly Thr Arg Gln Leu Val Ala Leu Arg50 55 60Pro Gly Ala Asp Ser Ala Ala Pro Ala Ser Ile Met Val Phe Asp Asp65 70 75 80Val His Val Ala Pro Arg Val Ile Phe Leu Pro Gly Pro Ala Ala Ala85 90 95Leu Thr Ser Asp Asp His Gly Thr Ala Phe Leu Ala Ala Arg Gly Gly100 105 110Tyr Phe Val Ala Asp Leu Ser Ser Gly His Thr Ala Arg Val ASn Val115 120 125Ala Asp Ala Ala His Thr Asp Phe Thr Ala Ile Ala Arg Arg Ser Asp130 135 140Gly Lys Leu Val Leu Gly Ser Ala Asp Gly Ala Val Tyr Thr Leu Ala145 150 155 160Lys Asn Pro(2)SEQ ID NO:279的信息(ⅰ)序列特征(A)长度240氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:279:Trp Gly Ala Pro Pro Ser Gly Gly Pro Ser Pro Trp Ala Gln Thr Pro1 5 10 15Arg Lys Thr Asn Pro Trp Pro Leu Val Ala Gly Ala Ala Ala Val Val20 25 30Leu Val Leu Val Leu Gly Ala Ile Gly Ile Trp Ile Ala Ile Arg Pro35 40 45Lys Pro Val Gln Pro Pro Gln Pro Val Ala Glu Glu Arg Leu Ser Ala50 55 60Leu Leu Leu Asn Ser Ser Glu Val Asn Ala Val Met Gly Ser Ser Ser65 70 75 80Met Gln Pro Gly Lys Pro Ile Thr Ser Met Asp Ser Ser Pro Val Thr85 90 95Val Ser Leu Pro Asp Cys Gln Gly Ala Leu Tyr Thr Ser Gln Asp Pro100 105 110Val Tyr Ala Gly Thr Gly Tyr Thr Ala Ile Asn Gly Leu Ile Ser Ser115 120 125Glu Pro Gly Asp Asn Tyr Glu His Trp Val Asn Gln Ala Val Val Ala130 135 140Phe Pro Thr Ala Asp Lys Ala Arg Ala Phe Val Gln Thr Ser Ala Asp145 150 155 160Lys Trp Lys Asn Cys Ala Gly Lys Thr Val Thr Val Thr Asn Lys Ala165 170 175Lys Thr Tyr Arg Trp Thr Phe Ala Asp Val Lys Gly Ser Pro Pro Thr180 185 190Ile Thr Val Ile Asp Thr Gln Glu Gly Ala Glu Gly Trp Glu Cys Gln195 200 205Arg Ala Met Ser Val Ala Asn Asn Val Val Val Asp Val Asn Ala Cys210 215 220Gly Tyr Gln Ile Thr Asn Gln Ala Gly Gln Ile Ala Ala Lys Ile Cys225230 235 240(2)SEQ ID NO:280的信息(ⅰ)序列特征(A)长度22氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:280:Asp Val Val Glu Ala Ala Ile Ala Arg Ala Glu Ala Val Asn Pro Ala1 5 10 15Leu Asn Ala Leu Ala Tyr
20(2)SEQ ID NO:281的信息(ⅰ)序列特征(A)长度174氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:281:Leu His Pro Ala Gly Ala Thr Asn Gly Ser Gly Gln Leu Ala Leu Pro1 5 10 15Val Glu Ala Pro Pro Arg Ser Val Pro Ser His Gly Glu Pro Leu Gly20 25 30Ser Ala Ala Pro Glu Gly Leu Glu Gly Glu Phe Asp Asp Arg Ile Asp35 40 45Glu Arg Phe Pro Val Phe Ser Ser Ala Ser Leu Ala Glu Ala Leu Pro50 55 60Gly Pro Leu Thr Pro Met Thr Leu Asp Val Gln Leu Ser Gly Leu Arg65 70 75 80Ala Ala Gly Arg Ala Met Gly Arg Val Leu Ala Leu Gly Gly Val Val85 90 95Ala Asp Glu Trp Glu Arg Arg Ala Ile Ala Val Phe Gly His Arg Pro100 105 110Tyr Ile Gly Val Ser Ala Asn Ile Val Ala Ala Ala Gln Leu Pro Gly115 120 125Trp Asp Ala Gln Ala Val Thr Arg Arg Ala Leu Gly Glu Gln Pro Gln130 135 140Val Thr Glu Leu Leu Pro Phe Gly Arg Pro Gln Leu Ala Gly Gly Pro145 150 155 160Leu Gly Ser Val Ala Lys Val Val Val Thr Ala Arg Ser Leu165 170(2)SEQ ID NO:282的信息(ⅰ)序列特征(A)长度61氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:282:Val Gly Val Val Gly Val Gly Ala Thr Ser Pro Ala Gly Ala Gly Ala1 5 10 15Gly Ala Gly Ser Ala Gly Thr Gly Ala Gly Ala Gly Gly Gly Ala Thr
20 25 30Lys Gly Arg Ile Asp Ser Ala Ser Ala Leu Ala Ala Pro Leu Ser Thr35 40 45Gly Leu Leu Ala Val Pro Ser His Thr Thr Asn Gln Arg50 55 60(2)SEQ ID NO:283的信息(ⅰ)序列特征(A)长度133氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:283:Met Ala Asn Thr Gly Ser Leu Val Leu Leu Arg His Gly Glu Ser Asp1 5 10 15Trp Asn Ala Leu Ash Leu Phe Thr Gly Trp Val Asp Val Gly Leu Thr20 25 30Asp Lys Gly Gln Ala Glu Ala Val Arg Ser Gly Glu Leu Ile Ala Glu35 40 45His Asp Leu Leu Pro Asp Val Leu Tyr Thr Ser Leu Leu Arg Arg Ala50 55 60Ile Thr Thr Ala His Leu Ala Leu Asp Ser Ala Asp Arg Leu Trp Ile65 70 75 80Pro Val Arg Arg Ser Trp Arg Leu Asn Glu Arg His Tyr Gly Ala Leu85 90 95Gln Gly Leu Asp Lys Ala Glu Thr Lys Ala Arg Tyr Gly Glu Glu Gln100 105 110Phe Met Ala Trp Arg Arg Ser Tyr Asp Thr Pro Pro Pro Pro Ile Glu115 120 125Arg Gly Ser Gln Phe130(2)SEQ ID NO:284的信息(ⅰ)序列特征(A)长度63氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:284:Pro Gly Ser Phe Ala Arg Thr Lys Pro Pro Gly Arg Thr Ala Asp Ala1 5 10 15Pro Ile Arg Cys Arg Asp Ser Arg Gly Thr Ala Gly His Arg Ala Leu
20 25 30Asp Glu Pro Pro Pro Arg Gly Ser Glu Pro Ala Arg Arg Arg Ser Arg35 40 45Gly Val Arg Thr Val Val His Asp Ser Leu Ala Ala Arg Arg Val50 55 60(2)SEQ ID NO:285的信息(ⅰ)序列特征(A)长度72氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:285:Gly His Gly Gly Gln Ser Ala Ile Gly Leu Gly Gly Gly Ala Gly Gly1 5 10 15Asp Gly Gly Gln Gly Gly Ala Gly Arg Gly Leu Trp Gly Thr Gly Gly20 25 30Ala Gly Gly His Gly Gly Ala Arg Arg Trp Tyr Arg Gly Pro Thr Ala35 40 45Ala Arg Ser Gly Arg His Gly Arg Arg Gly Trp Arg Arg Trp Ala Asp50 55 60Arg Gln Arg Arg Gly Arg Arg Arg65 70(2)SEQ ID NO:286的信息(ⅰ)序列特征(A)长度74氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:286:Asp His Arg Arg Arg Ser Leu Ala Ser Leu Arg Ser Ala Ser Ser Pro1 5 10 15Ala Arg Ile Thr Glu Val Arg Pro Cys Thr Pro Leu Leu Glu Arg Ser20 25 30Ala Pro Gln Ser Gly Ser Arg Asp Pro Phe Arg Pro Trp Pro Ala Asp35 40 45Ala Gly His Ala Arg Ser Pro Ala Trp Tyr Arg Leu Gly Ala Gly Asn50 55 60Pro Ile Pro Val Arg Ala Ala His His Glu65 70
(2)SEQ ID NO:287的信息(ⅰ)序列特征(A)长度174碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:287:CCGCACGTAA CACCGTGAAT TGAAGGGAGC CGCTGGTCAT GGGCCGATTC TATCCGTGGG 60CGAACGGTTA TTGACGGCCC GGAGGCCACT CCGCTGCCAC CAAGTGGTGA CTCAGCGCGT120TTTCACGGCA ACGAACGGCG GACACACCAC TTGACATTCG ACAGCACGGC CGCG 174(2)SEQ ID NO:288的信息(ⅰ)序列特征(A)长度404碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:288:TCGCAAACGG GGTGACGTTC CGTCCGGTGG CGCTAGAGAG TTTGTCGCAC TTTCCGGTGA 60CCGTCGCCGC GCACCGCAGC ACCGGTGAGC TCACGCTGCT AGTGGAGGTG CTCGACGGTG120CGCTGGGCAC GATGGCGCCC GAAAGCCTCG GCAGGCGGGT GCTGGCTGTG TTACAGCGCT180TGGTCAGCCG GTGGGATCGG CCGCTGCGCG ACGTCGACAT TCTGCTGGAC GGCGAGCACG240ATCCGACCGC ACCCGGCCTG CCGGATGTGA CGACGTCGGC ACCCGCGGTG CATACCCGGT300TCGCCGAAAT CGCTGCGGCA CAGCCTGACT CGGTGGCGGT CAGTTGGGCG GATGGTCAGC360TGACGTACCG GGAGCTGGAT GCATTGGCCG ACCGGCTGGC CACT 404(2)SEQ ID NO:289的信息(ⅰ)序列特征(A)长度134氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:289:Ala Asn Gly Val Thr Phe Arg Pro Val Ala Leu Glu Ser Leu Ser His1 5 10 15Phe Pro Val Thr Val Ala Ala His Arg Ser Thr Gly Glu Leu Thr Leu20 25 30Leu Val Glu Val Leu Asp Gly Ala Leu Gly Thr Met Ala Pro Glu Ser35 40 45Leu Gly Arg Arg Val Leu Ala Val Leu G1n Arg Leu Val Ser Arg Trp50 55 60Asp Arg Pro Leu Arg Asp Val Asp Ile Leu Leu Asp Gly Glu His Asp65 70 75 80Pro Thr Ala Pro Gly Leu Pro Asp Val Thr Thr Ser Ala Pro Ala Val85 90 95His Thr Arg Phe Ala Glu Ile Ala Ala Ala Gln Pro Asp Ser Val Ala100 105 110Val Ser Trp Ala Asp Gly Gln Leu Thr Tyr Arg Glu Leu Asp Ala Leu115 120 125Ala Asp Arg Leu Ala Thr130(2)SEQ ID NO:290的信息(ⅰ)序列特征(A)长度526碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:290:GCTTCGACGG CTACGAGTAC CTGTTCTGGG TGGGTTGTGC GGGCGCCTAC GACGACAAGG 60CCAAGAAGAC CACCAAGGCC GTCGCCGAGC TGTTCGCCGT CGCCGGGGTG AAATACTTGG120TGCTGGGCGC TGGGGAAACC TGCAACGGCG ACTCGGCGCG CCGCTCCGGC AACGAGTTCC180TCTTCCAGCA GCTGGCACAA CAGGCCGTCG AGACCCTGGA CGGTTTGTTC GAGGGTGTGG240AGACCGTCGA CCGCAAGATC GTTGTCACCT GCCCGCACTG CTTCAACACC ATCGGCAAGG300AATATCGGCA GCTGGGCGCC AACTACACCG TGCTGCACCA CACCCAGCTG CTCAATCGGT360TGGTGCGCGA CAAGAGGCTG GTCCCTGTCA CTCCGGTTTC TCAGGACATC ACCTACCACG420ACCCGTGCTA CCTGGGTCGG CACAACAAGG TCTACGAGGC ACCACGGGAG CTGATCGGTG480CCGCGGGGGC CACCTGAGCC GAGATGCCGC GCCATGCCGA CCGCAG 526(2)SEQ ID NO:291的信息(ⅰ)序列特征(A)长度487碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:291:CTCGCCGCCG TGATCTGGCC GGCGAACTTC GTCAGTGCAT CCAGACCCCA ACGATCATCG 60ATCAGGCCGA TGCCCATGAT CACCGCACCG GCCACCAGCA CCGCGGGCAT GCCGGTGGAA120TAGACGAACC CCCGGGTGAG TGCCGGAAGC TGGGAGGCAA GAAAGACGGC GCCGACAATG180CCCAGGAACA TCGCCAACCC ACCCATCCGA GGGGTAGGCG TGACGTGCAC ATCTCGCTCC240CGCGGGTAGG CGACGGCTCC CAGGCGACTG GCCAGCATCC GCACCGGACC GGTCGCAAAA300TAGGTGATGA TCGCCGCGGT CAGCCCGACC AGCGCAAGCT CACGCAGCGG GACACCGGCG360CCGCGATAGG ACAGGGCGAG CAAGCCACCG GCAACGCCGG CCACATCGCT GGACACCTCG420AGACCGTACT GCACCAACCT GAAGAGCTGA ACACTCGCCG AACGTGCAAC AGCTGCGAAC480AATTGGG 487(2)SEQ ID NO:292的信息(ⅰ)序列特征(A)长度528碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型eDNA(ⅹⅰ)序列描述SEQ ID NO:292:ACGAAGCGCG AGAATATGAG CCGGGGCAAC CCGGCATGTA CGAGCTTGAG TTCCCGGCGC 60CTCAGCTGTC GTCGTCCGAC GGCCGTGGTC CGGTGTTGGT GCACGCTTTG GAAGGTTTCT120CCGACGCCGG CCATGCGATC CGGCTGGCCG CCGCCCACCT CAAGGCGGCC CTGGACACAG180AGCTGGTCGC GTCCTTCGCG ATCGATGAAC TACTGGACTA CCGCTCGCGG CGGCCATTAA240TGACTTTCAA GACCGATCAT TTCACCCACT CCGATGATCC TGAGCTAAGC CTGTATGCGC300TGCGCGACAG CATCGGCACC CCATTTCTGC TGCTGGCGGG TTTGGAGCCG GACCTGAAGT360GGGAGCGGTT CATCACCGCC GTCCGATTGC TGGCCGAGCG CCTGGGTGTA CGGCAGAACC420ATCGGCCTGG GCACCGTCCC GATGGCCGTT CCGCACACAC GACCGATCAC GATGACCGCT480CATTCCAACA ACCGGGAGCT ATCTCCGATT TTCAACCGTT CGATCTCC 528(2)SEQ ID NO:293的信息(ⅰ)序列特征(A)长度610碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:293:CCAAGCCCGT CAAGGAGCCG GTGCCGGCCT TGCCTCCGGT GCCGCCGACG CCGGCGTTGC 60CGCCGTTGCC GCCGTTGCCG CCGGTACCGG GGTTTCCTAC GGTGCCGCCG CCCGGCAGCA120TGGCCCCGCT GTTTAGGCCG TTTTCGCCGG CCCCGCCGTC ACCGGCTTTG CCGCCATCGC180CGCCGTTGCC GCCGCTGGTG GGGGTGGCGG CCTGGTTGAC GTATTGTTCC ACCGGCCCGG240CCCTTGACCC TTTGGCGGTG TCGATCGCGG CGTCGATGGA TCCGCCGACC ACGACGTGCG300AAGCCTCGCC TGCCGCCGCA GCCGCCCAAC TGTGTCGCGG CTCCTGCGAT TTGGCCCCGG360CCGACGAGAT GATGGGCACC ACCGGAGCCT GCGGCCGTCT GGGGGAGGCC AGCGCGGGTT420CGCGGTCACG CCATACGCGA CGGTGCGCCG CCGCTTCGGA GATTTGCAGG CTGCGTTGCA480CCAGATCGAG CAGCGGTGTG CCCAGGGACT GGGTTAGCCC GTTGGCGCCG CCGTTGTAGC540GGCGAGCGCA ATATCGGTGC CCACTCGACC CAACCGCGAC TCCATAAGCG ACACCATTCG600CGGTTGATGC 610
(2)SEQ ID NO:294的信息(ⅰ)序列特征(A)长度164氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:294:Phe Asp Gly Tyr Glu Tyr Leu Phe Trp Val Gly Cys Ala Gly Ala Tyr1 5 10 15Asp Asp Lys Ala Lys Lys Thr Thr Lys Ala Val Ala Glu Leu Phe Ala20 25 30Val Ala Gly Val Lys Tyr Leu Val Leu Gly Ala Gly Glu Thr Cys Asn35 40 45Gly Asp Ser Ala Arg Arg Ser Gly Asn Glu Phe Leu Phe Gln Gln Leu50 55 60Ala Gln Gln Ala Val Glu Thr Leu Asp Gly Leu Phe Glu Gly Val Glu65 70 75 80Thr Val Asp Arg Lys Ile Val Val Thr Cys Pro His Cys Phe Asn Thr85 90 95Ile Gly Lys Glu Tyr Arg Gln Leu Gly Ala Asn Tyr Thr Val Leu His100 105 110His Thr Gln Leu Leu Asn Arg Leu Val Arg Asp Lys Arg Leu Val Pro115 120 125Val Thr Pro Val Ser Gln Asp lle Thr Tyr His Asp Pro Cys Tyr Leu130 135 140Gly Arg His Asn Lys Val Tyr Glu Ala Pro Arg Glu Leu Ile Gly Ala145 150 155 160Ala Gly Ala Thr(2)SEQ ID NO:295的信息(ⅰ)序列特征(A)长度161氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:295:Arg Arg Arg Asp Leu Ala Gly Glu Leu Arg Gln Cys Ile Gln Thr Pro1 5 10 15Thr Ile Ile Asp Gln Ala Asp Ala His Asp His Arg Thr Gly His Gln20 25 30His Arg Gly His Ala Gly Gly Ile Asp Glu Pro Pro Gly Glu Cys Arg35 40 45Lys Leu Gly Gly Lys Lys Asp Gly Ala Asp Asn Ala Gln Glu His Arg50 55 60Gln Pro Thr His Pro Arg Gly Arg Arg Asp Val His Ile Ser Leu Pro65 70 75 80Arg Val Gly Asp Gly Ser Gln Ala Thr Gly Gln His Pro His Arg Thr85 90 95Gly Arg Lys Ile Gly Asp Asp Arg Arg Gly Gln Pro Asp Gln Arg Lys100 105 110Leu Thr Gln Arg Asp Thr Gly Ala Ala Ile Gly Gln Gly Glu Gln Ala115 120 125Thr Gly Asn Ala Gly His Ile Ala Gly His Leu Glu Thr Val Leu His130 135 140Gln Pro Glu Glu Leu Asn Thr Arg Arg Thr Cys Asn Ser Cys Glu Gln145 150 155 160Leu(2)SEQ ID NO:296的信息(ⅰ)序列特征(A)长度175氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:296:Glu Ala Arg Glu Tyr Glu Pro Gly Gln Pro Gly Met Tyr Glu Leu Glu1 5 10 15Phe Pro Ala Pro Gln Leu Ser Ser Ser Asp Gly Arg Gly Pro Val Leu20 25 30Val His Ala Leu Glu Gly Phe Ser Asp Ala Gly His Ala Ile Arg Leu35 40 45Ala Ala Ala His Leu Lys Ala Ala Leu Asp Thr Glu Leu Val Ala Ser50 55 60Phe Ala Ile Asp Glu Leu Leu Asp Tyr Arg Ser Arg Arg Pro Leu Met65 70 75 80Thr Phe Lys Thr Asp His Phe Thr His Ser Asp Asp Pro Glu Leu Ser85 90 95Leu Tyr Ala Leu Arg Asp Ser Ile Gly Thr Pro Phe Leu Leu Leu Ala100 105 110Gly Leu Glu Pro Asp Leu Lys Trp Glu Arg Phe Ile Thr Ala Val Arg115 120 125Leu Leu Ala Glu Arg Leu Gly Val Arg Gln Ash His Arg Pro Gly His130 135 140Arg Pro Asp Gly Arg Ser Ala His Thr Thr Asp His Asp Asp Arg Ser145 150 155 160Phe Gln Gln Pro Gly Ala Ile Ser Asu Phe Gln Pro Phe Asp Leu
165 170 175(2)SEQ ID NO:297的信息(ⅰ)序列特征(A)长度178氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:297:Lys Pro Val Lys Glu Pro Val Pro Ala Leu Pro Pro Val Pro Pro Thr1 5 10 15Pro Ala Leu Pro Pro Leu Pro Pro Leu Pro Pro Val Pro Gly Phe Pro20 25 30Thr Val Pro Pro Pro Gly Ser Met Ala Pro Leu Phe Arg Pro Phe Ser35 40 45Pro Ala Pro Pro Ser Pro Ala Leu Pro Pro Ser Pro Pro Leu Pro Pro50 55 60Leu Val Gly Val Ala Ala Trp Leu Thr Tyr Cys Ser Thr Gly Pro Ala65 70 75 80Leu Asp Pro Leu Ala Val Ser Ile Ala Ala Ser Met Asp Pro Pro Thr85 90 95Thr Thr Cys Glu Ala Ser Pro Ala Ala Ala Ala Ala Gln Leu Cys Arg100 105 110Gly Ser Cys Asp Leu Ala Pro Ala Asp Glu Met Met Gly Thr Thr Gly115 120 125Ala Cys Gly Arg Leu Gly Glu Ala Ser Ala Gly Ser Arg Ser Arg His130 135 140Thr Arg Arg Cys Ala Ala Ala Ser Glu Ile Cys Arg Leu Arg Cys Thr145 150 155 160Arg Ser Ser Ser Gly Val Pro Arg Asp Trp Val Ser Pro Leu Ala Pro165 170 175Pro Leu(2)SEQ ID NO:298的信息(ⅰ)序列特征(A)长度921碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:298:AATTCGGCAC GARCAGCACC AACACCGGCT TCTTCAACTC CGGCGACGTC AATACCGGTA 60TCGGCAACAC CGGCAGCTTC AACACCGGCA GCTTCAATCC GGGCGATTCC AACACCGGGG120ATTTCAACCC ANGCAGCTAC CACACGGGGA CTCGGAAACA CCGGCGATTT TACACCGGCS180CCTTCATCTC CGGCAGCTAC AGCAACGGGT CTTGTGGAGT GGAAATTATC AGGGCTCATT240GGNTGCACCC GGSCTTRCGA ATCCCTCGKG CCAATTCAAC TCCTCNACAA GCTTGCGGCC300GCACTCSAGC CCGGGTGAAT GATTGAGTTT AACCGCTNAN CAATAACTAG CATAACCCCT360TKGGGCCTCT AAACGGGTCT TGAAGGGTTT TTTGCTGAAA GGANGAACTA TATCCGGATA420ACTGGCGTAN TACGAAAAGC CGCACCGATC GCCTTCCCAA CAGTTGCGCA CCKGAATGGC480AATGGACCNC CCTKTTACCG GSCATTAACN CGGGGGTGTN GGKGTTACCC CCACGTNACC540GCTACCTTGC CANNSSCCTN RSGCCGTCTT TCSTTTCTTC CTTCCTTCTC CCMCTTCGCC600GGTTCCCNTC AGCTCTAAAT CGGGGNNCCC TTTMGGGTTC CAATTATTGC TTACNGSCCC660CCACCCCAAA AAYTNATTNG GGTTAATGTC CCTTMTTGGG CNTCCCCCTA WTNANNGTTT720TCCCCCTTNA CTTTGRSTCC CTTCYTTATW NTGAMNCTNT TTCCACYGGA AAAMNCTCCA780CCNTTYSSGS TTTCCTTTGA WTTATMRGGR AATTSCAATY CCGCYTTKGG TTMAANTTAA840CYTATTTCNA ATTTTCCCGM TTTTMMNATR TTNSNCKCGM KNCTCCNRKA SSGNTTTCCT900CCCCCYTTSS GKTYCCCCRN G 921(2)SEQ ID NO:299的信息(ⅰ)序列特征(A)长度1082碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:299:AATTCGGCAC GAGATANGGG CGCACCGGGG TCCGCAGCCG GCGGGACCGT CGCCAGCACC 60ACCGGGGTCA ACAGCACCAC GGTGGCGTCC ANGCAGAGCG CCGCGGTGAT GGCGGCCGAG120ACGGCRAACA CCTGCCGTAG CAGTCGGTGC GACTCCGCGC TCGCTCGANC CATGGCCGCG180CCGGCTGCCT CGAACANGCC TTCGTCGTCC ACAGCTTAGC CAGCANCCAA ACCGCACCCA240GAAACCCACA CGCCCGCCGC CCCGGANACC TGCGCCATCG KCTGCTGGGG CGANATCCCC300CGATCGCTNA CANGATGACC GCTGCCGGAA CGCCGCCGCT GCCTCCGGGC AGCCGCGTGG360GCSGGGCAAC CGCGAACCCA NGAACACGGC AAGCAGTATC ANCGCAACAG CAATTGTCAA420GGGCTAAACG CTTCACATCC AGGGATCTCG CGGCGCCACA CCGTCGGMTC TGCAGSGCGA480CCCCNTCCTN GGGCGGNCAC TCNTCAAAGA TGCNGATCNA CAGKCTAGGT CTTCGGCCGA540TATGSAAGGN CCCAACGGNT TTAAAGCGGC SAAAAAASTC TCCCANTGGA TAAAATCAGC600CGGGGANCCC CCCGTGSCMM NGTCYCGGKC ATTNTTCAAC MGGTTTNACG GCGGKTGCNG660GCCAACTKGC CAAAMTTAAG KTNGGGGNTY CGGGGCGGTA ACCGGCNNTK NGCCCCTTAA720AAAACCGGNC YTTTCTKGAT TAMMACCGGN CCCCCAWTGG CGGKTGKTCC CANGNTYAAC780AMCCYCCCSS MNGGGKTGGS SAACCCTTCC CGNGGGGTTC NTKGTTSCYT AWMCCCCCGG840AAACCSGKYG GGKTGGCRTN WASSAMNCCC CMNGYYTCTT TAAAGGCCAN KNRAAWGKYT900CCTTGGGAAW CCTNCAATYC GAAAAYYCTC CTYMMGSSCN CTTKCWRTYN NRNGGGAACS960AMWTNYCCNC GWTTCAWTCG GGTCCGASMN AAACKCTTTY TTTTYCGSSC STCCMGGSNC 1020SGGTKNANAN AAASATTTMC YYCNNNANKK YYYCSSGCTT CYKMGRRNRR GMGAACCCGR 1080GS 1082(2)SEQ ID NO:300的信息(ⅰ)序列特征(A)长度990碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:300:AATTGGCACG AGTGATCGCG CTGAAGCCGG TAGCGCGGGT GGCTCGGGTG GTTTGCGAAC 60RAAATCCGCT CGANGTGGTC TCGGTAGGCG GTGTCCANAA CGGTGGCGCG GTGCCGGCGG120ATCTGATCGG CGCGGCCGTA GTGCACGTCG GCGGGCGTGT GCAGTCCGAT GCCGGAATGC180TTGTGTTCGT GGTTGTACCA GCCGAAGAAC CGGTCGCAGT GCACCCGGGC CGCCTCGATC240GACTCGAACC GTTTCGGGAA ATCGGGCCGG TACTTGAAGG TCTYGAACTG GGCCTCAGAC300AACGGGTTGT CTTGCTGGTG TGCGGGCGTG AGTGCGACTT GGTGACACCG AAGTCGGCCA360NCANCAATGC CACCGGTTTG GAACTCATCC ACAACCCCCG TCCGCGTCMA GGTCACTTGT420NCGGCGCTAA TTTNYTGGGC GGCAAGGGTT TGCCGAYCAN KCCGCTCGGC CAAAACTTCG480ANTCNCSCCA AGGCCNCCAT CCNCCCAAAC AMGTTACGGG ANAAAANATY CAAAGAYCAC540CYTCCGGKTN TTATANCTYC CCYTTTGSTY GGGCCCCCCN CYYTGKKNAT ACCCCTNCCA600AWTCCCAACN CCCKCCAANA RCYKGGGGCC CCCNCCAACC CGGGKGAAKA WTAATTTAAA660CCCYAACMAW ACTWMMNACC CNNGGGSCCY AAMCGTYYNR AGGTTTTSCT NAAAGAAASA720ANTCGGAAMC CGGNTSTACC AAAAASCCCK CCNWTCCCTC CRASATTGSC NCCSAAWKSA780AKGCCCCCNY TCSGCNWNNC CSGCGGKKKT KKGTTNCCCT WMRCWMWYTS GGCCNASCCN840CKYYSSMYCC CCCCTCCCCM CTCCGNKTCC CCAMCCYANC MGGCCCCYTM GKKCCCWKNT900YKGCCCCCCC AMMNNNGGGG WGACCCTNGG CCCCMKRRGM TCCCNANTGA MCCTCWGNRA960MKCYCCNRAR ANMCCSCNCC NGCNCRCKNN 990(2)SEQ ID NO:301的信息(ⅰ)序列特征(A)长度223碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:301:AATTCGGGTG GCAACGCGGG CCTGTTCGGC AACGGCGGCG CCGGTGGTGC CGGTGGGGCT 60GGTGGTGGCG CCGGCGGCGC GGGCGGTAAC GCGGGGTGGT TTGGTCATGG GGGCGCTGGC120GGCGTGGGTG GTGTANGTGC GGCCGGGGCC AACGGTGCTA CGCCCGGTCA GGATGGGGCG180GCTGGTGTTG CCGGGTCGGA CRACRCTCGT GCCGCTCGTG CCG 223(2)SEQ ID NO:302的信息(ⅰ)序列特征(A)长度418碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA
(ⅹⅰ)序列描述SEQ ID NO:302:AATTCGGCAC GANGCGGCAA CGGTGGCAGC GGCGGCACGT CNGTTGCCAC CGGGGGGGCC 60GGGAACGGCG GTGCCGGCGG CGCCGGCGGC GGGGCCGGGC TGATCGGCAA CGGCSGCAAC120GGCGGCAGTG GCGGAATGGG CGATGCCCCG GGCGGCACCG GCGTCNGCGG CATCRGTGGG180CTGTTGTTGG GTTTGGACRG CGCCAACGCC CCGGCCAGCA CCAACCCGCT GCACACCGCG240CAGCACAGGC GTTGGCCGCA GTCAACGCGC CCATCCAGGC CGTGACCGGG CGCCCCTGAT300CGGCAACGCG CCAACGGCGC CCCGGGCAAC GGGGCCCCCG GCRGGCACGG CGGGTGGTTG360TTCGGCGGCG GAAGGAACGG CGGGTCCGGC GTCANCRGCG GGGCGGGCGG AAATGCCG 418(2)SEQ ID NO:303的信息(ⅰ)序列特征(A)长度1049碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:303:AATTCGGCAC GAGGGGCACG ATCGCATACA GCGCTCGCGG CAGACCCGCC CGATACAGCA 60GCTCGGCACA CGCGAGCGCA CAATACGGCG TCTGGCTGTC CGGCTTGARC ACCACCGCGT120TACCGGCCAC CAGCGCGGGC ACCGAGTCCG ACACCGTAAG CGTCATGGGG TAGTTCCACG180GCGAGATCAC CCCCACCACG CCCTTCGGTT GATAGCACAC CGTGGTCTTG CCTATCCCGG240GCAGCAGCGG CTGTGCCTTA CGGGGCTTCA GCAGGTCCAC ACAGACTCGT GCSTTATAAT300TNCGCSTTCC GCGATCAGAT CGACAATTTC CTCTTGCGCC GCCCATCGGG CCTTGCCCGC360CTCGGCTTGC AGGAAGTCCA TGAAGAACTC GCGGTTCTCG ATNAACAGGT CGCGATAGCG420GCSGATGACT GCAGCTCGCT CGATNACGGG ACCTTCGCCA GTCGGTCTGC GCCGCGCGAN480CTTCCGCGAA TGCCGCTTCG ACTTCCGCGG NCGTGCCAAC GGAATCNTAT CACGGGTTGC540CGGTTAAAAC TCCTCAATST NCYGGTCGAA ATTCGGCAAC TTCTTATCCC GGCAGGTRCC600AACSANNCAA ACCTCGGCAA GGTTAGGMTT TCCCCCNCTT YCAAAAATNC GGKTTTTGGN660CMAATTTCGC CKCNATGKTG MCAAGGMTCT CKAANAAKCS GGGTCYTCTN NTCNGKGGAK720CCAAAMGGKT TTGGGGMAGC GKNMNCCAAN CCTWACCCTG KTKAANGGNW TTCCCCCCGG780GGGAKKGNGA ATYCYCCSNA NCCCRGGGGG GNMCARATTC TYCCGGMCTC CTCKGGAWTC840WGMGSTTTCC CAAAAAACSC CCCAAATTMM TTTTTCCRCN TRTTGANACW CTTTTKARCA900MMCSSAARNS ANMCNCTCYC CKCTKTGKTK AAAAAGNAYW CCCCMAAATT TYTAWTTSSC960CCSCGCGGGN CCCNCTNTTT TSCNMTWCTM WNYTNCRMCC MMMSNCKSNG KKGGNRCCNN 1020CRCCSNCCCM AAWYNTKGYN KNTATMAGC 1049(2)SEQ ID NO:304的信息(ⅰ)序列特征(A)长度1036碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA
(ⅹⅰ)序列描述SEQ ID NO:304:AATTCGGCAC GAGGGAATCG AGAATCCCGG AATGGTGAAG CCTCGGTGCC TGCCGTTACG 60CCAAGAKTCA GGGTGAGCGG CCCCCCGGTG GGAATGCTGA SGCCAACCGG GAAAAGGGTG120AGGGCTGGGG TGGAATAACT GAANGTTACT GGGATGGAAA ACCCGGTATT GATATGTATT180GGGCCGATCA ANGTTGTGGG AATGGGGGAA GGCTGAGGGC GACCTGTTGG ATTTGGGGAA240TTGTYRTGGA CRAKACWGGC CAGCCMGCGT GATGGTTTGG TTSAANTTTT GTGCCGSCCA300CANGGTGATG GGATTGATTT TGATGGGGCC SATCGAAATA TTGGGTATGC CNACGCCSAA360CGAGATYGCC GGGACGTTCA TGGGCGGGAC AACCMASGGT CCSANGTAAK GGTTTCCTTN420ATNTTGATCG GGATTCCGGA ACTMTSTCGA TGSGCTCSAY MTSATSGCCC NACNCCWCCG480YTTATTTCMS GCTNAYGGGA ATBAMRGGAA CAAYNTCCCT CCCMGGAAAA ACCAACMSGC540CCTGGTNSYC CNCCCRCCNC AKAACCCRTT KCTGTRSTMC CCSMAAATNA CSCCCSCTTS600NACTCCNCSG AANTNSCCCC CCCSCKNNTT ATSTYCCCGK GTTCCCCCMC CCCTTNAAMC660TCCCCGGTTA ACCCCCWTNT SNCNCCCCCS YTAAKMNCRG GCTTSTTNCT CCCCCYTRMK720CNCCCCCTCK SAMCWNCCNC CTCKAACNAC CCCKCYKGSM TNCCCAATNT WCMWCKCCNS780KTTNTMCTKC CCAAYTNCRC CCNCRCTCCC CCKSTSTCAM WTATAAAACC WCWYAWYNNK840KCNCWMAWTA MGACWCTCNY NCCCCNCNCK NTTKTAMWCC CKMCCCKCSW TWCYCKCSCC900CCMTCTMNAC YCCCCCKKTY NKWMCCCTTC CCCCCCTCCC MCNMBMKTCT YCSGKTWCWC960NCYNTTMTCN CYNANMCKCK KTCTCTTCCN CRNTCTCCCC CCWCCCCCCV KKCTCTSKCC 1020CNCNCTCCSC MMKGSC 1036(2)SEQ ID NO:305的信息(ⅰ)序列特征(A)长度1036碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:305:AATTCGGCAC GAGATCATGA ATAGCGGGCT GGTCAGCACC GAAGTGGTCG GCGATCTCGC 60GAGCAAGTCT CGTCTGCTCG CCCAGCAGGA GGTCGGCATC GATGCGGACA CCTGCGATGT120CTTGGATGGT GTTCAGTTGC AGGTAAGGCC GACGCCGCAG CTTTGCTAGC AGGGTGTCTT180GGCTCTTCGC ACGTGAGGTA ACCAATAACT CCGACGCAGA CCAACTCCGG CCCTCGATCC240GGGTACCAGG CTCCGCCGGA GCCAGCCGTT GTGCCCCCTG GGCCGAAGGT CAGCTGCTGT300GCGATCGAAG TAAGAAACCG CGCCATGCCC GTCGCCAAGT ACGACTGACC GAGCAAACGA360ACGATCGTCG TCCTTTCCGT GGGGGTAATC GANCCCAGCA ACCGCACGAG CCACCAATCA420TTGGGATTCG GCCACTGACC GACCAACCGC CTGTGCGACA CCCCAGCGGA ATTGGTGGTC480TTCCGCGGGG CCGCNAACGG AATCANCGSG ACGCGCTCGC CGAASCANCC GCATANCCNT540ACATANCAAC GGNNTCTGCG CCCACATTTC GGGSTTMTGC CCCTCNGCAA CSSNAAYNCC600CCCAATTCYG AACNAAAAAA TTGGYCCATY ARNGTYCTCM CCAAAAACCN AWTCCCCKTA660TCCCCCGGGG GGGRCCCCYY NMNAAAACGG CCCWWAANCC CCSGGGCSCC CGGGTTRWTN720CCCCTTGTCG GCCCNCCSGG TTTGGTCMCM GGSCMMTNWN GGGNTGCSCC CCCNCNAAAA780AAAAAYCKNG NCAAATYAAA CCCKYCMAAA ASKTGGGSSC CCCMARCCGG GGKAAKKWWA840ANTTAANCCN KAAAAAAAWW NCANNMCCCC NGGGNCCTAA GGKYTTAGGG GTTSTTNANG900ARAAAATMTC CANATMNSSK TTNNAAAAAA ASCCSWAKCC CCCNNNKKNN CCAAWKAARR960SRCCTTCGGG TNWNSGGGGG KKKKKTNCMS KMNMMTTWGR CCCNCCGCCN NNTWKCCTTN 1020TCCNYGGNGC RNCAGN 1036
(2)SEQ ID NO:306的信息(ⅰ)序列特征(A)长度1060碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:306:AATTCGGCAC GAGTCGATTC GATCGAACAC GCCCGCACCT GGCCAGGCCA CATGGGCGCG 60GCCATGGCCA ACGCCTACTC GGCCAACCCG AATCCATTCG GCGTCTCACC GCAACCCCCG120AAACCGGCGA CCGCGGCATG GATCAACCCG CCCACCCCAG ATCCGAAATA GCGTCCACAT180AATGAGACAC TGGCGCAAAG AGCTTGACAG GCGCCGCACC ACGCAAGCTG TTAGACGTGT240CGGTCTTGCA AGAAGCGGGT TGGCCACCCA AGATCACGCC GCCCAAGGGC ATCGAGTCAA300CGTTGCGGTG GTATCGCGCT AACGTCGGCG CCGCCAAGAA ATGACGGTGC GCATTACCAT360GGCCCTGCTG ATCACCTTTG GCCACCTGCG CACCANAACT ATGANCAGCC TTATGCCGAG420TCTCGTGGAC ATCGGCAGCC GCTTCAAAAA CTCCTTGTCG ACAATSGTAT TGCTGANCCG480CCGAATTCTT NTRCTTGCAA SAACACTNCA TGTTNCSGGT NAACAACCYT GGTTNGAAAA540ACANCCAATA TTGAANTCCC ANTCGGGCAM GAACCNGTTM CGGAAGKTGK TGGGAACGAA600TGKTGCCCAA AAATCCCGGG NGGTRAAAWW CCCNSNATGG MSAATTTTSC CTNGAACAAM660AAAAGGTCCA AGKYCAAAGG NGCCCCCCCC SGNAAATTGG TGAACSCAKA WYANRTTCCC720WWWTNCAAAT MTTNGGGTCC KNNTCCCCWT AAANGGGSCN CCCCNCCRGG GMGTYTCCCC780NWNMGGGMGN CYYCSCCCCA AAAAAAAMMM MTTTCSGKGG SMGGKKCCCC CCSGGTYWGG840GKKYTTAAAC CCGGKGGGTN CAAAAAANAN ACCCCCCAMS NGGGGGGAAA ATTTGNAAWT900AAGGKKKTKC SCMACCCCAA AAANMMNNCN AWNCCCGMGK SARGGGGRNY TTMKAGGGMG960GNYCCCCCCW YCGGGGGGNA NAAYAAAAGK NGSNGRGAAT NTTNTTTTGK RSSSRNKTTT 1020TYNTCCTYCN CCNMGNRWWG SRAMNTGKTS NSSGGGSGGC 1060(2)SEQ ID NO:307的信息(ⅰ)序列特征(A)长度1040碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:307:AATTCGGCAC GAGCTTCACC AAAGAGCTGA CATGCCGGGT GATGCGACAT CGCATCGAGG 60GCAATACGGG CATGGATGAN CCGAANGGAN TCTGGCGTTC GCTCAACTGG ATTACGGTTC120CCAAGGTGAA ACGCTTTGCG GCGAAAGATG CGACGCTTAA CTTGCGCTTC CACCGTGCAA180TGTTNGTATG GATGCTGGAA CCGCGCTGAC NGATAANGAA TTCGCTGGTC GCCGGGCACN240ATGGATGGTC CKSTTTTCNC TCCGCSGTTA AATTGCSTGT GCATCATCTG GCAGGCTATG300TTCCCGCTAC RCTGCAGCCC ATCATGGATG TGCGGCTAAC GAANAAGTTA TGACATGGCG360CAAGCGAMTC GGGCATSCNC GCGGCAMTTT CGCAACCTGC TGTGTNTGAA GCGTMTCAAC420CGAATGCGGC GCTYAAAAGC NGGCTTGCGT TGATTMMAAC CNAACCCNTN CNATYCTTTG480CCGNGNMNTG CGTTCTCTCC AACTCCGKKG SYTGCCNCCG TGAAACCCMA CTNCCCCCCC540GTTGGACTTA MRTNTTCAAA AAMCGGMTNA ACCSGAATNN SAACCTNCCR TCAAANTAMM600SAANTCGGGC TTYGGGNRCC CCCCNGAAYW TTCKNCNGGG GMNNTYCTCN GGTTYNGGCG660SAAACNTTTG CCRTNCYMNN TTTACAMGGC NCMTNMTTGM GGGSCSNNAS GWCCCGGGKK720TNTTTNCAAW TCNCNSKTTT TTKGGGGGGG GGCYGRTRMC NCGGGCCCCC GGCCCKKMAA780AAAAAMCMSA RRCCNCYGGG KKCCCCCCCM NNATNGGGCG YKCRAAACAA ACCCCAANRA840TNGNGMGGGC SMACCSGNGN GYNAAAKGGT TSNSCTMANM MKGMANNNCT SGMSCCMNSN900NCTGMGGGKT TTKGNNGARN AANAMKMGGM RCGGNCGCNN GAAAGGGSMS GSCKSCNNGN960NGASNGWMGN CRNNGANRCC NCNGYGNMRN NNGNNNGNNN GGGRKNNACN NMKMCAWSMC 1020NSNMMGNNNS CGYMTNKCGC 1040(2)SEQ ID NO:308的信息(ⅰ)序列特征(A)长度348碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:308:AATTCGGCAC GAGACAANGG CGTGAAATGG GATCCGGCCG AGCTGGGGCC CGTCGTCAGC 60GACCTGTTGG CCAAGTCGCG GCCGCCGGTT CCGGTCTATG GGGCCTAGTT ATCTGCGCCG120AGCGTGAACT CAGGGCGAGA TTTCGGCCGT TTTCTCGCCC TGGCTTCACG TTCGGCGAAG180TKGGGAACGG TCAGGGTTCG CAAACCACGA TCGGGATCGT GCGGTCGGTC CAGGACTGGT240ANTCCTGATA CTTKGGTACA TCGTGACCAA CTGTGGNCAA TATTCGGCGC GCTCCTCGTC300NGTCGCGTCC CGCGCGGTAA GGTCCANCAC TTCCTTTTTC TCGTGCCG 348(2)SEQ ID NO:309的信息(ⅰ)序列特征(A)长度332碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:309:AATTCGGCAC GAGAGACCGG GTCGTTGACC AACGGACGCT TGGGCGCGGG CCCCTTGCGT 60GGCATCAGCC CTTCTCCTTC TTAGCGCCGT AACGGCTGCG TGCCTGTTTG CGGTTCTTGA120CACCCTGCGT ATCCAGCGAA CCGCGGATGA TCTTGTAGCG CACACCAGGC AGGTCCTTCA180CCCGGCCGCC GCGCACCAGC ACCATCGAGT GCTCCTGCAG GTTGTGGCCC TCGCCGGGAA240TGTACGCCGT GACCTCGAAC TGACTCGTCA CTTCACGCGG GCAACCTTCC GAAGCGCCGA300GTTCGGCTTC TTCGGAGTGG TGGCTCGTGC CG 332(2)SEQ ID NO:310的信息(ⅰ)序列特征(A)长度962碱基对
(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:310:AATTCGGCAC RAGTCGGTCT AGACGGATTC AATGCTCCCG CGAGCACCTC GCCACTGCAC 60ACCCTGCAGC AAAATGTGCT CAATGTGGTG AACGAGCCCT TCCAGACGCT CACCGGCCGC120CCGCTGATCG GCAACGGCGC CAACGGGACT CCTGGAACCG GGGCTGACGC GGGGCCGGCG180GGTGGCTGTT CGGCAACGGC GGCAACGGCG GGTCCGGGGC GAACGGAACC AACGGCGGGG240ACGTGGGGAC GCGCCCGGCG GGATTTCTTC GCACCGGSGC ACCGGCGGGG CCGGCGGCGT300CGCACAACGG CACCGGCGGG GACGCNGCGC CCGTNGGGCG GCTTCTKGAT GGGCTCCGGC360GGTNACGCGG CACGGCGGCG CCCGGCTCAC CGCCNGTTGG GACGCGGGGA CGCGTNACCC420CGATCTTCTT CCGCNCCCCG GAAACCGCGG GGCCGGCCCC ACATTAKACC CGGCGGNACC480GCGGMCCCGG CGGAACGGNG GGYNTTTTCC AACGGCGGGG CCGCGGAACC GNMGGSTGTT540CCTTNGGSGA AGGNCCAAKT CCCGKCTANC YYAATCCCCG ANGGKTGAMC CTSATGSNCA600MYTTMAGGAA CYTNCCCANT KTTSGRACCW CRCCNGGAAA ASRAWNKNGT KGGCAAACNA660NNTNCYTTKN NATTKGGNNA AAAANCCCTY CCWCSGRACT NCCCCCCNGM GRGMCNNTNN720NTTTYGNCNN CCCGGSNAAM RNTTKATTTC NGGGGGNTCN GGGTKMNNNA AACCCCAAAM780MNRNNKCSCA ANGGGKSNGC NKNNMMNSGT TTTYCKNMRA MRNWTYKNKN NTCNGARSRN840NAAMCNNSNK NGKKKNNKAA ARNNTTWKTN KNSCNNNCNN GRRNGVRGGC CKMKGSNMNG900MCWHNAWRNG NNGSNCNCKC NNKMNAAAAA AASGGVNCKS NSMKNKKKKG NRGGGGGGGG960GG 962(2)SEQ ID NO:311的信息(ⅰ)序列特征(A)长度323碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:311:AATTCGGCAC RAGAAGACGC CCGAANGTTT GCGCTGGCTC TACAACTTCA TCAARGCGCA 60GGGGGAACGC AACTTCGGCA AGATCTACGT TCGCTTCCCC GAAGCGGTCT CGATGCGCCA120GTACCTCGGC GCACCGCACG GCGAGCTGAC CCAGGATCCG GCCGCGAAAC GGCTTGCGTT180GCAGAAGATG TCGTTCGAGG TGGCCTGGAG GATTTTGCAN GCGACGCCNG TGACCGCGAC240GGGTTTKGTG TCCGCACTGC TGCTCACCAC CCGCGGCACC GCGTTGACCT CGACCAGCTG300CACCACTCGT GCCGCTCGTG CCG323(2)SEQ ID NO:312的信息(ⅰ)序列特征(A)长度1034碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:312:AATTCGCAGT GTGTGTGGCG GCGTCCAGAA GAAGATGATC GCGAACATCG CCAGCGCCGG 60CCAGGCTATG GTGCCGGTGA TGGCCGACCA GCCGATCATC ACCGGCATAC AGCCGGCCGC120CCCACCCCAC ACCACGTTCT GTGACGTGCG TCGCTTGAGC CAAAGCGTGT AGACRAACAC180ATAAAACGCG ACGGTGACCA GGGCCAGCAC CCCCGCCAGC AGGTTCGTGG CGCACCATAG240CCAGAAGAAC GAGATCACCG TCNACGTCAC CCGAGTGCCA ACGCGTTTCG GGTCGGCACC300GCTTCCCGCG CCAAGGGCCG GCGCGCGGTT CGCTTCATCA CCTTGTCGAT ATCGGCGTCG360GCNACCAGTT GAGCGTGTTG GCGCCGGCGG CSGCCATCAT CCCGCCGACN ANCGTGTTGA420GCATGANCAG CGGATGAATG GCGCCGCGGC TCGTGCCGCT CGTGCCGAAT TCAACTCCGT480CNACAACTTG CGGNCGCACT CGAACCCGGG TGAATGAWTG AATTTAAACC GSTSAACANT540AACTACATAA CCCTTGGGGG CTCTTAACCG GTYYTGAANG GGTTTTTTGC TTAAAGGAAG600AACYATTTCC GGATANCTGG CSTTNWTARC GAAAAGGCCC CRCCCATNGC CCTCCACAGT660TTSCCCCTGA ATGGSAATGG MNCNCCYKNR CNGGGNCTTT AACRCSGGCG GGNTTTTGKT720MCCCNNCTKA CNTTMMMTGC ARNNCNGGCC SKCCCTTCCK TNTYCCCTCC NTCCCCCNST780TNCNGKTCCC CNNAMNYTNW ACGGGGGGCC YTNGGGKCRM TWTKKTTTGG GCCCCMCCCC840MAAANASAAN GGGGKRNGTY CSTTTGGCNC CCCAMAARGG NYCCCCCCAM YTNRRKMCSY900CNNTNKGGNN CTGTNCKNCG GAARAMAMCC KCCCCGNSTS STTNGTYWAG GNRWKGNSRG960CCSCCCCGGY MNNNAAYAWN WMNATNCNNS STNANMAKKN NNNNNNNSCN WNGNGNNTCN 1020SCNSNGGKBC CSCC 1034(2)SEQ ID NO:313的信息(ⅰ)序列特征(A)长度331碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:313:AATTCGGCAC GAGCCCACAT CCGGGGCCGC TCGTTGCATG ACTCGTTCGT CATCGTCGAC 60RAGGCACAGT CGCTGGAGCG CAATGTGTTG CTGACCGTGC TGTCCCGGTT GGGGACCGGT120TCCCGGGTGG TGTTGACCCA CGACATCGCC CAGCGCGACA ACCTGCGGGT CGGCCGCCAC180GACGGGTCGC CGCGGTGATC GAGAAGCTCA AAGGTCATCC GTTGTTCGCC CACATCACCT240TGCTGCGCAG TGAGCGCTCG CCGATCGCCG CGCTGGTCAC GAGATGCTCG ANGAGATCAC300CGGGCCGCGC TGAGTGCGCC TCCCGCGAGC A 331(2)SEQ ID NO:314的信息(ⅰ)序列特征(A)长度1026碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA
(ⅹⅰ)序列描述SEQ ID NO:314:AATTCGGCAC GAGATCGTCA CCCTGGCGAC CAGTGCACCC AGGCCACGCC ACCAGTTACG 60GCTGATGGGC CAGAAGATGG ACCAGGTGCT GCCCATCCCG CCCACCGCAC TGCAGCTGAG120CACCGGGATC GCGGTCCTCA GCTACGGCGA TRAGCTGGTG TTCGGCATCA CCGCTGACTA180TGACGCCGCG TCCGAAATGC AGCAGCTGGT CAACGGTATC GAACTGGGTG TGGCGCGTCT240GGTGGCGCTC ANCGACAATT CCGTGCTGCT GTTTACAAGG ATCGGCSTAA GCGTTCATCC300CGCGCACTCC CCANCGCCGC GCGGCSGGGG CGGCCCTCTG TGCCGACCGC CCGAGCGCGT360CACTGACGCC ATCTCCGTCG GCGTTAACCC CGTGAGAAGG TGGGTCGTGC GCAAGTTGGG420CCCGGTCACC ATCNATCCGC GCCGCCATGA CGCNGTGCTG TTCCACACCA CNTSNGACNC480CCCCCAGGAA CTGGTCCGGC AMTNCAGGAA NTYCGTGTGG GCACCNGCTT CTTCCGKTRT540GGCYTAAACT TCCNATSTTN CSGCSGGCCT CTGGCGTTNC GNCCGGGCCG NTCTTNCCAA600ATCGGSMMAA ATCCCCANMC AAACCCCCCG GGTCTTGSGG GCSGGGNGGC GGCCNAWNCC660AAACCCCCCC NTTAAANTCT TTGKTNCCNN CNCSGGCNCC NCNAANSCAN CCCTTTKGGC720NCTTCCCCCC CCCAWTTTAA CCGAKCGSCN AAYCCCAAGY TMMGKCCYCY KNAAAAAAAA780AATTTGSCSG CCCCAANTAA ATTCCCNGGC CCYTTGGGGG CGRANCNYNT TTTMCCSNSS840TKGNNNAAMC NGGANCCSGG KAAYTMMTKG NAAYCGCCSN AAMBNTTTTC TAANNCCCCN900YNCCCSGAAA ATTNNAMAAM CMNNKTGSNG GGGGKTTSNC SGKKGRAGGM AAAAAANRSN960SKTTNMCNNN SANMNCNSNN SGGNSNNNNN NNNCNCGYKC CSNAANMCCC CGCGGGGGGG 1020CCMMCC 1026(2)SEQ ID NO:315的信息(ⅰ)序列特征(A)长度324碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:315:AATTCGGCAC GAGAAGACGC CCGARNGTST GCGCTGGCTC TACAACTTCA TCAARGCGCA 60NGGGGAACGC AACTTCGGCA AGATCTACGT TCGCTTCCCC GAAGCGGTCT CGATGCGCCA120GTACCTCGGC GCACCGCACG GCGAGCTGAC CCAGGATCCG GCCGCGAAAC GGCTTGCGTT180GCAGAAGATG TCGTTCGAGG TGGCCTGGAN GATTTTGCAN GCGACGCCNG TNACCGCGAC240GGGTTTKGTG TCCGCACTGC TGCTCACCAC CCGCSGCACC GCGTTGACGC TCGACCAGCT300GCACCACTCG TGCCGCTCGT GCCG 324(2)SEQ ID NO:316的信息(ⅰ)序列特征(A)长度1010碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:316:AATTCGGCAC GANGCGTGCC GCTNAACACC AGCCCGCGGC TGCCAGATAT CCCGGACTCG60GTAGTGCCGC CGGTGGCGTC GTTGCTCTCC TGACGGGGCG CGGCGACCAT AAGGTCGCTM120ATGCCCAGGT AGCGGCCCAG GTGCATGGAG TCGATGATGA TGCGACTCTC CAGCTCGCCG180ACCGGGAGCT TGGCATCGGG CCTGATCAGC CAGGACGCGT AGGACAAGTC GATCGAATGC240ATAGTGGCCT CCAGAGTGGC CGTGCAMTTC CNGCGTGCTC CACGGCAAAT GCCTTGATTT300CTACTCCGCG TANTGTTCCC GCATCGCCTG CGGGATGAAT GGGAACCGCA SGATGGCGAC360GAACGGGTCT GANCTCAGGT TTGCCGCTTT GCGCACAGTG GTCNACANCC GGTACTCGGC420ATANATCTGG CCCNAAATCG GCGCCGACGG CGCCCACNAT AANAACGGGC ACNACAATCG480CCGCCCCGGT CACCCNAACA ACANCTTGSC ATCGGATTTT GTCCCCANCG CTCAANCCGT540CCCGAACGCC TCNTCCGGCG NACTTTTCTT NNAWTAACTG CCGCTTCCGK CCCTGGNGCA600WTAAATGGGA AACCCTTNCC CCACCTTGAA GGGGTTGTTG NATTTTTACT GSTAACCCCG660AATTNTTCCG GANTCGGTCN KCCGGGSTTT YSTNTTCCCC ACCTTNGNAN GGGCCGGCCA720AGSTTTTCTT SYTGAAGGGG GAAACCCAAC TTTNTYTYYN AACCSCMNAA MYMTTTYCSG780MNAASCCNKT CCCCTTTAAC CAMGGSGGTN AACCGKTMNG NGGKTAAAAA GGGSKNNKTG840NCCCCYMANG GGGGGRAAAA TSTKTCNNCG GGGCCKAAAW ACCMMMMYGN GTGKKKNKSS900GCSAAATTTT NMMRAACTKN GGGGCCSSGA NNTTTNAAAG MSCCCCCSNN GSTGKCCCNN960NTTTCCNNAA WMKKGKNWNM SNMNSCSNGG GKYNSGGSNN NNAAGMGGGG 1010(2)SEQ ID NO:317的信息(ⅰ)序列特征(A)长度1010碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:317:AATTCGGCAC GANGCGTGCC GCTNAACACC AGCCCGCGGC TGCCAGATAT CCCGGACTCG 60GTAGTGCCGC CGGTGGCGTC GTTGCTCTCC TGACGGGGCG CGGCGACCAT AAGGTCGCTM120ATGCCCAGGT AGCGGCCCAG GTGCATGGAG TCGATGATGA TGCGACTCTC CAGCTCGCCG180ACCGGGAGCT TGGCATCGGG CCTGATCAGC CAGGACGCGT AGGACAAGTC GATCGAATGC240ATAGTGGCCT CCAGAGTGGC CGTGCAMTTC CNGCGTGCTC CACGGCAAAT GCCTTGATTT300CTACTCCGCG TANTGTTCCC GCATCGCCTG CGGGATGAAT GGGAACCGCA SGATGGCGAC360GAACGGGTCT GANCTCAGGT TTGCCGCTTT GCGCACAGTG GTCNACANCC GGTACTCGGC420ATANATCTGG CCCNAAATCG GCGCCGACGG CGCCCACNAT AANAACGGGC ACNACAATCG480CCGCCCCGGT CACCCNAACA ACANCTTGSC ATCGGATTTT GTCCCCANCG CTCAANCCGT540CCCGAACGCC TCNTCCGGCG NACTTTTCTT NNAWTAACTG CCGCTTCCGK CCCTGGNGCA600WTAAATGGGA AACCCTTNCC CCACCTTGAA GGGGTTGTTG NATTTTTACT GSTAACCCCG660AATTNTTCCG GANTCGGTCN KCCGGGSTTT YSTNTTCCCC ACCTTNGNAN GGGCCGGCCA720AGSTTTTCTT SYTGAAGGGG GAAACCCAAC TTTNTYTYYN AACCSCMNAA MYMTTTYCSG780MNAASCCNKT CCCCTTTAAC CAMGGSGGTN AACCGKTMNG NGGKTAAAAA GGGSKNNKTG840NCCCCYMANG GGGGGRAAAA TSTKTCNNCG GGGCCKAAAW ACCMMMMYGN GTGKKKNKSS900GCSAAATTTT NMMRAACTKN GGGGCCSSGA NNTTTNAAAG MSCCCCCSNN GSTGKCCCNN960NTTTCCNNAA WMKKGKNWNM SNMNSCSNGG GKYNSGGSNN NNAAGMGGGG 1010(2)SEQ ID NO:318的信息(ⅰ)序列特征
(A)长度1092碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:318:NGNGGGGWNS NTCAYCAYCA YCACSGGGYW CWATTGCGGC CGCAWCTTGT MAASAGATCT 60CGAAYTCGGC AMGAGGGAMT CKCTMGCNCC GCTGTGCAAN CCAATRAGGC CTRATAATTY120CCACTCCACA AAAAACCGTT GTGTGTAYYT SCCGRAAATR AAGGCGCCGG TNTCAACWYC180GCCGGTKTTY CCRATYCCCG TKTTGTAMCT GCCKGGGTSR AAAYCCCCGG TGTTGGAYCC240CCGGATTGAA ACTGCCGGKT TGAAACTGCC GKTTTSGCSA TCCGGKWATT GAMSTCRCGG300ATTAAAAAAC CGGKKTTGGN GCTGSNCGTG CCAAATNCGR AYCCRATAYC CCATGGCCTG360KYCTYCTCCK YCGGTACCCA AAYCTGGGTA TCCTATACTG GYCCCTAAAK GCAAWYCKGG420GCTGYCMMTK TTGCKGGSGT CCNAATTTAS CACCASCGGT TCCTTCCATA CCNAAACNCG480CKTGGGCWCC AGMCCGRAAA AAAKAATAAT RAKAAKGGTG CATNYCCAAA ACCNCCGCCN540CCCNANTNCN ATCCGNTNCC MSCNCCCCCA GCGGTNAAGK TKSGGAAYTT CTMMAACCCC600CAAANCCCCA TAACNTNCGR GAASAAACCC CTYCNCGGGG GYCNWNCAAA ACASCNTTAT660TTGCTKSTTT CGGGMWCCGT GCCGCCNAAA YCCCAAASTA CTTTYTGGGT CCNAGAKAAA720ACCNCGGGCN CCMCCCSNAA NWTATYTCTT KGGCAANCCC CSAAACCTTR TCMNACCNCK780ATRMTCCCTT CCCCVSCAAT TGGYCGGRAT NCGSNCCYTY TCAAAKKKSC CAKWWNNGNG840GRRNNACCMA ACCCCAAGTY CCMNAAAATN GKCCCCGCTC CNAACACGNK TYYTCCSAAA900ASCCCWCCCC CCCCCCCRAA AACCCCCCNA RKANTNCCCA AAAACNYNGK GGCCCCCCCC960CAAACMAAAA AMCCCCCSGM RMACSGGGGN NMCCCCGKKK KKTTTTCTTT TKCCMRSCCC 1020AAMGCAMWSY KSKTNMAAAA GGAAGRANCN TYCCSANANM TCCCNYWRSW CCGSWGMGNA 1080GAASMCCCCC CS 1092(2)SEQ ID NO:319的信息(ⅰ)序列特征(A)长度1251碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:319:GGGGGGGNNN NATACATCWT CYGTGYACCG GGGMTCTAKT GGCGGGCCGC AATCTNGTCA 60ASAGATCTCT NAMTTCGGGC ACAAAAACTW GACAAASYMT CGNGCNMTCC GTGTCCTNKA120TCGCAAAACG NGTRACASAC ASACACRTAT GTGTGCCCAC CASCAAYTCK TTGGGACCTC180GCTRACCGGY TGCCCRNACG CCACGYTGCS CWTCTATCCC RACGCCGGCC ACGGGYGGGG240ATATTCCAGG CACCACGCCC AGTTTGGTGG ACAATGCCCT GGCAKTTTCC TCRAANTTCG300TGAAACCGAA TTCNSMTTGA ACCNCCAARG CCCCSNCCNR AACARTTGGG WTCCGCGGTT360CTCCCCACCG KTTTCCGGGG GTNTCGGCAN AANCGCACCC WTGGWTTCTM TCNCCGCACC420GGGCGGACAA NTCGGGTTGC AATTTTGCRA AYCGGGGCCG GGATTCCSCA AACGGGTGCC480GAAACTGTTY YCRAAMACCG GGAKCCGCAA TTTCCGGGCR ANAAATTTCN YCNCACCACT540GCTTRTACTT CCCCGACCGT AACMANTTTC ATCGTCNTNN CCTCTGCCCT TGGGGCAGGG600CKAAAYACCG CMTTKGGTTT CGCAACCTGC GGCCCAANTC CCNAMCCRCA CTTTCNATTT660GGNTCGAATT SCCCCCCGGT RANAACCSCC NTGGCCNNYT CGGASSAAAA NGGGCCCTNT720KGGCNSCCCC AGTAANACCC TACCNNAYTS CAWTCTTTGC CAAASTTKGG ACGAANSKTG780GGNTTCCGGK ATTTYYTTGS GGNCNCCCTN TATNGGSNTN GGGCCKCYNC NCSTKTGKCA840NASSKAYCCS NGNKGGGGGT ACCCCCCTMG GGGGGTTTTT NSSGCCCCCC AWAYGNKSTG900GCCCCCNNGG GGAAKAATWT MWWMCNSGGG GGGAAWTTTT NTSTGGAMCS SGGACYCCCR960GGGGGKTTTT TCCCCCNCSA NNAWANGGGG GGGGGANAYT NTGNSGNGGG KWNTTTATTT 1020YTYYCYCCTM TKACMSGGGG GTTTKKAKNG GGGGGAGAAA ANAAAAAAAA RAKGGYKNTT 1080TSKNCACNCT GKWNWNWANR NAGAGKTCCT CKCKCCNCSG SNTTTCTTTT MGNSGSYGGG 1140GNNGNNNAAA ACNKSRMMAC KCSYTYCCCG CGYCTCCTCC NCNGGGGYGS NGSCGNSTYN 1200GNNKGRKWTA TNTMGNCGTN SCCTCCNCCC GCKNKNTGTC TMTCNMYGSG C1251(2)SEQ ID NO:320的信息(ⅰ)序列特征(A)长度1099碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:320:AAYTCGGCAC MGAGTATCAC CAAKCTGYGT GGCCCAGCAA AGTGGAGCTA TTACTACCTG 60TATGTGATCC TCRACATCTY CTCCCGCTAC KTGGTCGGGT GGATGGTGGC CTCGCKTGAK120TCRAAGGTCT TGGCCRAACG GCTGATCGCG CAAACCCTTG CGCCCAGCAC ATCAKCGCCG180AACAGCTGAC CTGCMCGCCG ACCGGGGGYC GNCAATAACT CCAAACCGGT GGCMCTGCTG240CTGGCCNACY CCGTGTCCCA ANTCGAACTC ASCCSGCNMA CCAKMAACKA NAACCGTTGT300CTGAAGCCCA GTTCAAAAAC CTCAAGTWCC GGCCCRACTT CCCGAAACGG TNCGAGTCKA360TCRSAGGSGG CCGGGTGCMC TGCAACCGGT TCTTCGGNTG GTRCAMCCCN AAAMCAAGCA420TTCCGGGMTC CGMMTGCCCA CGCCGCCAAS TTTMCTACGG GCSGSCCNAT CAAATTCGCC480GGGAACSGSN CCMCCKTCNK GGAMACGCCC TWCCAAAACC CYCGAACGGK ATCCTTCKGY540NAACNCCCGA RCNCCCKSKT TCCGGGCTTC NMSGCGAATA CCCKNSCMNT CCGAATCCAA600TTCCCMKYGG CTTTTYYYCC CCCCGGCCCC AAAYNGGGYC CCTASSNMKC KNCCAMNANT660CCNWATCTGG NGGTCCCNAN KYYGGCGTTC NMAATSAMNA NMNRGGGTYT TSCYACCMMN720AACCGKNNKG KCCCCMKCTK MANAAAKATT RATCAMKWNG GGNKCKCNCN NAAMACCSCN780CNCYNCWYTC TMYCSSKWGC GCSMYNANCA SNGGGGAGGW GGSGRMKMCT CTMTCTCNCT840MGCGCCKNTN TYCKSGAKAT ACASMNKTCC GCGCNGCGCN MAAMANRAKA CTAKCCGYGN900CCSNSTMTYN CTSNNMKMNN TCCWMWNATC NTYYGKKCNN KCTMKATNWC CSCTSKCNCK960MRAMTCKTYG SNMTCCTCCA TCNCTCKKSC SNMSKNTCKC KSCNCCNCWN CNKCNMKCWN 1020GGNSTCRCCY TCTMNNNTCS AGCKCGSKNC WACNCACACK NGWCTYTTCC WKNNMKCNKM 1080TCKCKCACRG MTMTCWCCS1099(2)SEQ ID NO:321的信息(ⅰ)序列特征(A)长度296碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA
(ⅹⅰ)序列描述SEQ ID NO:321:GNGNTATACA TCWCTGTGYA CCSAGGATCW ANTGCGGCCG MAAKCTWSTM CASAGATCTC 60AAAYTCTGCA MGAGCGGCAC AKAKYSTCGT CCMRACCCGG CAYACWCCWG CNCGCCCCWT120CTTRGACCGG GGCKATASMC ACCGTTGGCC CCGGCNCGCA CCTACACCAC CCACGCCGCC180AGCGCCCCCW TRAMCAAACC ACCCCGCKTT TACCGCCCGC GCCGCCGGGG CCACCACCAG240CCCCACCGGC ACCACCGGCG CCGCCGTTGC CAAAACAGGC CCGCKTTTGC CACCRA296(2)SEQ ID NO:322的信息(ⅰ)序列特征(A)长度1073碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:322:NGNGSGNKMY ATCATCWTTC TGCACCSNGG MTCWATTGCG GCCGCAATCT TSTMNASAGA 60TCTCGAAYTC GGCAMGARCA TCTGCGCGGN GAATGTCCAA AWGTCWKTAA CGGCMATCGG120TTTGCCGYCA ACCACKCTRT SCAKATGCGG GCCAMWTYCA AACCRATTAT TTGGGYCGAG180AAAATTTMCG CKTGTRASCA ACCTGCAGCG GGTCAASCAA CAGCCTCTRA ACCGTAAATY240CKTAGGTNKT YCCGGCAACA ASCYCRATAA TSCGGCCCGC AMCCACAAAA CCTGANTNGT300TNTTCNCRAA NCCGGTYCCC GRAGGGGTSA ACTGCSGTAR GCTTNTCWYC NCCTTRACAT360TAAACCCCCC CGGNTCWTCG CCGCGCCCAA ATYCYTGCCC WTKGCNACCA YCCCANCCTG420CSGTATGGTS RAANCASTSG GCRAACGGTM MCCSTACCKC TGGCTGATYC KTCGGNTCCS480SNAATTCGGG GATTTACGGS CAMGGTTAAY CCAGGYCCCC TNTGCYTCKY CNACAACCSG540ATCMWCNCCG TACCTKTTAA AATTCTTTGT GGTGGAACCC AWYCKAAAAA NMTNTYCCCN600TCCAMMGGGG CYCGGAAKKT CNACNTGGKT NACCCCTNCC YTTGAASTTT TCYTGNCCCC660GGCCCKAAAS ANACCSGAKC CCCGGAAYCS WTAGGCYTCN TGCCCCSTTA AATTKGNCYC720AATCCKCCAA CGCTCCCCGG GGTCSSCCMT TAAAMTTCCC CCCKSCASNG GAATYCYKSG780GCWGTMATTW CCNCCCNTTT CYYGKNAAAC SCCCCCWKGN GSCTYCCCCN SNTTSSGCCS840GGTTSGAMYC AAAAWTNGGG MMCNRAGNCG SGNAMCCSCN GKKGGGSATW TKAAYYCYGG900GGGGGTCNYC CCCCRCSNAA AAGYGTKGGC KCCSSSCCYC CCMARTTTYT CNGGMRCMAM960ACCANGGGNG CTCCCGTNCW WGGCTCCCSN SNSMAMAAAN NKCKCCKGGS CKGARRNMNA 1020MCTCSNGNGG WTCCCKNKTC NSCNSGNCGS YGGNSASWCC YNYCNCCACA ANC 1073(2)SEQ ID NO:323的信息(ⅰ)序列特征(A)长度1166碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:323:CGCCCCGTTC TTMMMTTCAY TCATTCACCG GGMTCTAGTG CGGCCGCAAK CTTGTCKACA 60GATCTCGAAY TCGGCAMGAS ACAATSTCGG GTKGGGCAAT GTCNGGTGGG GCAACTTTGG120GCTCGGRAAT YCGGGGTTAA CGCCGGGTCT RATGGGTSTG GGTAATATCG GGTTTGGTAA180TGCCGGCAGC TACAATTTCG GTTTGGCAAA ATATGGGTGT GGGCAATATN GGGTYCGCTA240ACACCGSCAS TGGRAATTYC GGTATTSGGT NACCGGTRAY AAYCTGACCG GGTNCGGTGG300TTYCAATACC GGTAACGGGA ATGTSGGTTS YYYACYCCGS GSAACGGNWW YTTNGKTCCT360TMMCNCTSSM CCKSAAMTSM KMGGTSTYCT MTYCNNGGAS TAMTYNMCCC CCGWAYCKSC420WAYCCCTCGT CATYCCMCMC SGSGYCCTCA MNCCACCYTG NGYYCCCTCC MKMTCYCAYT480CMNTCCGGTW CCTNTMMNCC CSCNCRYCTC AMCNCTKSGK CACCNATMYC CSACKCHTCT540MCYMCSCAKN MTTCCCCTCN CCTYTNNCCA MCMCSCTCTM TCMAACTCKC CCGGYCKCNC600MYCTCTCKCC AYNMAACCKK TYCYWCNWYC YMYCKCKCAG WYKNMCTCCW ACTCTMYNTT660TCTCTCNKCC CMKACCKNTT CTCWCSCCCC CCACAKAYMC YAWCMTMTCC MCTCKACSCC720CYYCNNYCCM NMCWCMTCWC TWNAKCANCN TTCTTCTCTC MMYMTMACKC WCNNTCNCCK780SGACCYTCTC ACTKMKCCKM TCTCCTTMCK CCYMWCNTCC MKYNCCCTCC NMTCMTCKYT840CCTCNCNMRY CYYYAKCAKC NMCTCCCCAN KMCAKCTKCT CCCCCAKMKS ACNCKCCCWC900CCTCCTATCC WCTCTCWCTY ATCTCKCTCW CNYCMYMKMC ACNCKCYAYT CNACTMNMWN960CCANCNCTCT CTNYCTCWCK ACGTYCKCCK CTMCKCNYMC NRWCTYRCCT CKKCCNCCRN 1020CKNMCMKCTM CTCTCCWMKM TCCCWCCCAT CTMMKSTCTC WCNCMTCCCT CNKCCYNYNT 1080KCYTYCCMYG CTTCKNTCMT MCCWCCYATC TCTMKCCTCT CWCACYMCAC WMTTACWNCC 1140ACTCTCTRCW CKCCKCMCCR MTCTCB1166(2)SEQ ID NO:324的信息(ⅰ)序列特征(A)长度1230碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:324:NGNGGNNNNT CWTACATCWN TCTNCACCSG NGMTCWATTG CGCGCCGCAW NCTTGTMNAS 60AGAATCTCNN AAYTCGGCAC ANATGTCTTT TSTMTAKTGT GGCGGGGNGC CACGCCKTAT120GTGYGCCTGG GYTRACCCAA CCCCGCGGCS CGGGCCRACC AGGCGGGGRA TSCAGGCCGC180GGCGGCCGCG GCGGYTATAT RAAGCGCCGY TTTTKTRATA ACGGTSCCGC CGCCGGGTRA240TTACGGGCAA AAYCGGKKTT TTGGGTRTAT AACGCTAATT GCAACCAWTT TTTYCGGGTC300AAAAACYCGG CGWGCANATC NCGGGYCNCT RAGGCGCATT YMCGCCAAAA WTNTGGGCGC360AAAACCCCKT TSYTATTTTN TGGGCTATSC GGYTGCTTCG GCAAACGCTY CCCGGGTTAA420TCCCKTCCGC GGCGCCGCCN AAAAACCACC AATYCCGYTG GGGGTGKYCC CMCAGGCSGT480TGCTYCGNGY CACCTGGCCA AAYYCCCAWT AKATTGGGTG SCYCKTSCGG TTSYTGGGCY540CAATTACCCC CNCGGGNAAA GRRAAAANAA ATCNTCCNTT TGCTCGGYCA YCTTTMTTGG600SAAAAGGGGC ATGGCSCGGT TYYTTTACCT CAAYCCCCNA NCANTWACCT YTCCSCCCGG660GGGGNCANAA CGSTTNGCTC CGSGGNAKCC TKGTMCCCGN ATCNAAAGGC CNGAATTTGG720TYYSSTYCNA ATTWTWKKKY CCCCWCNTTG YAAAAAKCCA AAASAKCCCK YCNCAMMYKT780NGGGGTYSSG GCCKNYCTTK SNMTTAAACC CYCCCCAAAA YYNSGGGKKT TCCGCYNSAT840KCCACCNCCK GNGGGGGGNA SAAAAAAAAY TTTYCCSAAA ATCCCACCYY TCYKTKSTRY900AMACCCCCTT TYYMKKAYTC CKYSCNATTC SGMTTCWAAA TYCCGYGGCT TNTTCCCCCK960CSGGNGCCCC AAWTTTGKTT YNCNANTTYC CCCNAAMNCM AWTMGGGGKS KCCATTCTGG 1020SCYTMAANTA AAANAANGGG NKTTTYYCTY MANAAACACN GTGKCNCNCN CNAAMAAASN 1080AKMAAAKAGN KKKMTKNNSA AANCCNCCCC CTSTYTNYTT NKTNMNCKCC CYGGKKNKGM 1140SWSWYNTTCT NCCCRCCCCC YNYNKTGANA AAMMNCYCCS GGSTMCRNAN ASNMNTTTCK 1200STSTNGMGCC KMBASNANAN MCAMWKWYCC1230(2)SEQ ID NO:325的信息(ⅰ)序列特征(A)长度1022碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:325:NGNGGGKNNA TMAYCWTCTC ACSSGGTCTA TGCGGCGCAW CTMGTMAASA GATCTCNAAY 60TCGGCAMNAN GCATMTCMMC CATATATAAC CATTGCGTCS GYWTGCAWCT CRAAWCTGTC120CTTCSKGCCG TTKTACRAAG GTGGMWTGYT CWTYCCTRAA SCCCTCRATC TCKTKTATYC180CTKGGGCTYC ACTTTAACSG RATKSCTGCC TTKTAYCATT RATGCAAWTA WTGGYCRAWT240KTTGCAGGCC RACGGCWYCT TTTYCCGCRA GRACAATNGA TTGGAWYCGC TYCGCRAGGC300CCGGCACCAR ACCGGGCNCC AAAGGYCCGC GCAAWTSCCT GGKTCAAAAA TGGTGCAAAC360AAAMCNATCC CCGGYTTRAC CGCAGYTAMC ACAAKAAAAT TCCCWTGGCC GCACCAWNNT420TTYCRATCWY CWYCCCCACC TTRAACTTGK YTGCSGTATT GCCTKCCTGC CTCRACAGCM480YCNCCCKTCA AACCTGCGGT GACTCCAACT GGTCTGGYCG AASGGGGGYT CAMCGGACAA540AACCCCRANN TCGCCAAATT TTCNCCCCCC CYCGGGAAAN GKTGATMTTC TCSNAACCSA600CMGGGNNYTW NAACCCTGAA CSSSGSNKGA MYNSCCSGGA ANTTTTCCCT TYNGGGCGRN660AAANCCTTTT AAGGTACCCC KGGNGGGGKG CCCYYTTGGG AAAACAACCC CKATTGGKTT720TGGAAATNTT TKCNCCCCCA TTCNSGGGGG GGGCCCCAMC CCMMCTTTTN TCMSCNMTYY780YCYYGGGAAT TNYTCGCCSG GAAYYCGGSM CCKGYCCTAA NCCCCMNWGG GKYSTGSNAR840GGRATMAWWT TYSTTTYYMC CCGGCNNCCC CCCKAKMCNT KGNTGAACMA AAAKCSGGGG900GSCNMYMWYY YCNNNGNRTT TNRGGSSNMT TYMAAAMMAN GGGGKYWTYY CKCCNGSCNN960GKTYSGGGST TTTCCNTTTS GGGSSATYKG MACCCCKTMT AYCCGGGGGT NTKTKYCCCC 1020SC 1022(2)SEQ ID NO:326的信息(ⅰ)序列特征(A)长度1083碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:326:NNCGNNKNTA TAMAYCWYCT NCACCSGGGA TCWATTGCGG CCGCAATCTT STMAASAGAT 60CTCKAAYTCG GCAMGANCCG CAWCTATTTG KGTGRASCGC ACCAGCGRGA CCTCGCSGKT120CKTTYCTTGC AGRGAGGCCK TGGGTGGCRC CGGTGGCAAT GCCAACCGCC CCCCAAAACN180CCGCAAATMY CRAAAAACAA CCCSGGGGTA GKTCCSGGCC GCCAAATMAA TAACCGTKTT240AACKCAGGCN ACGGCCAACC GGYCCCGCCC AACCAAGCNA CCTCCCCSCC NATAGGYCCG300GTGGGGGCTG CCKTATYKCC AASTCGTCAY CTCNACGGGM CGGYCCMCWT TCCGCCTCAT360CCGTCTCTCC TTMMATTTTC CRTCCACYKG GCGGGGAACY TTTTTNYCNC CCTTGSCMAN420CACCNAAGGY CNAAAATTNC CCMTGCCKYG SNNCAAAYGR GATTGGGGTY CGKKTTTTNT480TCNMCCMAAC CCCCNTTTNA CGCCCCMATC CCYTWATACC CCCWWMCMNS ANGKTTGNSA540AAKTNNCCCC AAATRCCAAA MTTCTTCGCC NTTTMTWMCY YYCCTTTCCC CMCCCWNAAA600GGSCCRCCYY TCGGGAANTY TCCCCNCAAA AWTCAMWCCM TTTCCCNCCA AGAAWTTCSG660SACTCCTTTN TTCNGGGNAM ATANATYYTT YCKTNGGGSK TTCCGMTCNC AMMAATNTCC720RGGGKAAMCC AGKNTNNTCC YYYYCCCCAA NNTYCCYKGG RMCYNNYYCY TTAAANRASR780SAACCCKSGG GKCYNCNCSS TARCCCCCAM KAAAATTTCC CCCSSKTTTC TYYNNKKMRW840GCCCCCSAAM ACTMTWAYTT TCCCKCGNNN TTTSYCCKCS KCAMWMWMTG KKNCTTTTTT900YCSCMATAMA CTTNGGKCCT NTCNYGSGCG CMAAANAAGG CGCGSTTCTN TTCWMAMACA960YNTSGNMMMA SAAKAKWATA AWNNTRKKYK TKNNCCCNCC CKCKCTTSNN TNKCCMCSKS 1020GGGKNWNKKR GWCTCCWCNC CKCCCNCKNK CCKWATMCCC CCCCSKCCGM NCMMNTTTKT 1080CCC 1083(2)SEQ ID NO:327的信息(ⅰ)序列特征(A)长度1069碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:327:GGGGNNKYAT MCAYCWTCTS YACSGGGMNC TATTGCGGCC GCAWYTNGTM GASAGATCTC 60GAAYTCGGCA MGAAAAAAGW GATGTGCTGG ACCTTMCCGC GCGGGACGCR ACCRACAAAG120RAASCGCGCC ANAATATTGG CCACAKTTGG TCACATATTT ACCCAATTMT AYCAGGGAYT180MCCATTCCKG GGACCRACCG CACAATCCCR ATSKTGGTTT GCRAACCCTR ACCGTCCCCA240MYTYCGCCRA STTGAACCAG GGCRAAAAAA CGGCCRAAWY CTCGCCCTGA NTCCCGCTCS300GCGCNAATAA CTAGGCCCAT TKAACGGAAC CGGNGGCCSC NANTTGGCCA ACAGGTCCTR360ACAAAGGGGC CCCASYYCGG CCGGWTCCCW TTYCACNCCC TNKTCTCKTG CCGAATYCGG420WTCCRATNYC CCWTGGGCCT TKTCKYCKYC KYCGGTNCCA AWTCTNGGTA TNCTATRGKG480TCCCCTAAAT SCANATCTGG GCKYCCATTT NCTGGSNTTC NATTTAMMAN SRRCGGTTCT540TTCWTTCCRA AACCGSNTGG GCCCNNMCCA AAAAATGATN ATAATAATGK YGSCTTTCAA600ACCCCGCCCC CCCATTCRWT CSGTTCCANC CCCCNGNGGT TAAGKTGGGA ATTTYTNAMC660YCNARGCCCT NATTTSGGNA AAAACCYCYC GGGYCTCAAA CMNYTTTTTT GSKSSNTCGG720GCTCRTTCSC CAAAACCCAA ATTNTYNYGG GGYCCKTNAA ACMCGGYCRC RCCGGAAATT780TTTYTGGTTC AACCCCAACC TTTTCAASCC NTTTTYTYYT TRCCSSCSMN TNGSSGGGNT840KSSCCNTTCY RARKKCCNMN GGGGGWYCYN CCCCRMNTTT CTTTTTTTTT CCGTNNMAAM900NGKTTCTTCA AASMCCCCCC SCCCCCNSAA ACCCCCTNAR GTTTTYCMMA AANNWYNNGN960KNCCCCCCCC MMNAAAAAAY YCSCCCGNRN ACSMSNGGGA MCCCCCGGSN NTTRKTTTTT 1020TNCMSGYCCC CSRMASYYTT TKAMAMANRR GAMNSMTTTY TNNRGNWNK 1069(2)SEQ ID NO:328的信息(ⅰ)序列特征(A)长度1210碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:328:NGNGGGGKWK MATACATCWT TCTTCACGSG GGATCWATTG CGGGCCGCAW TCTNGTMCAA 60SAGATCTCGA TYTCGGGCAM NACCCACCWC TCCRAAAAAA ACCCRAAWCT CGGGSKCTYC120GARAAGTGTT GCCCGCKTTR AATTTAACAA ATTCAGTGTC ANAGTGTCAC GGCKTTACWT180YCCCGGCAAA GGGGCCACAA CCTGCAGRGA SCACYCRATG GKTGYTGKTS CNCGGGCGGG240CCGGKTNAAG GGACCTGCCT GGGTKTGCSC TMCAAANATC WYCCGCGGGT YCGCTGGRAT300MCNCAGGGGT GTCAAAAAAC CGCAAACAGG CACSCCANCC NTTTACGGGS CTTAAAANGA360AAAAGGGCTG ATGCCCCCAA GGGGGCCCGC NCCCAACCTT CCGTTGGTCA ACAACCCGGT420CTCTCKTGCC RAATCCGRWT CCRATNYCNC CWTGGCCTTK TCKYCTYCTY CGGTACCCAA480ATCTGGGTAT CCTATASTGT CCCCTAAWTT CCAAATCTGG GCTGTCCATT TSCTTGGCNT540TCCAAATTTA CCANCAACGG TTTCTTNCAT NCCAAAAACC GNTKGGCKCC NRACCCRAAA600AAATGAATAA TAATAANNGG KCNNTTYCNA ACCNCCCCCC CCCNATTCCA TYSNGTTCCA660NMNCCCCCAG NGGKTAGGTK GGGAAANYYC TCMACCYYCA ANCCCTWARS TTTTNGRAAT720KAAACCCTYC YCNGGGTCWW TYMAAAAAMA NTTATTTGGN NGNTTTCGGG MWNCKRKNST780SCCAAAATCC MAAATANTTT YYTGGTYCNA TWAAAAAMCG YGNCCMNCCC GGAAAAWTTT840TTNTGKTTSA ACCCCAAAAC YTTTTCMNAA NCSSKTTTTY CYTTCCCCCC AMNWTGGGYS900GGGNATKGYG SCYTNTCTTA TKTKYTYMTW CMGGGGGGNN MKMTCMMCCC CCMTTTYYCY960NYWRTTTTTN KCCCCKTNMR NNRAANNGGN YTCSYNANAA AAGCNCCCCC SCCKNCCCNA 1020AAAAWCCCCN NNNARAKTNT TTMKANNRMN SCKCNKNGKY YCCCCCCCWC YNMNNAAAAA 1080AATMYCCNCC RASANMCASM NMGGRGNRSC CCCCCCCSTT NNNNTMTTNT TTTTTTCSRA 1140GAGCKCCSCG MNNANMKNCK CTTTTTKCNC NNGNNGNGNN GGNGMNCKCC CCNAGAAMWK 1200CTKSTCCCKS 1210(2)SEQ ID NO:329的信息(ⅰ)序列特征(A)长度1105碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:329:NGSSSNGNNA TMCATCWYCT GYACSGGGMT CWATTGCGGC CGCAACTNGT MAASAGATCT 60CGAAYTCGGC AAKANACACC ACCGCCGTGT MTATACACCG CAAATGTTCT GTKTGCCAAA120ACCGAGACGC GCCGGCCGCG GGGYTCCAAC GCKTTACYTR ACCCGCCAGY TCAGTGTTRA180AACCGGTGYT RAGGGCCGCA CCCAACWTAA ACGCTTTAKC CAAGRAWYTG GKTGGCCCGC240AGCCACCTGY TGTGGYTGCC CTCWYCGGTG GTAGCGCCGG TTANCGCCGG TTGCGCGYTC300AMCASCSCGC CGGTRATCCC AKCNWTCCCC CGGCCMRACC CACCGGGCAC TTTGRACGGT360GCCGCCAATT CAAAYCKYCT GRWTCCTTCM AAACACCACR AAGGCCACCM CCMSCACCNA420ATMGGGRACT TTAAGGCCCA GGCAAAACCT NTRAKCNCCT CCCGGGCRAA GGTCCSGCAA480SCRATCCMAA AAAAKCKNAT TTCCCCCAGC AKCAACCCAA MMCGSTTTGC TGCTTCCGGA540TTCGAAMCCA ATTMCWGGKT NCNWGGGAAA AACASCNNCC NWTAKCCMGG CCCMCGGGCA600ATTTCSGRAA SAACCCCTNY CCCGGGTTTT YCCTGCTCMG GCCCAANACC CCCGGGAATC660AAAAASGGTC GGNCAAANGG GCMAAACCCS SACCCMACTT WTTCCRCTTN GGGGGGSCWN720CCKNGTTTAA AWKSCCTCYY CTSCCCAAAY TCGGKCMAAA NNGRKTTGGK TTNGGCNACC780NTTTCCGGKC CCGGGKGKGK WGKYCTMNMA CSTTTNTTTT SCCCCYKAAA NYSCCCCCCC840CGGSSCCCCG CCCGGGGGGA NNTTTTTAMA GKKTYCCCCT CCCCAMAAAA ANACCCCNYC900CCSGGSCCCT TTKRWAAAMN KCTSCCCCNG GNNGGGGKCM GGKTTATTMT NNNCCSCCCC960TCCGCGSAAA AAATAKMTTT SYCCCCCCNC CTCCKNCKNR GKAMSMSCGC TCCCYCTCNC 1020GCNKNTWAAN ARSNCCKKNN CCNCYKCCGS NSNGKCNWCD NCCSTSSNCT NKGCNCKNCN 1080KAAANAAYNC NGSMSTSSMN CNKCC 1105(2)SEQ ID NO:330的信息(ⅰ)序列特征(A)长度936碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:330:NGSNSNKNNN TAMAYCWYYC TSCACSNGGA ACWANTGCGG CCRMAWCTNS TMKASAGATC 60TMGAAYTCGG CAAGAGCGGC AAGAGTGTGT GCATCTGGTC ANAGTSTMMA CRCGGTGCCG120CSGGTGKGTR GASCACMCAT NTGCGRACAC CAAACCCKTC GCGGGYCACC GGCKTCGCCT180GCAAAWYCCT CCAGGCCACC TCRAACAAYW YCTYCTGCAA CGCARGCCGT TYCGCGGCCG240RATCCTGGKT CASYYCGCCK TGCGGTGCCC AAGKTACTGG CSCAYCAAAA CCGCTCCGGG300RAACRAACKT AAWTYTGCCG AATTTCNTTC CCCTGCGCCT TGATAAATTT NTNAAGCCAC360CGCAAMCCTY CGGGCKTCTC CTCKTGCCRA ATYCGRWTCC RATAYCGCCA TGGCCTNKTC420KYCTYCKYCS GTACCCAAAT CTTGGGTATC CTATANTKYC CCWAAANRCA AWTCTGGGCK480KTCCATKTSC TGGSKTCCRA ATTTAMMACA NCGGTTTCTT TCWTACCAAA AACCSNTGGG540CCCCRACCRA AAAAKGATAA TAATAAKGTG CWWWCAAAAC CCCGCCCCCC RRTTCAAYCG600GTCCARCACC CCANGNGGTN AGGTNGGAAT TYTMAACCCC CAGCCCATAA SNTTNSGNAA660AAACCCCCCN GGGYMYCAAA AMMCTTTTTG GGGMTTCSGS CCATKGYKCC AAAACCAAAA720TMTTTCYGGT CRWAAAAACC GGCCCNCCCG NAAATTTTTT GKCAACCCCA AACCTTTMAM780CCNNNTTCYY YCCCNSACAA TNGGSGGNKN NGSSCNTTYT TWTTTYYNNA GGGGGGRRWC840SNCCCCNAAN YYCCNAANKG NKCCCGSNMA AAAGAGANTT YCMKAAAAAC CCCCNCNCCC900NAAAYACCCC MAAAKWTTCM AAASMSCNNG YCCCCC 936(2)SEQ ID NO:331的信息(ⅰ)序列特征(A)长度1042碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:331:NNNGNKNNNY ATMMAYTCWY YCTSCACCSG GGNNWCWATT GCGGCCRMAW KCTTGTMAAS 60AGATCTMNAA YTCGGCACAG ASSSGCACAG ASCCGCGGCG CTATYCMYCC GYTGCTCATG120CTCAACACGC TCKTCGGCGW GRATAATGGC NCGCCGCCGG CGCCAACACG YTCAAYTGCT180TCGCCAACGC CATATNTCAA CAAGGTRATA AAASCAAAAC CGCSCGCCGY GCCCTTGGGC240SCGGRAASCG GTGCCAACCC RAAACNCKTT GGGCACYCGG KTSRACTTTA AASGGTAATC300TCKTCCTCCT GGGCTATGGT GCGCCACAAA CCTSYTGGCG WGGGTCTGGC CCTGGGYCAC360CGYCRCNTTT TATNTNTCCK YCTACACNCT TKGGTYCAAC CAACCCACTT CACMAAATTG420TTTTGGGKTG GGGSSGCCGG YTGTNNCCGK TAATAATCSG NTGKTCSGCC MYCACCGGWA480CCATANCCTG GCCGGCSCTG GCAAATTTCC SAAATCATYT CCTTCTGRAC CCCCACAMRC540CTNSAAATCC GRATCAATNC CCCNKGGCTT NTCYCTCTCN GTRCCCAATY TGGTTTCTAT600RKTNCCCYAA TSCAATTGGS TTYCCRTTSC YGSTTCCAAN TTNACAAMAS GGTTTYTCMT660ACCAAAACCC NTGGSCCNNA CMNAAAAKNA RAAAANAKGG KCTTTYAAAC CCCCCCCTAT720TCAWYCGGTN CMRNWCCCCG NGKAAGGKGN GAAAYTTHRA CCCAANCCMT ARSTTSGNAK780AAACCCYYCG GGGTSMCAAA MKNTWTTSSC CTTCGGMCTT YCCAAATMSA AAATYYTCKK840KRMNAAAAMC YGNCCCCSAA ANATTTTTGT NAAMCCCKMA YYTRTTWMCC WTTTTCCYCC900CCMCNNSNSG GNTNCCCTTY TYATTTCYMM MCRNNSGACN CCCCMNTYTT TWTTCKCWCN960MMARGSNNYT RGRMMNMNCC CCNCCCCNAK MTCCNCAAAK NTTTNAACNN NNKYCKCCCC 1020CCCMWMNKNC CCCCMNCMTT TM1042(2)SEQ ID NO:332的信息(ⅰ)序列特征(A)长度1073碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:332:NNSGSGMKKK ATAMATCWCT CTSYACCSNG GMTCWATTGC GGCCGMAWTC TNGTMAASAG 60ATCTCGAAYT CGGCAAANAK ACGCMAYGTC AAGTGTRAYY CGGTCACATA TCMTCGCGNG120TCAACMCCAA AGCCGNGTCA CCGYCTCCCT GGGGCGCCAC CCCCATCGGT RATGCAACYT180CGCGCGCCAC CGYCAAAAGG KTCWTTRAGG CGCTAAAGGT CAMCAATTCC TRAGGTYMCN240CACCGTTNTT TGGCCCGCCC RAWTYCTRAC CCGCAATWTC GGTAATCGGR AATTTGGGCW300YCGGCTTGGG CAATAAGKTN TTGGGCAACG GCGGRWTCYC NCTGGCCGRA ATTCCCNCAT360TCCKTTAACG GKTGRACCGT TTYCCCGGYT GCCGTAAYTG YTYCNTGGGC GCCYTCGGCC420CRNAGCASYY CRCTAACGGY CMCCAGGCAA TACCKTTGGC TTTRAACCAC CGGRATNAAY480TGKTACCCAC YTCAASSGTS CTGRANTTRK TNTCNTGRAA AANMCCACCN AACCCGGNTT540RATCTGCTTC MTCANCWTTT SCCGGGTTCT GCCGTTTTGR AAYCTTNATC CMTYCAAAAG600GTTTAMTTTC CCAANRAATT CGGYTTGCCA CCTTGGCCGS GGCTGGTTTM CGMWCCTTRR660AMATCCNCCS GCGGGSAAAN AMTTSGGNTT SGSCCGGTCC CCCGNAATAT YCNTGGNCCT720GNAAATTGSS GGGATCCCCN GSGNAYCCGG CCWTKGGGGK TNCCCAGTTG GWACAATTYC780WKCCGTTCCA AACCCGGGNC CGGGGGGTGG GSCCCNTTTT CCTMYNNAAA AAGKGTTTGN840NYYTTTTCCG CNRAANTTCA CCSKCNKTNT GGNCCNAACY YYYCAANTTC CANACCTTTA900AASAAANCYK YGKTYYCCCC TTTTMCCSGS SANCCCCCCM NMSSKNCGGG AAAAAAAGNK960TYNGCCTTAN CNSNKTKTTT TNKTYCCCCC NMWNNSNMCY NCBKKCNKRY NGNSNMNCCT 1020MKYSKCNNNN SNNNNNKCGN GSNCSGMKYM CMNNCNGMYK NGNKSNNCCC MSC 1073(2)SEQ ID NO:333的信息(ⅰ)序列特征(A)长度1061碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:333:GNSNGNKNTN TMCAYCWYCT SCACSGGGTC TATTGCGGCC GCAATYTNGT CKASAGATCT 60CGATYTCGGC AMNANAARTG TCGTCGTCAA TTTCAGKKTG GTCKTCAAAY GGGCCAGGCC120GNGACCRACA CCCTGNGTCA CCCAAAANAC CAACAGCWTC AAATWTCAAG GCCRAGGCSC180TRTCAATYCC CRASCAKTTA ACCGTKTCCW TCRAAGGTGC CRAACCAGGC ACCCAGYTCA240CCGCCSGGCA AWTCGCGCTG CCGGCCGGTN TCAGCCTGAT TYCTGACCCT RWTCTGTSGG300TGGYCAMCNT GGTGAAGGCC CWWCCGCCNA AGAACTGGAG GGCRAATTCC CAGGANCCNA360GRAACCCNAG GAACCCGCGG TAKAANCCGG CRAAACCRAG GCCGYTGGCN ATTCCNATTA420NAMSGGTTTG CRACNTGGCC RAACCGTTTY CTTGGTCGGC CTCGGCAACC CTGGACCANT480TACCCCKTNC CCGGNMCMAC CYCGGGTNCT TGKYCCCAAT NTGCYCCCGC GNRANTNGGC540CNAATTCCAG GGCNCCANCT TTCCGGCCCN AATTCCCYTG GTTAATCACC GGGCNCNCCT600GGTTTTGGGC AACCCCNCYS CTTMTTTAAA CATTCCGSCC CAAATGGGNC STTGGSAAAT660TCTNTYCGGT GGGGCSGGCR ANMYTTCTCT YCCCNAASAN CTTAMYCCAN TTCGSSNTCC720CGGKCAAAWS NGGGGGGGNA AAGGGCCCCC CGGNTSCKCC GGGGKKGCCC CYGGKTTCAA780AANTTTCSGG GKTSTMSCGG NVTCSCCCCC CSGCCAAGRA CCGNGGTTTT TTTTTGAACC840KCMANTCSSA AMCCGCCSSC CCCMAAAGGS GCCTNAAWGR RAYTTNKSCC CNNAAACSGG900CCCCCAKYTY SGGKTTCNNC CNCCSGKKGT CCMTSTTTMM MRCCCTTTGN GNKTTTTTAN960MGSCCTTNNC CACCCCCYCK GGGKCSMNNA GAAKTMYWKC CNGGGGNNAN RSCCCCCCNN 1020GSGKGGGGKG MGAGYSCCKT CTKGCGNCNN YKNTTTCCCC C 1061(2)SEQ ID NO:334的信息(ⅰ)序列特征(A)长度986碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:334:GNNGNNNKWN ATMCAYCWYY CTSCACCSGG GMTCWATTGC GGCCGCAWKY TNGTMAASAG 60ATCTMGAAYT CGGCACANAG CGGCACAGAG TGTGTGCATC TGTGTCANAG CTGTCAACGC120GGTGCCGCSG GTGGTRASCA CMCATTGCGR AACACCAAAC CCGTCCGCGG GYCACCGGCK180TCGCCTGCAA AAYCCTCCAG GCCACCYCRA AACAAYWYCT CCTGCAACSC ARSCCGTTYC240GCGGCCGRAT CCTGGKYCAS YTCGCCKTGC GGTGCGCCAA GGTACTGGCS CWYCRANACC300GCTYCGGGRA ACCNAACGTA AATCTTGCCN AATTTGCNTT CCCCCTSCCC TTRATNAATT360TGTTAAACCA CGCAAACCTY CGGGCKTCTC CTCKTGCCRA WTCCGRWTCC RATNYCGCCA420TGGCCTNKTC KYCTYCKYCS GTMCCCAAAT CTTGGTATCC TATATTGTCC CTAAATGCAA480ATCTKGGCTG TCCATNTGCT GGCGTTCAAA TTWAMANCAG NGGTTTCTTY CTTCCNAAAC540CCSTTGGCCC CAAACCNAAA AATGATNATA ATAATGGTGC TNTCAAACCC CGCNCCCATY600CNATCSGKCC AMMCCCCRGN GGKTANKKGG GNAATTCTMM AACCCCAAGC CATAASNTTG660SGANAAACCY NCNCMGGYCA CCAAAACANY NTTNTTGGNY SSNTTCGGMN YCATGGCTNN720CMAAAACCCA AATACTNYYG GGYCCAATAA AAMMMSGGYC SAMCCGGAAA WTTTTYTTGN780KYNAAACCNA AAKCCTTTTT CNAACCCDAN WNTYCCTNCC RCRCMANTGG CNSGGARTKT840SSSCTTNCCA ATGKYCCMAA AGNGGGRANA CCARCCCCAA TTCCTNNNTN KNKNCCCNST900TRNAAAAGGG GKNTYNCMAA AASCNCCNCC NCNCTCCCAA AAKAMCCCCN AAAGAKNTCN960NAANASKYSN NNNSCCCCCC CCMMMN 986(2)SEQ ID NO:335的信息(ⅰ)序列特征(A)长度1074碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:335:NGNGGGNKRN ATMMAYCWCT SATYYACCSN GGMNMWATTG CGGCCRMAWT CTNGTMKASA 60GATCTMGAAA YTCGGCAAAG AGYATKCTCG GGGGCCAGAT TTNTGGCCCG CAACCGCCGC120ACTTTGCAYW TCAACAKTCC SGGTGCCCCA AAAAAWTCWT ACCCCCATMC TYCKTGCASM180ASYTGCGCCC RATTRAACAC CCGGCCGGCW TGCTGCGCCA GGTATTYCAS CAGYTCAAAY240YCTTTKTAGK TAAAATCCAG CSGGCGGCCA CNCAGCCGGG CGGTKTAGGT GCCTYCRTCA300ATMACCAGCY CGCCCAGGGY CACCTTGCCC AAAAYCTCCT GGGTCAGCCA AATTYCCGCS360CCGGCCAACM ACCANCCGCA TYCTGGCNTC AATCYCACCG GGCCCGGTGY TAAAMMANMA420GRATCTCKTC MANCCCCCAN TCAGCSYTNA CNGCMACAGC CCGCCTTCTT CAMACCGCCA480RTACCGGGWT CAACCGGCCS GTCAAACTCA ACAGGCGGNC AGGCCTCCCC CGGANSAAAG540GTCTTACSCC NNYAANAAAA MAAGNTCTGT TTTCCCCCTC CASAASNAAA AANCCCCSGC600CGGGCCTTCN NMMGGGTTTG GGGMANANAA AARCNCCGGN GGAACGNATC CGAAAMCTCC660CAAGTCNCMT TWAWAACYCN NNAACCCCCC ANTTTTGGGA AAGGNTCCCC NTTMYCCCCC720TTTTASGKTS GGGMMYYCTY TAAAAAAATT CCCCAAAAAG CCCCGGGAAG GGTCMAMCTG780GGNAAATTTC CAAMCCNWGK TTNTTYNGGT TMCGGGGGRA AATTYCNCTC CCYYNNNGGG840CSSGSNNNAT TAYGGMSNMT TTTNNAAWTM NSGKKTSAMM YNNKCCMNNN SNNMSMANNK900TNAMCKCCCN CCTCNGNGKY CSCYNCCCSG GNAGNGGRAS MKCCNANMAA AYASGNTTNK960CGGAAMMCNN AATKGNNNSC CCGGASMCMN NNNMAAATMT CNCNKCNSNN AANRGMRACN 1020CCCNSNSGMN RRGAARMTNY YCCCCCGSKM GKGNKAAAAW GKYCCCCCCM AAAG 1074(2)SEQ ID NO:336的信息(ⅰ)序列特征(A)长度1195碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:336:NGNGNCNKNT MTACATCWTT CTGCACCSGG GNTCWANTGC GGCCGCAWKY TTGTCGASAG 60ATCTCGAAYT CGGCAMGAGG ACWCTCGCRA CGCCCCCACA NACTCTGGCG TGTGTACCCC120ATTGNGCGCK TCACGCGCCC AYTGANCCAK TNCACTGGGG TGCCGTYCGC CKTGCGCGGC180GGCCTCACGG CKCTSCWTCT RAAGGCWTGG CGCACCGCAT TCGGTTTTCT RAACGCTGGG240AAAWTGGCCA GCCGTCTGGC TCATGGGNTC TACGCAACGC CNGCCCCCAA CRCTTTCTTA300AATCCGGYCC NTCCTGANCS CTTTGAAYCC CGGGGSAAGA ACTGGTTGCS CNCGAYCTGC360TCGAACTTRK TCNAAATCCC GCANAKTGTT TCNTAMGYCC CNCCGGAAGG NGAACCTACT420TTCNGGWANG TCGGCNKCCG GCGCTTATCA STCCTGATCA ACGGGGAACT GGYKNNSTTG480KGGGAAAAAG RRCCTCAATG MTYGGTCCKC GCTGCGKANC CGCSCCCTGK GYCGCNAATG540GAAGGCSMAG GGTTAANGCC MTTYCNYCCR RSCCGTSTGA SGKWTTYCGG MGGANKAMNN600NNKMAMWTTK TCRGNGGCCW ATSTSCCGGG CKSTTAKAGA ANACTYCCKW WCCGTNTYSC660SAAAGNTKCS GCGMGTTTTS SCCKMGANGN YCTGATTTSA GGGGGKYKCC CCCGGGGTYC720CGAAWKWRKY CCYAGGGGGM GNYCSAGCSC CGMNNATNAG AGNAAGGKTT RYGSTSKNCC780TYTNKGGACC WSCNNCWSAK ANAACNNKKT TGCSCCNTMS AGNKTNKGRT YCCNKTSTTC840TAAGAGGAGC TATKMKCGCC CKTGGANGMM GAGWGMGCGC KYCCCSNKRT TCNTNGWAAA900TATKSAGMGG TKCCGMAGMK CCSCGTTTKT TKTGANAAMN MSMRKNKKTG CGMGYTCTSC960GGGNTTTGTA GAGTAKTCGS CSCSSMWGAC WCSGMCMGNG AGKNKTNNTS YANTGARCGY 1020MNNSKTMKMT MSCSCGCGNA GGAGNGCCCC CSANGMSTGY NKGGNMSSNG ARAKGATGGS 1080GGCCNCGMNN MGMGGANMGA SANNGMGGMR GGGGGKTGKC TCKCSCCGNS CSANGRAGAA 1140GKTCNGSCGC CGMGGKYGKT KTKTKNKTGG YSTCMSSMMM NAGAAAAGAG AGGGC1195(2)SEQ ID NO:337的信息(ⅰ)序列特征(A)长度3572碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型基因组DNA(ⅹⅰ)序列描述SEQ ID NO:337:CCATCTGATC GTTGGCAACC AGCATCGCAG TGGGAACGAT GCCCTCATTC AGCATTTGCA 60TGGTTTGTTG AAAACCGGAC ATGGCACTCC AGTCGCCTTC CCGTTCCGCT ATCGGCTGAA120TTTGATTGCG AGTGAGATAT TTATGCCAGC CAGCCAGACG CAGACGCGCC GAGACAGAAC180TTAATGGGCC CGCTAACAGC GCGATTTGCT GGTGACCCAA TGCGACCAGA TGCTCCACGC240CCAGTCGCGT ACCGTCTTCA TGGGAGAAAA TAATACTGTT GATGGGTGTC TGGTCAGAGA300CATCAAGAAA TAACGCCGGA ACATTAGTGC AGGCAGCTTC CACAGCAATG GCATCCTGGT360CATCCAGCGG ATAGTTAATG ATCAGCCCAC TGACGCGTTG CGCGAGAAGA TTGTGCACCG420CCGCTTTACA GGCTTCGACG CCGCTTCGTT CTACCATCGA CACCACCACG CTGGCACCCA480GTTGATCGGC GCGAGATTTA ATCGCCGCGA CAATTTGCGA CGGCGCGTGC AGGGCCAGAC540TGGAGGTGGC AACGCCAATC AGCAACGACT GTTTGCCCGC CAGTTGTTGT GCCACGCGGT600TGGGAATGTA ATTCAGCTCC GCCATCGCCG CTTCCACTTT TTCCCGCGTT TTCGCAGAAA660CGTGGCTGGC CTGGTTCACC ACGCGGGAAA CGGTCTGATA AGAGACACCG GCATACTCTG720CGACATCGTA TAACGTTACT GGTTTCACAT TCACCACCCT GAATTGACTC TCTTCCGGGC780GGTATCATGC CATACCGCGA AAGGTTTTGC GCCATTCGAT GGTGTCCGGG ATCTCGACGC840TCTCCCTTAT GCGACTCCTG CATTAGGAAG CAGCCCAGTA GTAGGTTGAG GCCGTTGAGC900ACCGCCGCCG CAAGGAATGG TGCATGCAAG GAGATGGCGC CCAACAGTCC CCCGGCCACG960GGGCCTGCCA CCATACCCAC GCCGAAACAA GCGCTCATGA GCCCGAAGTG GCGAGCCCGA 1020TCTTCCCCAT CGGTGATGTC GGCGATATAG GCGCCAGCAA CCGCACCTGT GGCGCCGGTG 1080ATGCCGGCCA CGATGCGTCC GGCGTAGAGG ATCGAGATCT CGATCCCGCG AAATTAATAC 1140GACTCACTAT AGGGGAATTG TGAGCGGATA ACAATTCCCC TCTAGAAATA ATTTTGTTTA 1200ACTTTAAGAA GGAGATATAC ATATGGGCCA TCATCATCAT CATCACGTGA TCGACATCAT 1260CGGGACCAGC CCCACATCCT GGGAACAGGC GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA 1320TAGCGTCGAT GACATCCGCG TCGCTCGGGT CATTGAGCAG GACATGGCCG TGGACAGCGC 1380CGGCAAGATC ACCTACCGCA TCAAGCTCGA AGTGTCGTTC AAGATGAGGC CGGCGCAACC 1440GAGGGGCTCG AAACCACCGA GCGGTTCGCC TGAAACGGGC GCCGGCGCCG GTACTGTCGC 1500GACTACCCCC GCGTCGTCGC CGGTGACGTT GGCGGAGACC GGTAGCACGC TGCTCTACCC 1560GCTGTTCAAC CTGTGGGGTC CGGCCTTTCA CGAGAGGTAT CCGAACGTCA CGATCACCGC 1620TCAGGGCACC GGTTCTGGTG CCGGGATCGC GCAGGCCGCC GCCGGGACGG TCAACATTGG 1680GGCCTCCGAC GCCTATCTGT CGGAAGGTGA TATGGCCGCG CACAAGGGGC TGATGAACAT 1740CGCGCTAGCC ATCTCCGCTC AGCAGGTCAA CTACAACCTG CCCGGAGTGA GCGAGCACCT 1800CAAGCTGAAC GGAAAAGTCC TGGCGGCCAT GTACCAGGGC ACCATCAAAA CCTGGGACGA 1860CCCGCAGATC GCTGCGCTCA ACCCCGGCGT GAACCTGCCC GGCACCGCGG TAGTTCCGCT 1920GCACCGCTCC GACGGGTCCG GTGACACCTT CTTGTTCACC CAGTACCTGT CCAAGCAAGA 1980TCCCGAGGGC TGGGGCAAGT CGCCCGGCTT CGGCACCACC GTCGACTTCC CGGCGGTGCC 2040GGGTGCGCTG GGTGAGAACG GCAACGGCGG CATGGTGACC GGTTGCGCCG AGACACCGGG 2100CTGCGTGGCC TATATCGGCA TCAGCTTCCT CGACCAGGCC AGTCAACGGG GACTCGGCGA 2160GGCCCAACTA GGCAATAGCT CTGGCAATTT CTTGTTGCCC GACGCGCAAA GCATTCAGGC 2220CGCGGCGGCT GGCTTCGCAT CGAAAACCCC GGCGAACCAG GCGATTTCGA TGATCGACGG 2280GCCCGCCCCG GACGGCTACC CGATCATCAA CTACGAGTAC GCCATCGTCA ACAACCGGCA 2340AAAGGACGCC GCCACCGCGC AGACCTTGCA GGCATTTCTG CACTGGGCGA TCACCGACGG 2400CAACAAGGCC TCGTTCCTCG ACCAGGTTCA TTTCCAGCCG CTGCCGCCCG CGGTGGTGAA 2460GTTGTCTGAC GCGTTGATCG CGACGATTTC CAGCGCTGAG ATGAAGACCG ATGCCGCTAC 2520CCTCGCGCAG GAGGCAGGTA ATTTCGAGCG GATCTCCGGC GACCTGAAAA CCCAGATCGA 2580CCAGGTGGAG TCGACGGCAG GTTCGTTGCA GGGCCAGTGG CGCGGCGCGG CGGGGACGGC 2640CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA AGCAGCCAAT AAGCAGAAGC AGGAACTCGA 2700CGAGATCTCG ACGAATATTC GTCAGGCCGG CGTCCAATAC TCGAGGGCCG ACGAGGAGCA 2760GCAGCAGGCG CTGTCCTCGC AAATGGGCTT TGGATTCAGC TTCGCGCTGC CTGCTGGCTG 2820GGTGGAGTCT GACGCCGCCC ACTTCGACTA CGGTTCAGCA CTCCTCAGCA AAACCACCGG 2880GGACCCGCCA TTTCCCGGAC AGCCGCCGCC GGTGGCCAAT GACACCCGTA TCGTGCTCGG 2940CCGGCTAGAC CAAAAGCTTT ACGCCAGCGC CGAAGCCACC GACTCCAAGG CCGCGGCCCG 3000GTTGGGCTCG GACATGGGTG AGTTCTATAT GCCCTACCCG GGCACCCGGA TCAACCAGGA 3060AACCGTCTCG CTYGACGCCA ACGGGGTGTC TGGAAGCGCG TCGTATTACG AAGTCAAGTT 3120CAGCGATCCG AGTAAGCCGA ACGGCCAGAT CTGGACGGGC GTAATCGGCT CGCCCGCGGC 3180GAACGCACCG GACGCCGGGC CCCCTCAGCG CTGGTTTGTG GTATGGCTCG GGACCGCCAA 3240CAACCCGGTG GACAAGGGCG CGGCCAAGGC GCTGGCCGAA TCGATCCGGC CTTTGGTCGC 3300CCCGCCGCCG GCGCCGGCCG GGGAAGTCGC TCCTACCCCG ACGACACCGA CACCGCAGCG 3360GACCTTACCG GCCTGAGAAT TCTGCAGATA TCCATCACAC TGGCGGCCGC TCGAGCACCA 3420CCACCACCAC CACTGAGATC CGGCTGCTAA CAAAGCCCGA AAGGAAGCTG AGTTGGCTGC 3480TGCCACCGCT GAGCAATAAC TAGCATAACC CCTTGGGGCC TCTAAACGGG TCTTGAGGGG 3540TTTTTTGCTG AAAGGAGGAA CTATATCCGG AT 3572(2)SEQ ID NO:338的信息(ⅰ)序列特征(A)长度20氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:338:Val Gln Phe Gln Ser Gly Gly Asp Asn Ser Pro Ala Val Tyr Xaa Xaa1 5 10 15Asp Gly Xaa Arg20
(2)SEQ ID NO:339的信息(ⅰ)序列特征(A)长度10氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:339:Thr Thr Val Pro Xaa Val Thr Glu Ala Arg1 5 10(2)SEQ ID NO:340的信息(ⅰ)序列特征(A)长度10氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:340:Thr Thr Pro Ser Xaa Val Ala Phe Ala Arg1 5 10(2)SEQ ID NO:341的信息(ⅰ)序列特征(A)长度12氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:341:Asp Ala Gly Lys Xaa Ala Gly Xaa Asp Val Xaa Arg1 5 10(2)SEQ ID NO:342的信息(ⅰ)序列特征(A)长度18氨基酸(B)类型氨基酸(C)链型单链
(D)拓扑结构线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:342:Thr Xaa Glu Glu Xaa Gln Glu Ser Phe Asn Ser Ala Ala Pro Gly Asn1 5 10 15Xaa Lys(2)SEQ ID NO:343的信息(ⅰ)序列特征(A)长度27碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它(ⅹⅰ)序列描述SEQ ID NO:343:CTAGTTAGTA CTCAGTCGCA GACCGTG27(2)SEQ ID NO:344的信息(ⅰ)序列特征(A)长度25碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它(ⅹⅰ)序列描述SEQ ID N0:344:GCAGTGACGA ATTCACTTCG ACTCC 25(2)SEQ ID NO:345的信息(ⅰ)序列特征(A)长度2412碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:345:CATATGGGCC ATCATCATCA TCATCACGTG ATCGACATCA TCGGGACCAG CCCCACATCC 60TGGGAACAGG CGGCGGCGGA GGCGGTCCAG CGGGCGCGGG ATAGCGTCGA TGACATCCGC120GTCGCTCGGG TCATTGAGCA GGACATGGCC GTGGACAGCG CCGGCAAGAT CACCTACCGC180ATCAAGCTCG AAGTGTCGTT CAAGATGAGG CCGGCGCAAC CGAGGGGCTC GAAACCACCG240AGCGGTTCGC CTGAAACGGG CGCCGGCGCC GGTACTGTCG CGACTACCCC CGCGTCGTCG300CCGGTGACGT TGGCGGAGAC CGGTAGCACG CTGCTCTACC CGCTGTTCAA CCTGTGGGGT360CCGGCCTTTC ACGAGAGGTA TCCGAACGTC ACGATCACCG CTCAGGGCAC CGGTTCTGGT420GCCGGGATCG CGCAGGCCGC CGCCGGGACG GTCAACATTG GGGCCTCCGA CGCCTATCTG480TCGGAAGGTG ATATGGCCGC GCACAAGGGG CTGATGAACA TCGCGCTAGC CATCTCCGCT540CAGCAGGTCA ACTACAACCT GCCCGGAGTG AGCGAGCACC TCAAGCTGAA CGGAAAAGTC600CTGGCGGCCA TGTACCAGGG CACCATCAAA ACCTGGGACG ACCCGCAGAT CGCTGCGCTC660AACCCCGGCG TGAACCTGCC CGGCACCGCG GTAGTTCCGC TGCACCGCTC CGACGGGTCC720GGTGACACCT TCTTGTTCAC CCAGTACCTG TCCAAGCAAG ATCCCGAGGG CTGGGGCAAG780TCGCCCGGCT TCGGCACCAC CGTCGACTTC CCGGCGGTGC CGGGTGCGCT GGGTGAGAAC840GGCAACGGCG GCATGGTGAC CGGTTGCGCC GAGACACCGG GCTGCGTGGC CTATATCGGC900ATCAGCTTCC TCGACCAGGC CAGTCAACGG GGACTCGGCG AGGCCCAACT AGGCAATAGC960TCTGGCAATT TCTTGTTGCC CGACGCGCAA AGCATTCAGG CCGCGGCGGC TGGCTTCGCA 1020TCGAAAACCC CGGCGAACCA GGCGATTTCG ATGATCGACG GGCCCGCCCC GGACGGCTAC 1080CCGATCATCA ACTACGAGTA CGCCATCGTC AACAACCGGC AAAAGGACGC CGCCACCGCG 1140CAGACCTTGC AGGCATTTCT GCACTGGGCG ATCACCGACG GCAACAAGGC CTCGTTCCTC 1200GACCAGGTTC ATTTCCAGCC GCTGCCGCCC GCGGTGGTGA AGTTGTCTGA CGCGTTGATC 1260GCGACGATTT CCAGCGCTGA GATGAAGACC GATGCCGCTA CCCTCGCGCA GGAGGCAGGT 1320AATTTCGAGC GGATCTCCGG CGACCTGAAA ACCCAGATCG ACCAGGTGGA GTCGACGGCA 1380GGTTCGTTGC AGGGCCAGTG GCGCGGCGCG GCGGGGACGG CCGCCCAGGC CGCGGTGGTG 1440CGCTTCCAAG AAGCAGCCAA TAAGCAGAAG CAGGAACTCG ACGAGATCTC GACGAATATT 1500CGTCAGGCCG GCGTCCAATA CTCGAGGGCC GACGAGGAGC AGCAGCAGGC GCTGTCCTCG 1560CAAATGGGCT TTGTGCCCAC AACGGCCGCC TCGCCGCCGT CGACCGCTGC AGCGCCACCC 1620GCACCGGCGA CACCTGTTGC CCCCCCACCA CCGGCCGCCG CCAACACGCC GAATGCCCAG 1680CCGGGCGATC CCAACGCAGC ACCTCCGCCG GCCGACCCGA ACGCACCGCC GCCACCTGTC 1740ATTGCCCCAA ACGCACCCCA ACCTGTCCGG ATCGACAACC CGGTTGGAGG ATTCAGCTTC 1800GCGCTGCCTG CTGGCTGGGT GGAGTCTGAC GCCGCCCACT TCGACTACGG TTCAGCACTC 1860CTCAGCAAAA CCACCGGGGA CCCGCCATTT CCCGGACAGC CGCCGCCGGT GGCCAATGAC 1920ACCCGTATCG TGCTCGGCCG GCTAGACCAA AAGCTTTACG CCAGCGCCGA AGCCACCGAC 1980TCCAAGGCCG CGGCCCGGTT GGGCTCGGAC ATGGGTGAGT TCTATATGCC CTACCCGGGC 2040ACCCGGATCA ACCAGGAAAC CGTCTCGCTC GACGCCAACG GGGTGTCTGG AAGCGCGTCG 2100TATTACGAAG TCAAGTTCAG CGATCCGAGT AAGCCGAACG GCCAGATCTG GACGGGCGTA 2160ATCGGCTCGC CCGCGGCGAA CGCACCGGAC GCCGGGCCCC CTCAGCGCTG GTTTGTGGTA 2220TGGCTCGGGA CCGCCAACAA CCCGGTGGAC AAGGGCGCGG CCAAGGCGCT GGCCGAATCG 2280ATCCGGCCTT TGGTCGCCCC GCCGCCGGCG CCGGCACCGG CTCCTGCAGA GCCCGCTCCG 2340GCGCCGGCGC CGGCCGGGGA AGTCGCTCCT ACCCCGACGA CACCGACACC GCAGCGGACC 2400TTACCGGCCT GA 2412(2)SEQ ID NO:346的信息(ⅰ)序列特征(A)长度802氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:346:Met Gly His His His His His His Val Ile Asp Ile Ile Gly Thr Ser1 5 10 15Pro Thr Ser Trp Glu Gln Ala Ala Ala Glu Ala Val Gln Arg Ala Arg20 25 30Asp Ser Val Asp Asp Ile Arg Val Ala Arg Val Ile Glu Gln Asp Met35 40 45Ala Val Asp Ser Ala Gly Lys Ile Thr Tyr Arg Ile Lys Leu Glu Val50 55 60Ser Phe Lys Met Arg Pro Ala Gln Pro Arg Gly Ser Lys Pro Pro Ser65 70 75 80Gly Ser Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro85 90 95Ala Ser Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr100 105 110Pro Leu Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn115 120 125Val Thr Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln130 135 140Ala Ala Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser145 150 155 160Glu Gly Asp Met Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala165 170 175Ile Ser Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His180 185 190Leu Lys Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile195 200 205Lys Thr Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn210 215 220Leu Pro Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly225 230 235 240Asp Thr Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly245 250 255Trp Gly Lys Ser Pro Gly Phe Gly Thr Thr Val Asp Phe Pro Ala Val260 265 270Pro Gly Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys275 280 285Ala Glu Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp290 295 300Gln Ala Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser305 310 315 320Gly Asn Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala325 330 335Gly Phe Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp340 345 350Gly Pro Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile355 360 365Val Asn Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala370 375 380Phe Leu His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp385 390 395 400Gln Val His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp
405 410 415Ala Leu Ile Ala Thr Ile Ser Ser Ala Glu Met Lys Thr Asp Ala Ala420 425 430Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile Ser Gly Asp Leu435 440 445Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly Ser Leu Gln Gly450 455 460Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala Ala Val Val Arg465 470 475 480Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu Asp Glu Ile Ser485 490 495Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg Ala Asp Glu Glu500 505 510Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe Val Pro Thr Thr Ala515 520 525Ala Ser Pro Pro Ser Thr Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro530 535 540Val Ala Pro Pro Pro Pro Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro545 550 555 560Gly Asp Pro Asn Ala Ala Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro565 570 575Pro Pro Val Ile Ala Pro Asn Ala Pro Gln Pro Val Arg Ile Asp Asn580 585 590Pro Val Gly Gly Phe Ser Phe Ala Leu Pro Ala Gly Trp Val Glu Ser595 600 605Asp Ala Ala His Phe Asp Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr610 615 620Gly Asp Pro Pro Phe Pro Gly Gln Pro Pro Pro Val Ala Asn Asp Thr625 630 635 640Arg Ile Val Leu Gly Arg Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu645 650 655Ala Thr Asp Ser Lys Ala Ala Ala Arg Leu Gly Ser Asp Met Gly Glu660 665 670Phe Tyr Met Pro Tyr Pro Gly Thr Arg Ile Asn Gln Glu Thr Val Ser675 680 685Leu Asp Ala Asn Gly Val Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys690 695 700Phe Ser Asp Pro Ser Lys Pro Asn Gly Gln Ile Trp Thr Gly Val Ile705 710 715 720Gly Ser Pro Ala Ala Asn Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp725 730 735Phe Val Val Trp Leu Gly Thr Ala Asn Asn Pro Val Asp Lys Gly Ala740 745 750Ala Lys Ala Leu Ala Glu Ser Ile Arg Pro Leu Val Ala Pro Pro Pro755 760 765Ala Pro Ala Pro Ala Pro Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala770 775 780Gly Glu Val Ala Pro Thr Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu785 790 795 800Pro Ala
(2)SEQ ID NO:347的信息(ⅰ)序列特征(A)长度34碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它(ⅹⅰ)序列描述SEQ ID NO:347:GGATCCAAAC CACCGAGCGG TTCGCCTGAA ACGG 34(2)SEQ ID NO:348的信息(ⅰ)序列特征(A)长度37碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型其它(ⅹⅰ)序列描述SEQ ID NO:348:CGCTGCGAAT TCACCTCCGG AGGAAATCGT CGCGATC 37(2)SEQ ID NO:349的信息(ⅰ)序列特征(A)长度1962碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:349:CATATGGGCC ATCATCATCA TCATCACGGA TCCAAACCAC CGAGCGGTTC GCCTGAAACG 60GGCGCCGGCG CCGGTACTGT CGCGACTACC CCCGCGTCGT CGCCGGTGAC GTTGGCGGAG120ACCGGTAGCA CGCTGCTCTA CCCGCTGTTC AACCTGTGGG GTCCGGCCTT TCACGAGAGG180TATCCGAACG TCACGATCAC CGCTCAGGGC ACCGGTTCTG GTGCCGGGAT CGCGCAGGCC240GCCGCCGGGA CGGTCAACAT TGGGGCCTCC GACGCCTATC TGTCGGAAGG TGATATGGCC300GCGCACAAGG GGCTGATGAA CATCGCGCTA GCCATCTCCG CTCAGCAGGT CAACTACAAC360CTGCCCGGAG TGAGCGAGCA CCTCAAGCTG AACGGAAAAG TCCTGGCGGC CATGTACCAG420GGCACCATCA AAACCTGGGA CGACCCGCAG ATCGCTGCGC TCAACCCCGG CGTGAACCTG480CCCGGCACCG CGGTAGTTCC GCTGCACCGC TCCGACGGGT CCGGTGACAC CTTCTTGTTC540ACCCAGTACC TGTCCAAGCA AGATCCCGAG GGCTGGGGCA AGTCGCCCGG CTTCGGCACC600ACCGTCGACT TCCCGGCGGT GCCGGGTGCG CTGGGTGAGA ACGGCAACGG CGGCATGGTG660ACCGGTTGCG CCGAGACACC GGGCTGCGTG GCCTATATCG GCATCAGCTT CCTCGACCAG720GCCAGTCAAC GGGGACTCGG CGAGGCCCAA CTAGGCAATA GCTCTGGCAA TTTCTTGTTG780CCCGACGCGC AAAGCATTCA GGCCGCGGCG GCTGGCTTCG CATCGAAAAC CCCGGCGAAC840CAGGCGATTT CGATGATCGA CGGGCCCGCC CCGGACGGCT ACCCGATCAT CAACTACGAG900TACGCCATCG TCAACAACCG GCAAAAGGAC GCCGCCACCG CGCAGACCTT GCAGGCATTT960CTGCACTGGG CGATCACCGA CGGCAACAAG GCCTCGTTCC TCGACCAGGT TCATTTCCAG 1020CCGCTGCCGC CCGCGGTGGT GAAGTTGTCT GACGCGTTGA TCGCGACGAT TTCCTCCGGA 1080GGTGGCAGTG GGGGAGGCTC AGGTGGAGGT TCTGGCGGGA GCGTGCCCAC AACGGCCGCC 1140TCGCCGCCGT CGACCGCTGC AGCGCCACCC GCACCGGCGA CACCTGTTGC CCCCCCACCA 1200CCGGCCGCCG CCAACACGCC GAATGCCCAG CCGGGCGATC CCAACGCAGC ACCTCCGCCG 1260GCCGACCCGA ACGCACCGCC GCCACCTGTC ATTGCCCCAA ACGCACCCCA ACCTGTCCGG 1320ATCGACAACC CGGTTGGAGG ATTCAGCTTC GCGCTGCCTG CTGGCTGGGT GGAGTCTGAC 1380GCCGCCCACT TCGACTACGG TTCAGCACTC CTCAGCAAAA CCACCGGGGA CCCGCCATTT 1440CCCGGACAGC CGCCGCCGGT GGCCAATGAC ACCCGTATCG TGCTCGGCCG GCTAGACCAA 1500AAGCTTTACG CCAGCGCCGA AGCCACCGAC TCCAAGGCCG CGGCCCGGTT GGGCTCGGAC 1560ATGGGTGAGT TCTATATGCC CTACCCGGGC ACCCGGATCA ACCAGGAAAC CGTCTCGCTC 1620GACGCCAACG GGGTGTCTGG AAGCGCGTCG TATTACGAAG TCAAGTTCAG CGATCCGAGT 1680AAGCCGAACG GCCAGATCTG GACGGGCGTA ATCGGCTCGC CCGCGGCGAA CGCACCGGAC 1740GCCGGGCCCC CTCAGCGCTG GTTTGTGGTA TGGCTCGGGA CCGCCAACAA CCCGGTGGAC 1800AAGGGCGCGG CCAAGGCGCT GGCCGAATCG ATCCGGCCTT TGGTCGCCCC GCCGCCGGCG 1860CCGGCACCGG CTCCTGCAGA GCCCGCTCCG GCGCCGGCGC CGGCCGGGGA AGTCGCTCCT 1920ACCCCGACGA CACCGACACC GCAGCGGACC TTACCGGCCT GA 1962(2)SEQ ID NO:350的信息(ⅰ)序列特征(A)长度652氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:350:Met Gly His His His His His His Gly Ser Lys Pro Pro Ser Gly Ser1 51015Pro Glu Thr Gly Ala Gly Ala Gly Thr Val Ala Thr Thr Pro Ala Ser20 25 30Ser Pro Val Thr Leu Ala Glu Thr Gly Ser Thr Leu Leu Tyr Pro Leu35 40 45Phe Asn Leu Trp Gly Pro Ala Phe His Glu Arg Tyr Pro Asn Val Thr50 55 60Ile Thr Ala Gln Gly Thr Gly Ser Gly Ala Gly Ile Ala Gln Ala Ala65 70 75 80Ala Gly Thr Val Asn Ile Gly Ala Ser Asp Ala Tyr Leu Ser Glu Gly85 90 95Asp Mer Ala Ala His Lys Gly Leu Met Asn Ile Ala Leu Ala Ile Ser100 105 110Ala Gln Gln Val Asn Tyr Asn Leu Pro Gly Val Ser Glu His Leu Lys115120125Leu Asn Gly Lys Val Leu Ala Ala Met Tyr Gln Gly Thr Ile Lys Thr130135140Trp Asp Asp Pro Gln Ile Ala Ala Leu Asn Pro Gly Val Asn Leu Pro145 150 155 160Gly Thr Ala Val Val Pro Leu His Arg Ser Asp Gly Ser Gly Asp Thr165 170 175Phe Leu Phe Thr Gln Tyr Leu Ser Lys Gln Asp Pro Glu Gly Trp G1y180 185 190Lys Ser Pro GIy Phe Gly Thr Thr Val Asp Phe Pro Ala Val Pro Gly195 200 205Ala Leu Gly Glu Asn Gly Asn Gly Gly Met Val Thr Gly Cys Ala Glu210 215 220Thr Pro Gly Cys Val Ala Tyr Ile Gly Ile Ser Phe Leu Asp Gln Ala225 230 235 240Ser Gln Arg Gly Leu Gly Glu Ala Gln Leu Gly Asn Ser Ser Gly Asn245 250 255Phe Leu Leu Pro Asp Ala Gln Ser Ile Gln Ala Ala Ala Ala Gly Phe260 265 270Ala Ser Lys Thr Pro Ala Asn Gln Ala Ile Ser Met Ile Asp Gly Pro275 280 285Ala Pro Asp Gly Tyr Pro Ile Ile Asn Tyr Glu Tyr Ala Ile Val Asn290 295 300Asn Arg Gln Lys Asp Ala Ala Thr Ala Gln Thr Leu Gln Ala Phe Leu305 310 315 320His Trp Ala Ile Thr Asp Gly Asn Lys Ala Ser Phe Leu Asp Gln Val325 330 335His Phe Gln Pro Leu Pro Pro Ala Val Val Lys Leu Ser Asp Ala Leu340 345 350Ile Ala Thr Ile Ser Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly355 360 365Gly Ser Gly Gly Ser Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr370 375 380Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro385 390 395 400Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala405 410 415Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro420 425 430Ash Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser435 440 445Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp450 455 460Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro465 470 475 480Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg485 490 495Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala500 505 510Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro515 520 525Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val530 535 540Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys545 550 555 560Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn565 570 575Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly580 585 590Thr Ala Asn Ash Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu595 600 605Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro610 615 620Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr625 630 635 640Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala645 650
权利要求
1.一种多肽,它含有可溶性结核分枝杆菌抗原的抗原性部分,或仅仅在保守性置换和/或修饰中有所不同的所述抗原的变体,其中所述抗原具有选自下列的N-端序列(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID NO:115);(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID NO:116);(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID NO:17);(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID NO:118);(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Glu-Glu-Xaa-Ala-Val(SEQ IDNO:119);(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ IDNO:120);(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Pro-Ser(SEQ ID NO:121);(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID NO:122);(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQID NO:123);和(j)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID NO:131)其中Xaa可以是任何氨基酸。
2.一种多肽,它包含结核分枝杆菌抗原的免疫原性部分,或仅仅在保守性置换和/或修饰中有所不同的所述抗原的变体,其中所述抗原具有选自下列的N-端序列(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID NO:124)和(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID NO:132)其中Xaa可以是任何氨基酸。
3.一种多肽,它含有可溶性结核分枝杆菌抗原的抗原性部分,或仅仅在保守性置换和/或修饰中有所不同的所述抗原的变体,其中所述抗原包含由DNA序列编码的氨基酸序列,该DNA序列选自SEQ ID NO:1、2、4-10、13-25、52、94和96中描述的序列、所述序列的互补序列、以及在中等严谨条件下与SEQ ID NO:1、2、4-10、13-25、52、94和96中描述的序列或其互补序列杂交的DNA序列。
4.一种多肽,它包含结核分枝杆菌抗原的抗原性部分,或仅仅在保守性置换和/或修饰中有所不同的所述抗原的变体,其中所述抗原包含由DNA序列编码的氨基酸序列,该DNA序列选自SEQ ID NO:26-51、133、134、158-178、196、235、237-242、248-251、290-293、304、311、313-315、317、319、323、324、328、330、332、334和336中描述的序列、所述序列的互补序列、以及在中等严谨条件下与SEQ ID NO:26-51、133、134、158-178、196、235、237-242、248-251、290-293、304、311、313-315、317、319、323、324、328、330、332、334和336中描述的序列或其互补序列杂交的DNA序列。
5.一种DNA分子,它包含编码权利要求1-4任一项所述的多肽的核苷酸序列。
6.一种重组表达载体,它含有权利要求5所述的DNA分子。
7.一种被权利要求6所述的表达载体转化的宿主细胞。
8.根据权利要求7所述的宿主细胞,其中宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。
9.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使权利要求1-4任一项所述的一种或多种多肽与生物样品接触;和(b)检测样品中结合至少一种多肽的抗体的存在,从而检测生物样品中的结核分枝杆菌感染。
10.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使生物样品与具有选自序列SEQ ID NO:129和130的N-端序列的多肽接触;和(b)检测样品中结合至少一种多肽的抗体的存在,从而检测生物样品中的结核分枝杆菌感染。
11.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使生物样品与一种或多种由DNA序列编码的多肽接触,所述DNA序列选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的序列、所述序列的互补序列、以及与SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的序列杂交的DNA序列。(b)检测样品中结合至少一种多肽的抗体的存在,从而检测生物样品中结核分枝杆菌的感染。
12.根据权利要求9-11任一项所述的方法,其中步骤(a)还包括使生物样品与38kD结核分枝杆菌抗原接触,步骤(b)还包括检测样品中结合38kD结核分枝杆菌抗原的抗体的存在。
13.根据权利要求9-11任一项所述的方法,其中多肽与固相载体结合。
14.根据权利要求13所述的方法,其中固相载体包括硝酸纤维素、胶乳或塑料材料。
15.根据权利要求9-11任一项所述的方法,其中生物样品选自全血、血清、血浆、唾液、脑脊液和尿液。
16.根据权利要求15所述的方法,其中生物样品是全血或血清。
17.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使样品在聚合酶链反应中与至少两种寡核苷酸引物接触,其中至少一种寡核苷酸引物对权利要求5所述的DNA分子有特异性;和(b)检测样品中的在寡核苷酸引物存在下扩增的DNA序列,从而检测结核分枝杆菌感染。
18.根据权利要求17所述的方法,其中至少一种寡核苷酸引物包含权利要求5所述的DNA分子的至少10个连续的核苷酸。
19.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使样品在聚合酶链反应中与至少两种寡核苷酸引物接触,其中至少一种寡核苷酸引物对选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列有特异性;和(b)检测样品中的在第一和第二寡核苷酸引物存在下扩增的DNA序列,从而检测结核分枝杆菌感染。
20.根据权利要求19所述的方法,其中至少一种寡核苷酸引物包含选自SEQ IDNO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列的至少10个连续的核苷酸。
21.根据权利要求17至19所述的方法,其中生物样品选自全血、痰液、血清、血浆、唾液、脑脊液和尿液。
22.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使样品与对权利要求5所述的DNA分子有特异性的一种或多种寡核苷酸探针接触;和(b)检测样品中与寡核苷酸探针杂交的DNA序列,从而检测结核分枝杆菌感染。
23.根据权利要求22所述的方法,其中探针包含权利要求5所述的DNA分子的至少15个连续的核苷酸。
24.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使样品与对选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列有特异性的一种或多种寡核苷酸探针接触;和(b)检测样品中与寡核苷酸探针杂交的DNA序列,从而检测结核分枝杆菌感染。
25.根据权利要求24所述的方法,其中寡核苷酸探针包含选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列的至少15个连续的核苷酸。
26.根据权利要求22或24所述的方法,其中生物样品选自全血、痰液、血清、血浆、唾液、脑脊液和尿液。
27.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使生物样品与能结合权利要求1-4任一项所述多肽的结合剂接触;和(b)检测样品中与结合剂结合的蛋白质或多肽,从而检测生物样品中的结核分枝杆菌感染。
28.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使生物样品与能结合多肽的结合剂接触,所述多肽具有选自SEQ ID NO:129和130所提供序列的N-端序列;和(b)检测样品中与结合剂结合的蛋白质或多肽,从而检测生物样品中的结核分枝杆菌感染。
29.一种检测生物样品中结核分枝杆菌感染的方法,该方法包括(a)使生物样品与能结合多肽的结合剂接触,编码该多肽的DNA序列选自SEQID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列,所述序列的互补序列,以及与SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337中描述的序列杂交的DNA序列;和(b)检测样品中与结合剂结合的蛋白或多肽,从而检测生物样品中的结核分枝杆菌感染。
30.根据权利要求27至29任一项所述的方法,其中结合剂是单克隆抗体。
31.根据权利要求27至29任一项所述的方法,其中结合剂是多克隆抗体。
32.一种诊断试剂盒,它包含(a)一种或多种权利要求1-4任一项所述的多肽;和(b)检测剂。
33.一种诊断试剂盒,它包含(a)具有选自SEQ ID NO:129和130所提供序列的N-端序列的一种或多种多肽;和(b)检测剂。
34.一种诊断试剂盒,它包含(a)一种或多种由DNA序列编码的多肽,该DNA序列选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337,所述序列的互补序列,以及与SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337中描述的序列杂交的DNA序列;和(b)检测剂。
35.根据权利要求32-34任一项所述的试剂盒,其中多肽固定在固相载体上。
36.根据权利要求35所述的试剂盒,其中固相载体包括硝酸纤维素、胶乳或塑料材料。
37.根据权利要求32-34任一项所述的试剂盒,其中检测剂包含与结合剂偶联的报道基团。
38.根据权利要求37所述的试剂盒,其中结合剂选自抗免疫球蛋白、蛋白G、蛋白A和凝集素。
39.根据权利要求37所述的试剂盒,其中报道基团选自放射性同位素、荧光基团、发光基团、酶、生物素、染料颗粒和胶粒。
40.一种诊断试剂盒,它包含至少两种寡核苷酸引物,至少一种寡核苷酸引物对权利要求5所述的DNA分子有特异性。
41.根据权利要求40所述的诊断试剂盒,其中至少一种寡核苷酸引物包含权利要求5所述的DNA分子的至少10个连续的核苷酸。
42.一种诊断试剂盒,它包含至少两种寡核苷酸引物,至少一种引物对选自SEQID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列有特异性。
43.根据权利要求42所述的诊断试剂盒,其中至少一种寡核苷酸引物包含选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列的至少10个连续的核苷酸。
44.一种诊断试剂盒,它包含至少一种寡核苷酸探针,所述寡核苷酸探针对权利要求5所述的DNA分子有特异性。
45.根据权利要求44所述的试剂盒,其中寡核苷酸探针包含权利要求5所述的DNA分子的至少15个连续的核苷酸。
46.一种诊断试剂盒,它包含至少一种寡核苷酸探针,所述寡核苷酸探针对选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列有特异性。
47.根据权利要求46所述的试剂盒,其中寡核苷酸探针包含选自SEQ ID NO:3、11、12、135、136、151-155、184-188、194-195、198、210-220、232、234、256-271、287、288、298-303、305-310、312、316、318、320-322、325-327、329、331、333、335和337的DNA序列的至少15个连续的核苷酸。
48.一种单克隆抗体,它与权利要求1-4任一项所述的多肽结合。
49.一种多克隆抗体,它与权利要求1-4任一项所述的多肽结合。
50.一种融合蛋白,它包含两种或多种权利要求1-4任一项所述的多肽。
51.一种融合蛋白,它包含一种或多种权利要求1-4任一项所述的多肽以及ESAT-6即SEQ ID NO:99。
52.一种融合蛋白,它包含具有选自SEQ ID NO:129和130所提供序列的N-端序列的多肽。
53.一种融合蛋白,它包含一种或多种权利要求1-4任一项所述的多肽以及结核分枝杆菌抗原38kD即SEQ ID NO:150。
54.一种诊断试剂盒,它包含(a)权利要求50-53任一项所述的一种或多种融合蛋白;和(b)检测剂。
全文摘要
本发明提供了一种多肽,它含有可溶性结核分枝杆菌抗原的抗原性部分,或仅仅在保守性置换和/或修饰中有所不同的所述抗原的变体。本发明还提供了编码这些多肽的DNA分子,这些多肽和DNA分子用于检测生物样品中结核分枝杆菌感染的用途,以及含有这些多肽和DNA分子的试剂盒。
文档编号G01N33/569GK1312723SQ99809541
公开日2001年9月12日 申请日期1999年2月17日 优先权日1998年2月18日
发明者S·G·里德, Y·A·W·斯凯基, D·C·狄龙, A·坎波斯-内托, R·霍顿, T·S·韦德维克, D·R·特德齐克, M·J·洛德斯, R·C·亨德里克森 申请人:考丽克萨有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1