庚型肝炎病毒及其分子克隆的制作方法

文档序号:6096016阅读:622来源:国知局

专利名称::庚型肝炎病毒及其分子克隆的制作方法
技术领域
:本发明涉及与非甲非乙非丙非丁非戊型(N-(ABCDE))肝炎相关的病毒性致病原(HGV)相关的核酸、多肽、抗原、表位、疫苗和抗体组合物。本发明还涉及诊断和治疗方法。参考文献1992年圣地亚哥会议摘要基因识别,临床化学。39(4)705(1993)。Alexander,W.A.等《病毒学杂志》662934-2942(1992)。Alter,H.J.等《新英格兰医学杂志》3211494-1500(1989a)。Alter,M.J.等《新英格兰医学杂志》3271899(1989b)。Alter,H.J.,病毒性肝炎和肝疾病国际会议摘要,第47页(1993)。Altschul,S.等,《分子生物学杂志》,215403-10(1990)。Ascadi,G.等,《自然》352815(1991)。Ausubel,F.M.等,当今分子生物学备忘录,JohnWiley和Sons,包括医学PA。Barany,F.,《聚合酶链反应方法的应用》,15(1991)。Barham,W.B.等《药学病毒学杂志》,42129-132(1994)。Baron,S.等,JAMA2661375(1991)。Bazan,J.F.等,《病毒学》171637-639(1989)。Beames等,《生物技术》11378(1991)。Belyavsky,A.等,《核酸研究》172929-2932(1989)。Blackburn,G.F.等《临床化学》371534-1539(1991)。Bradley,D.W.等,《感染性疾病杂志》,1482(1983)。Bradley,D.W.等,《普通病毒杂志》,691(1988)。Bradley,D.W.等《美国国家科学院院刊》,846277(1987)。Briand,J.-P.等,《免疫学方法杂志》,156255(1992)。Cahill,P.等,《临床化学》371482(1991)。Carter,J.M.等,《分子生物学方法》36207-223(1994)。Chamber,T.J.等,《微生物研究年鉴》44649(1990a)。Chamber,T.J.等,PNAS878898(1990b)。Chomczynski等,《生物化学年刊》162159(1987)。Christian,R.B.等,《分子生物学杂志》,227771(1992)。Commandaeur等,《病毒学杂志》198282-287(1994)。Crea,R.等,1989年12月19日出版的号为4,888,286的美国专利。DeGraaf,M.E.等,《基因》12813(1993)。DiBisceglie,A.M.等,《肝脏学》16649(1992)。DiBisceglie,A.M.等,NEJM3211506(1989)。Dicesare,J.等,《生物技术》15152-157(1993)。Dienstag,J.L.等,《肝脏疾病的扫描电子显微镜研究》667(1986)。Earl.P.L.等,当代分子生物学备忘录“使用疫苗的哺乳动物细胞中的蛋白质表达”(F.M.Ausubel等编),Greene出版协会和Wiley交叉科学,纽约(1991)。Eaton,M.A.W.等,1988年1月12日出版的号为4,719,180的美国专利。Egholm等,《自然》356566(1993)。Elroy-Stein,O.等,《美国国家科学院院刊》866126-6130(1989)。88年11月18日申请的申请号为88310922.5的欧洲专利申请。Falkner,F.G.等,《病毒学杂志》621849-1854(1988)。Farci,P.等,NEJM33088(1994)。Felgner和Rhodes,《自然》349257(1991)。Fickett,J.W.《核酸研究》105303-5318(1982)。Fling,S.P.等,《分析生物化学》15583-88(1986)。Folgori,A.等,《EMBO杂志》132236(1994)。Francki,R.I.B.等,《古病毒学》增刊12223(1991)。Frank,R.和Doring,R.《四面体》44603-6040(1988)。Frohman,M.A.等,《美国国家科学院院刊》858998-9002(1988)。Fuerst,T.R.等,《美国国家科学院院刊》838122-8126(1986)。Gellissen,G.等,AntonieVanLeeuwenhoek,62(12)79-93(1992)。Geysen,M.等,《美国国家科学院院刊》813998-4002(1984)。Gingeras,T.R.等,《临床生物学年鉴》48498(1990)。Gingeras,T.R.等《感染性疾病杂志》1641066(1991)。Goeddel,D.V.《酶学方法》185(1990)。Grakoui,A.等,《病毒学杂志)》672832(1993)。Grakoui.A.等,《病毒学杂志》671385-1395(1993)。Guatelli,J.C.等,《美国国家科学院院刊》871874(1990)。Gubler,U.等,《基因》,25263(1983)。Guthrie,C.和G.R.Fink,《酶学方法》194(1991)。Gutterman,J.U.PNAS911198(1994)。Harlow,E.等,抗体实验室手册,冷泉港实验室出版(1988)。Haynes,J.等,《核酸研究》11687-706(1983)。Hieter,P.A.等,《细胞》22197-207(1980)。Hijikata,M.等,PNAS885547(1991)。Hochuli,Z,在基因工程原理和实验操作第12卷中(J.stelow编)Plenum,NY,第87-98页(1990)。Holodniy,M.等,《生物技术》1236(1992)。Hopp,T.P.等,《美国国家科学院院刊》783824-3828(1981)。Horn,T.和Urdea,M.S.《核酸研究》176959(1989)。Hougtten,R.A.,《美国国家科学院院刊》825131(1985)。Hudson,D.《有机化学杂志》53617(1988)。Irwin,M.J.等,《病毒学杂志》585036(1994)。Jacob,J.R.等,在HCV的分子生物学中的第4部分,第387-392页中(1991)。Jacob,J.R.等,《肝脏学》10921-927(1989)。Jacob,J.R.等,《感染性疾病杂志》1611121-1127(1990)。Janknecht,R.等,《美国国家科学院院刊》888972-8976(1991)。Kaufman,R.J.在《酶学方法》第185卷,第537-566页中的“哺乳动物细胞中的异种基因的选择和扩增”,学院出版股份有限公司,圣地亚哥CA(1991)。Kakumu,S.等,《胃肠学》105507(1993)。Katz,E.D.和Dong,M.《生物技术》8546(1990)。Kawasaki,E.S.等,在PCR技术DNA扩增的原理和应用(H.A.Zrlich编)Stockton出版。King,L.A.等,《杆状病毒表达系统》,实验室指南,Chapman和Hall,伦敦,纽约,东京,墨尔本,马德拉斯,1992。Kyte,J.和Doolittle,R.F.《分子生物学杂志》157105-132(1982)。Koonin,E.V.和Dolja,V.V.《生物化学和分子生物学关键性综述》28375-430(1993)。Krausslich,H.G.等,作为化学疗法目标的病毒蛋白酶(冷泉港出版,PLainville,纽约)(1989)。Kumar,R.等,《艾滋病研究人反转录病毒》5(3)345-354(1989)。Landford,R.E.等.体外细胞发育生物学25174-182(1989)。Larder,B.A.和Kemp,S.D.《科学》2461155(1989)。Lau,Y.F.等,《分子细胞生物学》41469-1475(1984)。Lomell,H.等,《临床化学》48492(1990)。Maniatis,T.等,分子克隆实验手册,冷泉港实验室(1982)。Marshall,W.S.和Caruthers,M.H.《科学》2591564(1993)。Messing,J.,《酶学方法》10120(1983)。Michelle等,病毒性肝炎国际会议。Miller,J.H.分子遗传学实验,冷泉港实验室,冷泉港,纽约(1972)。Morrissey,D.V.等,《分析生物化学》181345(1989)。Moss,B.等,分子生物学通讯(第四部分,第16单元)(1991)。Moss,B.等,1992年8月4日出版的号为5,135,855的美国专利。Mullis,K.B.,1987年7月28出版的号为4,683,202的美国专利。Mullis,K.B.等,1987年7月28日出版的号为4,683,195的美国专利。Obeid,O.E.等,《病毒研究》3269-84(1994)。Osikowicz,G.等,《临床化学》361586(1990)。Patterson,J.L.和Fernandez-Larsson,R.《感染性疾病综述》121139(1990)。Pearson,W.R.和Lipman,D.J.PNAS852444-2448(1988)。Pearson,W.R.《酶学方法》18363-98(1990)。Pitha,《生物化学生物物理Acta》,20439(1970a)。Pitha,《生物多聚体》,9965(1970b)。Porath,J.,《蛋白质实验和纯化》3263(1992)。Pritchard,C.G.和Stefano,J.E.,《生物化学年鉴》48492(1990)。Reichard,O.等,《柳叶》3371058(1991)。Reilly,P.R.等,杆状病毒表达载体,实验室手册(1992)。Reyes,G.等,《科学》,2471335(1990)。Reyes,G.等,《分子和细胞探针》5473-481(1991)。Rice,C.M.等,《新生物》1285-296(1989)。Roberts,N.A.等,《科学》248358(1990)。Romanos,M.A.等,《酵母》8167423-488(1992)。Sanger等,《美国国家科学院院刊》745463(1977)。Sambrook,J.等,在分子克隆实验室手册中,冷泉港实验室出版,第2卷(1989)。Saiki,R.K.等,《科学》239487-491(1988)。Schagger,H.等,《生物化学年鉴》166368-379(1987)。Scharf,S.J.等,《科学》2331076(1986)。Schuler,G.D.等,《蛋白质结构,功能和基因》9180(1989)。Scott,J.K.等,《美国国家科学院院刊》895398(1972)。Smith,D.B.等,《基因》6731(1988)。Smith,J.P.《目前鉴定用的生物技术》2668(1991)。Sreenivasan,M.A.等,《普通病毒学杂志》651005(1984)。Sumiyoshi,H.等,《病毒学杂志》665425-5431(1992)。Summerton,J.等,92年8月25日出版的号为5,142,047的美国专利。Summerton,J.等,93年2月9日出版的号为5,185,444的美国专利。Tam,A.等,《病毒学》185120(1991)。Tam,J.P.,《美国国家科学院院刊》855409(1988)。Tessier,D.C.《基因》98177-183(1991)。Tonkinson,J.L.和Stein,C.A.《抗病毒化学和化学疗法》4(4)193-200(1993)。Ulmet等,《科学》2591745(1993)。Urdea,M.《临床化学》39725(1993)。Urdea,M.等,《艾滋病》7S11(1993)。Wages,J.M.等,《扩增》101-6(1993)。Walker,G.T.《PCR方法的应用》31-6(1993)。Wang,A.M等,在PCR记录,方法和应用指南中(M.A.Innis等编)学院出版社(1990)。Wang,B.等,《美国国家科学院院刊》904156(1993)。Whetsell,A.J.等,《临床显微学杂志》30845(1992)。Wolf,J.A.等,《自然》2471465(1990)。Vacca,J.P.等,PNAS914096(1994)。VanGemen,B.等,《病毒学方法杂志》43177(1993)。Valenzuela,P.等,《自然》298344(1982)。Valenzuela,P.等,在《乙型肝炎》中,I.Millman等编,Plenum出版,第225-236页(1984)。Yarbrough等,《病毒学杂志》655790(1991)。Yoo,B.J.等,《病毒学杂志》6932-38(1995)。Yoshio.T.等,1989年7月18日出版的号为4,849,350的美国专利。Zhang,Y.等,《病毒学杂志》656101-6110(1991)。发明背景由一种不是甲型和乙型肝炎病毒引进的病毒性肝炎被称为非甲非乙型肝炎(HANAH)。根据某一个体类型的传播方式,例如,肠道的和非肠胃的,可将NANBH进一步分类。第一种形式的NANBH,称为肠道传播的NANBH或ET-NANBH,主要是在环境卫生条件较差的地区发病,那里的食物和饮水被粪便物污染了。最近,阐述了称为戊型肝炎病毒(HEV)的致病原体的分子克隆(Reyes等,1990;Tam等)。第二种形式的NANBH,称为非肠胃传播的NANBH或PT-NANBH,通过非肠胃途径传播,典型的是接触血液或血液制品。这种肝炎的发病率随下列三方面变化(1)场所,(2)对血库是否做了丙氨酸转氨酶(ALT)检查,(3)消除高危病人患获得性免疫缺损综合症(AIDS)。大约有10%的输血引起PT-NANBH感染,并且其中的一半人转为慢性状态(Dienstag)。在完成抗HCV检查后,心脏手术病人(Alter)每单位输入血液的HCV血清转化率降到不足1%。被证明已在人类受血者中产生输血后NANBH的人血浆样品,已成功地用于在黑猩猩(Bradely)中产生PT-NANBH感染。从感染黑猩猩血浆中分离的RNA,已用于在一个表达载体上构建cDNA文库,以免疫筛选慢性PT-NANBH感染人类个体的血清。此方法确定了一个PT-NANBH特异性的cDNA克隆,然后此病毒序列被用作探针去鉴定一组由PT-NANBH病毒体的7,300个连续碱基对组成的重叠片段。该已测序的病毒体被命名为丙型肝炎病毒(HCV)(例如,1988年11月18日申请的EPO专利申请88310922.5中所列的HCV序列)。现已能得到HCV的完整序列(约为9,500核苷酸)。疾病控制中心(CDC;Phoenix,AZ,1973-1975;1978-17983)对灵长类动物的传染研究,最先提供了大量证据,证明多种非甲非乙型肝炎(NANBH)病原体的存在与大多数NANBH病例有关的主要病原体现在已确认为HCV和HEV(参见上面),分别对应于PT-NANBH和ET-NANBH。疾病控制中心(CDC;Atlanta,GA,1989-现今)利用模型研究和商业检测对抗HGV抗体进行的最近流行病学研究表明所有后天获得的NANBH群体中约有20%也是非丙型肝炎。对这些样品是否有HEV的进一步检查(Reyes,等,WOA9115603(GenelabsIns.)1990年10月17日)已经表明,这些后天获得非甲非乙非丙型肝炎病例也是非戊型的。Sentinel县的病人肝脏活体组织样品、血清和血浆(Drs.MiriamAlter和KrisKrawczynski的研究),也表明许多真正的NANBH病例也是非丙型肝炎(所有HCV感染标记的血清学上和逆转录酶-聚合酶链式反应(RT-RCR;Kawasaki,等;Wang,等,1990)呈阴性),后来,这些肝炎病例发展为慢性肝炎,并表现为与病毒感染相同的迁延性肝炎(CPH)和慢性活动性肝炎(CAH)两种状态。发明概述本发明是关于一种新发现的非甲非乙非丙非丁非戊型(N-(ABCDE))肝炎相关的病毒病原体的鉴定分离,这里称之为庚型肝炎病毒(HGV)。本文揭示了部分HGV基因组的一族cDNA复制物。同时也公开了HGV序列和HGV变异体序列的分离和鉴定方法。本发明包括HGV基因组多核苷酸、cDNA及其互补链。谈到多核苷酸,发明包括下面几方面纯化的庚型肝炎病毒基因组多核苷酸;由HGV衍生的RNA和DNA多核苷酸;重组HGV多核苷酸;由从HGV或HGV变异体cDNA或它们的互补序列来源的序列组成的重组多核苷酸;编码HGV表位的重组多核苷酸;包括上述任一重组多核苷酸的一个重组载体,以及这些载体之一转化的宿主细胞。本发明的另一个方面是HGV和/或其变异体的多核苷酸探针。当前利用序列信息把HGV与其它病毒序列比较,对HGV基因组特性进行研究,表明HGV是病毒种黄热病毒科(flavivirididae)的成员。部分HGV衍生的cDNA序列的部分序列能被作为探针用于分离自然发生的病毒变异体,或确定样品中是否有病毒。这些cDNA序列也产生有用的HGV编码的多肽序列,包括HGV特异的多肽抗原。这些编码序列允许在诊断试验中作为试剂和/或作为疫苗成分,或作为标准物的多肽的产生。另外,利用这些cDNA序列来源的探针,可以对该HGV基因组其它部分进行分离和测序,因此得到有用于预防、治疗和诊断应用中的另外的探针和多肽。本发明的其它几方面包括掺入从HGV的cDNA或其互补链来源的一个开放阅读框(ORF)的一个重组表达系统,其中ORF与所需宿主相容的一段控制序列可操作地连接;用重组表达系统转化的细胞;以及由该转化细胞产生的多肽。本发明的再一方面是纯化的HGV颗粒;来自纯化的HGV的多肽制剂;纯化的HGV多肽;纯化的HGV肽;以及由一个表位组成的纯化多肽,该表位在免疫学上可识别HGV或HGV变异体带有的一个表位。本发明包括的方面是HGV多肽;由来自HGV基因组、HGV的cDNA或其互补链的序列构成的重组多肽;有一个HGV表位组成的重组多肽;以及由一个HGV多肽组成的融合多肽。抗多肽序列中含有的HGV表位的单克隆和多克隆抗体,也用作治疗剂用于诊断试验,将cDNA来源的HGV病原体的分离,并且用于抗病毒试剂的筛选。本发明还包括抗一个HGV表位的多克隆抗体的制剂和抗多个HGV表位的单克隆抗体。本发明涉及试剂盒的几方面是在适宜容器中,调查样品中是否有HGV来源的多核苷酸,该多核苷酸包含一个多核苷酸探针,该探针包括大约8个或更多个核苷酸的HGV的一段核苷酸序列;分析样品中是否有抗HGV抗原的抗体,该HGV抗原由一段多肽组成,该多肽含有HGV抗原中存在的一个HGV表位;在适宜容器中分析样品中是否有HGV抗原,该HGV抗原由一个抗HGV的抗体组成。本发明的其它方面还包括吸附于一固体底物上的由一个HGV表位组成的一段多肽;吸附于一固体底物上的抗一个HGV表位的一种抗体。本发明的其它方面是产生一个HGV多肽的方法,包括在允许上面提及的多肽表达的条件下由一个表达载体转化的宿主细胞的培育,该表达载体含有编码一种HGV多肽的一段序列的;以及已由该方法产生的多肽(例如,含有一个HGV表位)。本发明还包括检测样品中HGV核酸的方法,包括使样品中的核酸与HGV多核苷酸探针在允许探针和样品的HGV核酸两者间形成多核苷酸双链体的条件下反应;以及检测含有该探针的多核苷酸双链体。本发明包括以下面杂交为基础的检测方法报告分子标记;聚合酶链式反应;自我维持序列扩增;连接酶链式反应和链置换扩增。另外,检测方法包括信号放大(例如,支链DNA探针和Q-β复制酶方法)。本发明还包括免疫检验法,有检测HGV的免疫检验法,包括在允许形成抗原-抗体复合物的条件下,将一个样品(怀疑其为HGV所感染)与抗HGV抗原/表位的探针抗体一起培育;以及检测含有该探针抗体的抗原-抗体复合物。检测抗HGV抗原的抗体的免疫检验法,包括将怀疑含有HGV的样品和含HGV表位的探针多肽在允许形成抗原-抗体复合物的条件下进行培育;并识别含探针抗原的抗体-抗原复合物。本发明的另一方面是HGV疫苗,用于治疗和/或防制HGV感染,包括含有一个HGV表位的一个免疫原性多肽,或一个灭活的HGV制剂,或一个减毒的HGV制剂。在另一个方面,本发明包括一个由HGV感染的组织培养细胞。在一个实施方案中,该组织培养细胞是灵长类动物肝脏细胞。本发明的另一方面是产生HGV抗体的方法,包括将一个含有HGV表位的免疫原性多肽以适当的量投药给一个试验个体,促使产生免疫反应。本发明还包括一个HGV嵌合多肽,该嵌合多肽含有至少两个HGV表位,并且该多肽基本上缺乏在天然HGV编码序列的表位间正常插入的氨基酸。这种嵌合多肽有用于上面讨论中的应用和方法。本发明进一步包括表位递呈过程中模拟天然HGV抗原表位的一个随机肽表位(模拟表位)。这种模拟表位有用于上面讨论中的应用和方法。本发明还包括鉴定随机肽HGV表位的方法。在该方法中,产生或选择一个随机肽表位的文库。该文库与一个抗HGV抗体有关。模拟表位被鉴定为与抗体发生特异性免疫反应。可以使用由本发明的方法所产生的含抗HGV抗体的血清(含抗HGV抗体)或抗体。例如,随机肽文库能在噬菌体上表现或产生组合文库。在另一方面,本发明包括治疗用化合物以及预防和治疗HGV感染的方法。结合附图阅读下面对本发明的详尽描述,可更完整地理解本发明的这些和其它的目的和特征。附图简述图1SEQIDNO14的开放阅读框和470-20-1克隆的关系。图2显示谷胱甘肽亲和柱洗脱的梯度级分的典型的蛋白质简图。图3显示图2级分样品的十二烷基硫酸钠聚丙烯酰胺凝胶电泳分析。图4显示阴离子交换柱洗脱的梯度级分的典型的蛋白质简图。图4B和4C显示对图4A级分样品的十二烷基硫酸钠聚丙烯酰胺凝胶电泳分析。图5A和5BHGV和黄热病毒科其它两个成员------猪霍乱病毒和丙型肝炎病毒的氨基酸顺序的比较。图6显示pGEX-Hisb-GE3-2载体的一部分,带有HGV表位的细菌表达质粒的图谱。图7A-7D显示纯化HGV的GE3-2蛋白的Western印迹分析结果。图8A-8D显示纯化HGV的Y5-10抗原的Western印迹分析结果。图9A-9D显示Y5-5、GE3-2和Y5-10抗原的Western印迹分析结果。图10A-10F显示GE-NS2b和GE-NS5a抗原的Western印迹分析结果。图11显示HGV编码序列的Kyte-Doolittle疏水性图解。图12显示HGVpET克隆用抗-T7.Tag单克隆抗体进行的Western印迹分析结果。图13A-13D显示HGVpET克隆GE-NS5b的Western印迹分析结果。图13E显示相关的考马斯染色凝胶。图14A-14C显示HGVpET克隆GE-E2的Western印迹分析结果。图14D显示相关的考马斯染色凝胶。图15A-15C显示HGVpET克隆GE-NS5b的Western印迹分析结果。图15D表明了相关的考马斯染色凝胶。图16显示HGV编码区的图解。发明详述I.定义下面定义的术语在本文有如下意义1.“非甲非乙非丙非丁非戊型肝炎病毒病原体{N-(ABCDE)}”本文暂时称为HGV,意思是一种病毒、病毒型或病毒种类,(i)在某些灵长类动物是可传染的,包括口鬃(Mystax)、黑猩猩和人类,(ii)在血清学上明显区别于甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV)(虽然HGV可能与上述病毒协同感染个体);(iii)属于黄热病毒科的成员。2.“HGV变异体”被定义为病毒分离株,它们具有至少有约40%、优选55%或65%,较优选80%的完整序列同源性,也就是,整个长度的病毒基因组多核苷酸序列,与较公开的HGV多核苷酸序列(如SEQIDNO14)相同。“序列同源性”本质上如下确定。相似长度(优选地,整个病毒基因组)的两个多核苷酸可认为是相互同源的,如果当利用ALIGN程序作序列比较,在最高记录的比较中40%以上,优选为55%或65%,较优选80%的核酸,被使用ktup为1、默认参数和默认PAM阵列比较为相同。该ALIGN程序可在FASTA1.7版本的一组序列比较程序中找到(Pearson,等,1988;Pearson,1990;程序来源于WilliamR.Pearson,DepartmentofBiologicalChemistry,Box440,JordanHall,Charlottesville,VA)。在确定两个病毒是否是互相“高度地同源的”,使用ktup为1,默认参数和默认PAM阵列的上述一套ALIGM程序,将一种病毒的所有病毒蛋白(或多蛋白)的完整序列与其它病毒的病毒蛋白或多蛋白进行最佳地、全部地序列比较。分析中没有排除不相似或相似区域。两个序列长度上的差异被认为是错配的。另外,通常将病毒结构蛋白质区域用于确定病毒分离株间的相关性。高度同源的病毒具有40%以上、优选好地55%或65%、或较优选80%的全部多肽序列相同。3.如果两个核酸片段能同HGV或其变异体(如和HGV核酸但不是黄热病毒科其它病毒的多核苷酸杂交的探针)特异性杂交,或者特异性引导聚合酶链式反应,则两个核酸片段被认为是“选择地可杂交的”,(i)在典型的杂交和漂洗条件下,例如Maniatis等(第320-328,382-389页)所描述的;(ii)利用降低要求的严格漂洗条件,使得最高有约25-30%的碱基错配,例如2×SSC,0.1%SDS,室温下重复两次,每次30分钟;然后,2×SSC,0.1%SDS,37℃,一次,30分钟;最后,2×SSC,室温下重复两次,每次10分钟,或(iii)在标准条件下(如Saiki,R.K.,等)选择用于典型聚合酶链式反应(PCR)的引物,使得HGV或其变异体序列的特异性扩增。如本领域所熟知的,优选地,高度同源的核酸链含少于20-30%的碱基错配,甚至较优选碱基错配少于5-20%。利用适当严格洗涤条件,可选择上述程度同源性来鉴定基因文库(或其它来源的遗传物质)的克隆。4.本文所用的“HGV多核苷酸”定义如下。对大于100个核苷酸的多核苷酸,HGV多核苷酸包括上述“2”条所定义的由HGV变异体及同源序列所编码的多核苷酸序列。对长度小于100个核苷酸的多核苷酸,HGV多核苷酸包括那些与HGV或其变异体序列可选择杂交的序列。另外,HGV多核苷酸包括编码HGV多肽的多核苷酸(见下文)。本文所用的术语“多核苷酸”是指有骨架的聚合分子,骨架支持碱基能以氢键与典型核酸连接,其中聚合物骨架以某种方式提供碱基以允许这种氢键以序列特异方式存在于聚合分子和一段典型核酸之间(例如,单链DNA)。这类碱基典型地为次黄嘌呤核苷、腺嘌呤核苷、鸟嘌呤核苷、胞嘧啶、尿嘧啶、胸腺嘧啶。在本领域中已知许多多核苷酸修饰方法,例如标记、甲基化、以某种类似物替换天然存在的一种或多种核苷酸。聚合分子包括双链或单链RNA和DNA,以及其骨架修饰物,例如,甲基膦酸脂连锁物。另外,这类聚合分子包括可替换的聚合物骨架,例如,但不仅限于,聚乙烯骨架(Pitha,1970a/b)、吗啉骨架(Summerton等,1992,1993)。已报道了各种其它带电或不带电的多核苷酸类似物。本领域已知许多骨架修饰方法,例如,但不仅限于,不带电连锁(如甲基膦酸酯,磷酸三酯、磷酸酰胺化物和氨基甲酸酯)和带电连锁(硫代磷酸酯、二硫代磷酸酯)。此外,连锁可能包括下列一般修饰侧基部分,例如蛋白质(如包括核酸酶、毒素、抗体、信号肽和聚-L-赖氨酸);嵌合剂(如吖啶和补骨脂素)、螯合物(如金属、放射性金属,硼和氧化金属)、烷化剂和其它修饰类似物(如α-端基异构核酸)。5.“HGV多肽”在本文被定义为任何同HGV多肽同源的多肽。本文所用“同源性”定义如下在一实施方案中,如果多肽是由同HGV或其变异体序列选择杂交的核酸所编码的,则称该多肽和HGV多肽同源。在另一个实施方案中,如上述所定义的如果某一多肽是由HGV或其变异体所编码的,则称该多肽和HGV同源,该组的多肽一般是大于15、优选为25、较优选为35个连续氨基酸。另外,对大于60个氨基酸的多肽,运用局部序列比较程序LALIGN进行确定“多肽同源性”的序列比较。如上所述,利用LALIGN程序将多肽序列与HGV或其任何变异体的氨基酸序列进行比较,所用Ktup为1、默认参数和默认PAM。任一多肽(典型的是和HGV抗体不发生特异免疫反应的多肽),最佳序列长度是大于60个氨基酸,完全相同的排列的氨基酸大于65%,或优选为70%,或较优选为80%,被认为是一个“同源多肽”。该ALIGN程序可在FASTA1.7版本的一组序列比较程序中找到(Pearson,等,1988;Pearson,1990;程序来源于WilliamR.Pearson,DepartmentofBiologicalChemistry,Box440,JordanHall,Charlottesville,VA)。6.如果一个多肽和HGV基因组、HGV的cDNA或其互补链有相同或大体相同的碱基对序列,或者表现上面“2”、“3”或“4”中所解释的那种同源性,则称该多肽“来源于”HGV。如果一个多肽或多肽“片段”满足下列条件之一,也被称为“来源于”HGV(i)由HGV多核苷酸的开放阅读框编码;或(ii)表现上面“2”或“5”所解释的同HGV多肽的同源性;或(iii)同HGV阳性血清有特异免疫反应的。7.在多处上下文中,使用了“基本上分离的”和“纯化的”,主要是指HGV病毒颗粒、组分(如多核苷酸或多肽)、或从不相关或未污染成分(如血清细胞、蛋白质、非HGV多核苷酸和非抗HGV抗体)中分离的相关化合物(如抗HGV抗体)等的部分纯化。下面描述了分离或纯化感兴趣化合物或成分的方法和步骤(例如融合蛋白质和HGV多肽重组产物的亲和纯化法)。8.本发明的上下文中,“核酸序列”当指编码蛋白、多肽或肽的序列时,包括编码同源的蛋白、多肽或肽序列以及本发明公开的序列的变性核酸序列。9.“表位”是抗原决定簇,被定义为和抗体特定部位相互作用的抗原的特定部位。10.抗原或表位和HGV阳性血清反应是“特异性免疫反应的”,此时,表位/抗原和HGV感染血清的抗体结合,但并不与没有或从来没有感染HGV的个体血清的绝大部分(一般高于90%,较高的为95%)抗体结合。“特异性免疫反应”的抗原或表位也能同抗特异HGV表位或抗原的单克隆或多克隆抗体发生免疫反应。当抗体或抗体组合物(如多克隆抗体)和HGV抗原,而不是HAV、HBV、HCV、HDV或HEV抗原发生免疫反应时,称抗体或抗体组合物和HGV的反应是“特异性免疫反应的”。另外,“特异性免疫反应的抗体”并不同未感染或未接触HGV、HAV、HBV、HCV、HDV或HEV的个体正常血清中出现的主要抗原发生免疫反应。II.N-(ABCDE)血清抗HGV血清学检验的有效性和HCV-RNA的RT-PCR分析的研究(Kawasaki,等;Wang,等;1990)允许鉴定多种情况的输血后和群体获得性非HCV型肝炎。由疾病控制和防止中心负责通过Sentinel县获得性肝炎群体的研究,将人的肝炎病例,PNF2161最先鉴定为NANB肝炎(NANBH)(Alter,等,1989b)。PNF2161是从一个高龄高加索男性患者采集的样品,该患者输血后约8周发展为急性肝炎,高峰血清ALT水平达到1141IU(正常人≤45IU)。后来分辨出该急性肝炎的阵发性,在接下去的七年里,该病人的ALT水平呈现波动、且持续升高、符合慢性肝炎的情况,但是没有获得这种诊断的组织病理学证实。用于克隆HGV(此处所描述的)的血浆样品是在1989年6月采集的,大约是在该阵发急性肝炎的4_年后,并冷冻保存。根据第一代免疫试验检验(OrthoHGVELISATestSystem;OrthoDiagnostics,Raritan,NJ)一致的阴性结果,首先认为病人的PNF2161不是由HCV感染的。然而,利用第二代免疫试验(Ortho)和以HCV5’端非编码区的引物PCR的后来的试验证明该病人被HCV感染。III.HGV相关序列的分离作为一种鉴定含有HGV序列的方法,在λgt11表达载体上,从感染HGV的血清制备cDNA文库(实施例1)。然后选择多核苷酸序列用于与PNF2161血清发生免疫反应多肽的表达。第一轮筛选主要利用PNF2161血清(用于产生噬菌体文库)进行。还可以用其它可疑的N-(ABCDE)血清筛选。由这种方法鉴定的重组蛋白为诊断试验提供了作为底物的候选肽。另外,由该方法鉴定的核酸编码序列作为有用的杂交探针,用于鉴定其它的HGV编码序列。在λ-gt11上用上面描述的血清产生cDNA文库(实施例1)。在实施例1中图示的方法,将感染血清在没有稀释的8%PEG中沉淀,从所得的沉淀病毒产生文库。用同样的方法处理感染人群的血清。超速离心法作为PEG沉淀法的有利替换方法,可用于从感染血清或其它生物制剂的样品中分离颗粒病原体。为从可被抽提出来的核酸中分离病毒颗粒,将2ml左右的血清,用PBS稀释到约10ml,3K离心10分钟,上清液在Ti70.1转子(BeckmanInstruments,Fullerton,CA)中4℃以40,000rpm(大约110,000×g)超速离心2小时以上。吸出上清液,用标准核酸抽提技术抽提沉淀。在以从沉淀血清抽提出的RNA为起始物质的逆转录反应中,利用随机引物产生cDNA文库。将所得的分子连接到不依赖序列的单引物扩增反应(SISPA;Reyes,等,1991)连接引物上,而后以非选择方法扩大,再克隆到合适的载体上,如λ-gt11,表达并筛选肽抗原。作为选择方法,也可用λ-gt10载体。λ-gt11载体是尤其有效的表达载体,含有位于β-半乳糖苷酶基因翻译终止子上游53个碱基对的单一的EcoRI插入位点。因此,插入序列表达为β-半乳糖苷酶融合蛋白,融合蛋白含有β-半乳糖苷酶基因产物的N-端部分,杂合肽或者β-半乳糖苷酶肽的C-端区域(当杂合肽编码序列不含有翻译终止密码子时,C-端表达。)。该载体产生的温度敏感性阻遏物(cI857),在允许温度(如32℃)下,此物导致病毒溶源现象的发生,并在提高温度(如42℃)时,导致病毒裂解。载体的优点包括以下几点(1)高效率的重组克隆世代;(2)在允许,但不在非允许的温度下,根据宿主细胞的生长,能选择溶源的宿主细胞;和(3)能产生重组融合蛋白。此外,因为含有杂合插入序列的噬菌体产生失活的β-半乳糖苷酶,所以,利用β-半乳糖苷酶的比色底物转化反应,来鉴定带插入序列的噬菌体。实施例1描述了N-(ABCDE)肝炎血清PNF2161的cDNA文库的制备。利用PNF2161对文库进行免疫筛选(实施例3)。鉴定了大量具有免疫反应活性的λ-gt11克隆。免疫阳性的克隆用噬菌斑纯化,并重新检验它们的免疫反应活性。此外,还检验了这些克隆与正常人血清的免疫反应活性。这些克隆还用于检测克隆插入序列的“外源性”。这种基本试验确认所克隆的片段并不代表人或其它潜在污染核酸的一部分(如大肠杆菌、酿酒酵母和线粒体)。这类克隆插入序列的分离是通过EcoRI消化后的聚合酶链式反应扩增实现。插入序列纯化后,用放射性标记,作为针对膜上结合的正常人DNA、正常口鬃DNA和细胞DNA(对照DNA)的杂交探针(实施例4A)。克隆470-20-1(PNF2161cDNA的来源)是用PNF2161的血清免疫筛选分离出的克隆之一。该克隆不与正常人血清反应。具有较大的开放阅读框(203bp;SEQIDNO3),与λ-gt11载体的β-半乳糖苷酶基因同在框内。利用人、酵母和大肠杆菌基因组DNA,通过基因组DNA杂交分析和基因组PCR分析,表明该克隆是外源的(实施例4B)。RT-PCR确定了存在于PNF2161血清中的序列(实施例4C)。序列稀释PNT2161RNA的RT-PCR表明每ml溶液中至少有105的470-20-1特异序列的拷贝。在蔗糖密度梯度分级分离中,也可检测到该序列与类病毒颗粒的相关序列有相同的密度(实施例5)。大肠杆菌表达的第二种克隆,克隆470-expl(SEQIDNO37)的细菌裂解物,也显示出以可与克隆470-20-1相比的水平与PNF2161血清发生特异性免疫反应。470-expl的编码序列在终止密码子的两侧(根据和SEQIDNO14的序列比较,见图1),并且内含甲硫氨酸。利用克隆470-20-1的引物的锚式聚合酶链式反应(AnchorPCR),获得在SEQIDNO14中与克隆470-20-1近邻的其它序列。这种情况下,PNF21612-cDNA源文库被用作模板,其中cDNA/互补双链DNA产物被连接至λ臂,但该混合物是不包装的。470-20-1特异引物用于以SISPA扩增的PNF2161cDNA作为模板的扩增反应(实施例4)。扩增的DNA片段的鉴定根据(i)大小和(ii)同一个470-20-1特异寡核苷酸探针(SEQIDNO16)杂交。从SISPA扩增的PNF2161检测了到由PCR扩增的cDNA中的470-20-1特异信号,证明源材料中存在470-20-1序列。该470-20-1特异引物还用于以下列RNA源为底物的扩增反应正常口鬃肝脏RNA、正常狨猴(SanguinsLaboriatis)肝脏RNA和MY131肝脏RNA(实施例4)。这些试验的结果证明470-20-1序列存在亲本血清样品(PNF2161)和从受PNF2161样品(MY131)攻击的动物中取得的RNA肝脏组织样品中。对是否有470-20-1序列,两个正常对照RNA是阴性的。另外,通过利用引物从选择的克隆序列的PCR直接检测了PNF2161血清和其它克隆源或相关的源材料。特定扩增产物的检测通过其与特定寡核苷酸探针470-20-1-152F(SEQIDNO16)杂交来检测。通过470-20-1特异引物来重现检测在多个PNF2161抽提物中的特异信号。示于实施例4F的数据进一步支持了HGV和肝脏疾病间的疾病相关性。肝炎患者和肝功能不正常的血液提供者的血清被使用HGV特异引物,通过RT-PCR筛选法评估其HGV的存在。在152份这类血清样品中,检测到6份存在HGV特异序列。对照组样品(n=11)没有检测到HGV阳性。上述结果表明,与肝脏N-(ABCDE)病毒感染(即为肝炎)相关的、和/或感染、以及发病的病毒病原体的分离,或其它组织和细胞类型的分离。IV.HGV重组抗原的进一步鉴定A.筛选重组文库利用上述描述的筛选方法,可从本发明的文库中获得另外的候选HGV抗原。上述提及的cDNA文库已保藏在美国典型培养物保藏中心(12301ParklawnDr.,Rockville,MD,20852),并且已经分配给下列保藏登记号PNF2161cDNA信息源,ATCC75268。第二种PNF2161cDNA文库本质上如上述第一种PNF2161cDNA文库产生,除开第二种PNF2161cDNA源文库与λ-gt11臂相连,但是没有被包装。这种未包装的文库用于获得下述的延伸克隆。此第二种文库(PNF21612-cDNA源文库)的包装类型已保藏在美国典型培养物保藏中心(12301ParklawnDr.,Rockville,MD,20852),并且已经分配给下列保藏登记号PNF21612-cDNA信息源,ATCC75837。除了上述产生的重组文库外,N-(ABCDE)肝炎血清中的其它重组文库也能如本文所述的类似地产生和筛选出来。B.表位作图、基因组序列的交叉杂交和分离抗原编码DNA片段的可根据下面鉴定(i)如上所述的免疫筛选法,或(ii)利用一种算法(如“ANTIGEN”,Intelligenetics,MountainView,CA)对编码序列(如SEQIDNO14)进行计算机分析,来确定潜在的抗原区域。抗原编码DNA片段可以被亚克隆。亚克隆的插入片段被DNA酶I部分消化产生随机片段,或被特异性限制内切酶消化产生特异性亚片段。所得的DNA片段可插入λ-gt11载体中,并进行免疫筛选,以提供克隆的插入片段的表位图谱。此外,在鉴定重叠HGV序列的杂交试验中可用DNA片段作探针,反过来,这些序列作为探针进一步用于鉴定一系列的连续克隆。这多套连续克隆的产生允许HGV基因组序列的阐明。上述描述的任何一种克隆序列(如从SEQIDNO14或克隆470-20-1中获得的)都能用作cDNA和DNA文库的探针,如在λ-gt11或“λ-ZAPII”(Strategent,SanDiego,CA)的载体上产生的文库。已知序列的特异亚片段可由聚合酶链式反应分离,或者用限制性内切酶酶切带有这些序列的载体。所得的DNA片段均能用作针对任何选择文库的放射性标记探针。特别地,克隆插入序列中的5’和3’端序列常用于鉴定其它克隆的探针。另外,克隆插入序列的5’末端常作为序列特异引物用在首链cDNA或DNA链的合成反应中(Maniatis等,Scharf等)。例如,以PNF2161核酸为模板,利用从SEQIDNO14获得的特异引物,可制备特定可作引物的PNF2161cDNA和DNA文库。利用RNA酶H和DNA聚合酶I合成新的cDNA第二链。上述过程鉴定或产生与一5’紧邻已知克隆序列的核酸区域对应的DNA/cDNA分子。这些新分离的序列反过来用于进一步鉴定侧翼序列等等,以及鉴定组成HGV完整基因组的序列。如上所述,分离新的HGV序列后,克隆和免疫筛选多核苷酸,鉴定编码HGV抗原的特异序列。利用实施例6中所述的“锚PCR”方法克隆PNF470-20-1(SEQIDNO3),获得含有感兴趣的其它序列的延伸克隆序列(SEQIDNO14)。简单地说,该策略是将PNF2161SISPAcDNA和λ-gt11臂连接,然后以一种gt11特异引物和两种470-20-1之一的特异引物进行扩增连接反应。将扩增产物进行电泳分离,转移到滤纸上,用470-20-1特异探针去探测结合到滤纸上的DNA。对信号杂交阳性带的相对应的带,用凝胶纯化、克隆并测序。C.抗原多肽和抗体的制备以标准的蛋白纯化方法来纯化本发明的重组肽,这些方法包括差示沉淀、分子筛层析、离子交换层析、等电聚焦、凝胶电泳和亲和层析。在本发明的一种实施方案中,本发明的抗原的多核苷酸序列已在质粒pGEX(实施例7A)或其各种衍生物(pGEX-GLI)上克隆。质粒pGEX(Smith等,1988)和其衍生物表达了克隆插入序列的多肽序列,该插入序列在框内融合到蛋白谷胱甘肽-S-转移酶(Sj26)上。在一个载体结构中,质粒pGEX-hisB,在该融合蛋白的羧基端导入了6个组氨酸的氨基酸序列。如实施例7A所述,各种重组pGEX质粒可被转化到合适的大肠杆菌菌株中,并且加入IPTG(异丙基-硫代-半乳糖苷)可诱导产生融合蛋白产物,接着使用谷胱甘肽琼脂亲和层析法可将溶解的重组融合蛋白质从被诱导的培养物的细胞溶胞产物中纯化(实施例7A)。在含6M尿素或6M异硫氰酸胍的缓冲液(这两种物质有利于蛋白质的溶解)中,通过固化金属离子亲和层析(Porath),可纯化的质粒pGEX-hisB表达的不可溶融合蛋白。其它的由pGEX-GLI或其衍生物表达的不可溶性蛋白的纯化,利用离心沉淀的组合,去除可溶性蛋白,接着再溶解不可溶性蛋白。并用标准层析方法,例如离子交换或大小排阻层析,以及其它这类本领域中已知的方法。在为β-半乳糖苷酶的融合蛋白时(如λ-gt11克隆产生的),通过亲和层析,使细胞溶胞产物通过表面结合抗β-半乳糖苷酶抗体的固相支持物等可容易地将融合蛋白质分离。例如,实施例7B中描述了通过亲和层析纯化由470-20-1编码序列获得的β-半乳糖苷酶/融合蛋白。本发明还包括了表达载体,如上述的λ-gt11和pGEX载体,它们含有HGV编码序列和使得编码区在合适的宿主上表达的表达调控元件。调控元件一般包括启动子、翻译起始密码子、翻译和转录终止序列以及将插入序列导入载体的插入位点。编码所需抗原多肽的DNA可克隆到任何数量的商业上可获得的载体上以在合适的宿主系统中表达产生多肽。这类宿主系统包括,但不仅限于杆状病毒(Reilly,等;Beams,等;Pharmingen;Clontech,PaloAlto,CA)、痘苗病毒(Earl,1991;Moss,等)、细菌(Ausubel,等;Clotech)、酵母(Gellissen,1992;Romanos,1992;Goeddel;GuthrieandFink)、哺乳动物细胞(Clontech;Gibco-BRL,GroundIsland,NY)、如中国仓鼠巢(CHO)细胞系(Haynes,1983,Lau,1984,Kaufman,1990)。这些重组多肽抗原都可直接表达或做为融合蛋白表达。许多特征可改造到表达载体中去,例如提高表达序列在培养介质中的分泌的引导序列。实施例16中描述了利用这些系统中的几种表达的大量HGV多肽。在酵母系统中的表达具有商业产品的优势。痘苗病毒和CHO细胞系的重组蛋白产品具有哺乳动物表达系统的优点。此外,痘苗病毒表达系统有如下优点(i)宽的宿主范围;(ii)忠实的转录后修饰、加工、折叠、转运、分泌和重组蛋白的装配;(iii)相对可溶的重组蛋白的高水平表达;和(iv)很大的容纳外源DNA的容量。重组表达多肽产生的HGV多肽抗原主要是从裂解的细胞或培养基中分离得。纯化可通过本领域已知的方法来进行,包括分级盐析、离子交换层析和亲和层析。使用根据本发明的方法鉴定的HGV抗原产生的抗体的免疫亲和层析可被采用。还可从HGV颗粒中分离HGV多肽抗原(参见下文)。多肽的连续抗原决定簇一般相对较小,典型的长度是6-10个氨基酸。较小的片段已被鉴定为如在构象表位中的抗原区。如上所述鉴定HGV多肽抗原。任一链的所得DNA的编码区可被重组表达融合蛋白或分离多肽。另外,利用商业上可获得的合成器(AppliedBiosystems,fosterCity,CA)或“PIN”技术(AppliedBiosystems),可方便地化学合成氨基酸序列。在另一个实施方案中,本发明包括由多个表位组成的嵌合蛋白。一个典型的HGV嵌合多肽至少含有两个HGV表位,该多肽基本上缺乏正常插入在天然HGV编码序列中的两个表位间的氨基酸。利用上述的多肽表达载体/宿主系统,运用标准重组DNA技术可构建产生嵌合蛋白的编码多个串联表位的合成基因(Crea;Yoshio等;Faton等)。此外,通过前面描述的方法可化学合成多抗原肽(Tam,J.P.,1988;Briand等)。例如,带α-和e-氨基基因的赖氨酸残基的一小段免疫学惰性的核心基质可被用于锚定代表感兴趣表位相同或不同合成多肽(典型的长度为6-15个残基)的多拷贝。嵌合蛋白或多抗原肽抗原,由于多表位分布导致的信号放大,在免疫检测中有较高的敏感性和特异性。这些方法之一获得的抗原都可用于抗体产生、诊断试验和疫苗开发。另一方面,本发明包括抗本发明多肽抗原的特异抗体。由任何这类方法之一获得的抗原可直接用于抗体产生,或者可被偶联至合适的载体分子中。在本领域中业已知许多这类载体,并可从商业购得(如Pierce,RockfordIL)。为制备抗体,一般用纯化抗原或融合蛋白抗原免疫宿主动物(如兔子)。用各种从其它蛋白,如谷胱甘肽-S-转移酶或β-半乳糖苷酶获得的编码序列产生杂交的或融合的蛋白。按照适宜的时间间隔,收集宿主的血清或血浆,检测这类血清中抗该抗原的特异性抗体。实施例8叙述了特异性抗Sj26/470-20-1杂合蛋白中的470-20-1抗原的免子血清抗体的产生。这些技术同样适用于从HGV获得的所有致免疫的序列,包括,但不仅限于,那些从编码序列,如SEQIDNO14中获得的。如通过使用饱和硫酸氨沉淀或DEAESephadex层析、亲和层析、或其它本领域技术人员已知的产生多克隆抗体的方法,可获得免疫动物的γ-球蛋白质片段或IgG抗体。另外,纯化的抗原或融合的抗原蛋白可用于产生单克隆抗体。这里从免疫动物分离脾脏或淋巴细胞,用本领域技术人员熟知的方法,使它们获得不死性或用于制备杂交瘤。要产生人来源杂交瘤,选择人的淋巴细胞供体。已知感染HGV的供体可作为合适的淋巴细胞供体。可从外周血液样品中分离出淋巴细胞。利用Epstein-Barr病毒(EBV)使人源淋巴细胞无限增殖,或可用一个适当的融合伴侣产生人源杂交瘤。也能用病毒的初级体外致敏的特异多肽产生人源单克隆抗体。筛选由无限增殖细胞分泌的抗体,例如利用ELISA或Western印迹方法,确定分泌需要的特异性抗体的克隆(实施例10;Ausubel等)。运用HGV阳性血清或血浆,或本发明的抗体,可以分离其它的抗原肽和表位。例如,已开发大量不同技术来同时合成许多肽(Geysen,等;Houghten;FrankandDoring;Hudson)。特别有用的方法是Geysen等开发的,因为它可相对简单地产生大量不同肽序列并被检测抗原性。在Geysen方法中(亦可称为MULTI-PIN肽合成法),肽的合成是在与微量滴定板相连的聚丙烯酰胺酸性嫁接聚乙烯棒上进行的。MULTI-PIN的方法允许利用本发明的单克隆或多克隆抗体,商业可购得试剂和设置免疫筛选大量合成物(每板96肽),鉴定和表征免疫反应的肽。已报道,可在两星期的时间内合成多达6,000个寡肽,因此通过合成某一特定抗原所有可能重叠的氨基酸顺序,可以筛选出针对单氨基酸分辨力的表位的病毒抗原顺序(Geysen,等)。筛选免疫显性肽的另一种方法,是利用常规自动肽合成法合成对应于HGV编码序列的较长肽(Garter,等,1994;Obeid,等,1994;Commandaeur,等,1994)。该方法的优点是较长肽能折叠成模拟构象表位的形状。HGV抗体,特别是单克隆抗体,也能用于鉴定模拟病毒编码的靶多肽的随机多肽(ScottandSmith,1990;Smith,1991)。例如,在噬菌体上表现的随机肽文库(RPL)(ScottandSmith,1990)可作为抗体产生或疫苗开发的肽配体来源。RPL法允许含有噬菌体表面的融合蛋白的配体表达,以及抗体亲和筛选的配体编码噬菌体的富集(Smith,J.P.,1991;Christian,等;Scott,等,1992;Folgori,等)。通过在表位呈递期间特异抗体模拟天然抗原表位(模拟表位)来检测这些随机肽表位。可从RPL、六至十肽噬菌体表位(噬菌体表现的模拟表位)分离HGV抗原模拟物(模拟表位),可通过公开的方法(ScottandSmith;Smith,J.P,1991,Christian,等,Scott,等,DeGraaf,等,Folgori,等)表达RPL,并且通过与HGV相关的人血清或本发明的抗体来筛选。下面是用RPL分离470-20-1模拟表位的一个实施例。根据前面描述的方法构建随机十肽-pIII融合噬菌体显示文库(DeGraaf等,1993)。简而言之,一条化学合成的单链变性插入序列被退火成较短小的产生SfilI限制性悬突。退火DNA连接到SfilI酶切的USE-5载体DNA。将大肠杆菌MC1061用连接的DNA转化。在含20mg/ml四环素的LB培养基中,通过约群体倍增10倍扩增文库。利用一种或多种470-20-1免疫反应的血清(或本发明的抗体)亲和性选择该文库。在50mMNaHCO3,pH9.6,4℃过夜,用硫酸铵分级分离的阳性血清(如PNF2161)包装聚苯乙烯玻璃珠。抗体包被的玻璃珠全部用PBS漂洗,并用BSA封闭。这些血清包被、封闭的玻璃珠用过量M13K07-UV杀死的噬菌体4℃温育4小时。接着将文库噬菌体加入上面的预保温混合物中,并在4℃下,温育12小时。除去未结合的噬菌体,并且用TTB缓冲液(50mMTris,pH7.5,150mMNaCl,0.5%“TWEEN20”(V/V),1mg/mlBSA)广泛地漂洗玻珠。用洗脱缓冲液(0.1MHCl,用2MTris-HCl,pH9.0将pH调至2.2)洗脱结合的噬菌体。利用噬菌体免疫筛选法,用二级阳性血清(Mys136血清)筛选洗脱的、富集的噬菌体。进一步筛选选择的噬菌体表位,可用大组的阳性和阴性血清或特异HGV单克隆抗体来进行。选择所得的噬菌体表位可直接用于ELISA检测或抗体产生。另一方面,噬菌体表位编码核苷酸序列可在常规载体/宿主系统中确定、表达、并用作抗原。上述鉴定的模拟多肽,反过来又可作为检测试验的抗原或用于产生抗原特异抗体。D.ELISA和Western印迹筛选当通过上述的噬菌斑免疫筛选鉴定了HGV抗原时,可将该抗原表达和纯化。利用另一些免疫检验法,如采用分离抗原肽的ELISA或Western印迹分析,可快速筛选抗大量可疑感染HGV肝炎的血清的抗原。该抗原多肽融合物可按如上所述分离,通常用对融合伴侣,如β-半乳糖苷酶或谷胱甘肽-S-转移酶的亲和层析。另一方面,利用抗原自身产生的抗体来纯化抗原(参见下面)。实施例10提供了一般ELISA检验形式。Harlow等描述了许多用于免疫分析和抗体/抗原筛选的技术。含有感兴趣的抗原的纯化的抗原多肽或融合多肽,被连接到一个固相支持物上,例如多孔聚苯乙烯平板。稀释待检测血清,加到各孔中。经过抗体和结合抗原充分结合的一段时间,将血清从孔中清洗掉。在每个孔中加入标记的报告抗体和适当的底物,含有与纯化的抗原多肽或含有抗原的融合多肽结合的抗体的孔通过阳性信号来检测。实施例10提供了利用本发明多肽抗原进行Western印迹分析的一般形式。Ausubel等描述了一般的Western印迹方法。在实施例10中,利用470-20-1/sj26融合蛋白筛选大量的血清样品。实施例10提供的结果证明多种不同来源的N-(BACDE)肝炎血清与多肽抗原的免疫反应。上面提供的结果证明本发明的多肽抗原能通过这些方法依靠被怀疑为HGV感染的血清样品的组(panel)被快速筛选来检测HGV。E.细胞培养系统,动物模型和HGV的分离已在黑猩猩、恒河猴和四种口鬃父体中进行了HGV传染性的研究。这些研究产生了在这些动物模型上有关HGV传染性的进一步的信息。本文说明书描述的HGV具有能感染恒河猴和黑猩猩的优点。另外,从感染动物(黑猩猩、狒狒、猴和人类)获得的原代肝脏细胞可在体外培养。公开了可以使分化的灵长类动物肝细胞长期保持分化的补充了生长因子和激素的无血清培养基(Lanford,等;Jacob,等;1989,1990,1991)。除了原代肝细胞的培养物,也能产生感染细胞的无限增殖培养物。例如,可将原代肝脏培养物融合到各种细胞(如HepG2)中来提供适宜的无限增殖的细胞系。通过导入癌基因或引起转化的表型基因,也可使原代肝细胞培养物无限增殖。这些癌基因或基因可从本领域已知的来源中获得,包括SV40、人类细胞的癌基因和EpsteinBarr病毒。另外,未感染的肝细胞(如原代或连续肝癌细胞系)可通过将培养物中的细胞与HGV接触而被感染,该HGV为部分纯化的颗粒制剂(例如,从感染血清中通过差速离心和/或分子筛制备),或存在于感染血清中。然后可增殖这些感染细胞,而且通过本领域已知方法的传代病毒。此外,其它细胞类型,例如淋巴样细胞系,也可用于HGV的增殖。通过HGV蛋白相似性研究,检测了和黄热病毒科其它病毒相似的氨基酸区域。众所周知,该病毒科的成员可在各种组织培养系统中增殖(ATCC-病毒目录,1990)。通过类推有可能HGV也可以在下列一个或多个组织培养系统中繁殖Hela细胞、原代仓鼠肾细胞、猴肾细胞、Vero细胞、LLC-MK2(恒河猴的肾细胞)、KB细胞(人类口腔表皮样癌细胞)、鸭胚胎细胞、原代绵羊柔脑膜(leptomeningeal)细胞、原代绵羊脉络丛细胞、猪肾细胞、牛胚胎肾细胞、牛陀螺状细胞、鸡胚胎细胞、原代免肾细胞、BHD-21细胞或PK-13细胞。除了表达HGV,HGV多核苷酸序列、cDNA或体外转录的RNA的区域均可通过重组方法导入组织培养细胞中。这种重组操作允许HGV各部分的独立表达。可从感染组织,特别是感染细胞培养物中制备RNA样品,RNA样品可在凝胶中分级分离,并转移到膜上用于利用从克隆HGV序列衍生的探针所进行的杂交分析。HGV颗粒可按本领域已知的方法从感染血清、感染组织、上述的细胞培养介质、或培养的感染细胞等中分离出来。这些方法包括按大小的分级分离技术(即超滤法、沉淀法和沉降法),利用阴离子和/或阳离子交换材料的方法,根据密度、疏水性和亲和层析的分离方法。在分离过程中鉴定HGV可(i)利用本发明的抗HGV肝炎相关病原体的抗体;(ii)通过利用已鉴定的HGV核酸序列的杂交探针(如实施例5);(iii)通过RT-PCR。通过免疫亲和层析,抗HGV抗体可被用于HGV颗粒的纯化(Harlow等;Pierce)。在方法中抗HGV多肽或融合多肽(如470-20-1)的抗体被以使抗体保持其免疫选择性的方式固定到固相支持物上。为实现抗体和固相支持物的这种附着作用,含有间隔基的双功能偶联剂常用于保持抗体的抗原结合位点的可通性。用标准方法可进一步对HGV颗粒进行鉴定,这些方法包括,但不仅限于,免疫荧光的显微镜检查、电子显微镜检查、组成颗粒蛋白质的Western印迹分析、利用部分纯化颗粒在动物或细胞系统上的传染性研究以及沉降鉴定方法。实施例5中所示的结果表明,本发明的病毒颗粒更接近于包被型病毒颗粒,而不是无包被的病毒颗粒。可将HGV颗粒破裂获得HGV基因组。破裂颗粒可通过如在螯合剂存在下用去污剂进行处理而获得。然后就可以进一步鉴定基因组核酸。鉴定包括DNA酶和RNA酶敏感性的分析。基因组的链型(strandedness)(实施例4I)和构型(如环状的)可通过本领域已知的方法而被确定,包括电子显微镜目测方法和沉降鉴定。所分离的基因组还使对整个基因组序列分析成为可能,无论基因组是否是片段的,是RNA还是DNA基因组(例如利用RT-PCR、染色体步移方法或利用来自紧邻克隆序列的引物的PCR)。确定完整的HGV序列允许基因组结构研究和HGV序列与已知病毒原体的编码和调控序列的比较。F.筛选具有抗HGV肝炎活性的试剂使用繁殖HGV的细胞培养基和动物模型系统为筛选抑制感染HGV的产生的抗肝炎试剂提供了可能特别是筛选抑制HGV复制的药物。细胞培养物和动物模型允许评价这种抗肝炎药物对正常细胞功能和生存能力的效果。可能的抗病毒试剂(包括天然产品或合成化合物;如小分子例如真菌抽提物的混合物和反义寡核苷酸等),被典型地用于筛选一定浓度范围的抗病毒活性。然后评价其对HGV复制或抗原产生的作用,主要通过监控病毒大分子的合成或大分子的积累(如DNA,RNA或蛋白质)。这种评估常以抗病毒试剂对正常细胞功能的作用为标准(如DNA复制、RNA转录、一般的蛋白质翻译等)来作出。可通过包括本发明中描述的那些的许多方法来进行。例如,可产生抗本发明抗原的抗体,并且这些抗体被用于以抗体为基础的分析中(Harlow,等),以鉴定和定量细胞培养基中的HGV抗原。利用竞争性分析定量培养基中的HGV抗原在这个分析中可使用克隆HGV序列编码的多肽。通常,重组产生HGV抗原多肽,并用于生产单克隆或多克隆抗体。利用一个报告分子标记重组HGV多肽。然后评估含有HGV抗原样品(如细胞培养基或血清)中出现的这种标记多肽和其相关抗体结合的抑制作用。通过抑制水平和使用已知浓度的未标记重组蛋白产生的标准曲线的比较,确定样品中的HGV抗原水平。本发明的HGV序列尤其有用于产生多核苷酸探针/引物,该探针/引物可被用于定量细胞培养系统中产生的HGV核酸序列的量。这种测定可由多种方法实现。例如,可将用报告分子标记的探针用于标准斑点印迹杂交,或用于感染细胞核酸标记的探针的竞争性分析。另外,存在许多使用聚合酶链反应来定量样品中目标核酸的水平的方法(Osikowicz,等)。利用上述的细胞培养基和动物模型系统亦可鉴定保护性抗体。例如,产生本发明抗原的多克隆或单克隆抗体。然后,在感染细胞培养物或动物前,用这些抗体预处理含HGV传染性接种物(如血清)。评估单抗体或多抗体混合物保护细胞培养物或动物免受感染的能力。例如,在细胞培养物和动物中,缺乏病毒抗原或核酸产物的被作为筛选物。另外在动物中,没有HGV肝炎病症状的(如提高的ALT值),也是保护性抗体存在的指示。另外地,康复病人的血清可被用于筛选保护性抗体的存在,然后,这些血清可被用于鉴定和抗体结合的HGV肝炎相关病原体抗原。而后重组或合成产生所鉴定的HGV抗原。如上所述检测抗原产生保护性抗体的能力。经初次筛选后,抗原或鉴定具有产生保护性抗体能力的抗原,其单用或结合使用,都可作为接种试验动物的疫苗。然后用传染性HGV感染动物。免受感染表明该动物具有产生保护它们自身免受感染的抗体的能力。另外,应用动物模型允许鉴定激活细胞免疫的抗原。在动物模型研究中,应答受病毒制剂(如感染血清)挑战的保护性免疫反应(i)保护动物免受感染;(ii)防止疾病发生。G.疫苗及保护性免疫的产生由本发明的方法所鉴定的一种或多种免疫原性多肽可制备疫苗。在HGV分离序列和其它已知病毒蛋白之间的基因组结构相似性,可提供有关可以作为有效疫苗的候选多肽的信息。此外,许多计算机程序可用于鉴定编码蛋白抗原决定簇区域的分离序列相似区域(例如,Hopp等;“ANTIGEN”Intelligenetics,MountainViewCA)。含有免疫原性多肽作为活性成分的疫苗,一般被制成可注射的溶剂或悬浊剂。另外,免疫原性多肽可被制成固体或冷冻状态,这些状态适合于注射前重悬浮成水溶液形式。该免疫原性多肽也可被乳化或被脂质体包被。多肽常常和与之相容的药学上可接受的赋形剂混合在一起。这类赋形剂包括,但不仅限于,下列物质或下列物质的结合盐水、水、糖(如葡萄糖和山梨醇糖)、甘油、酒精(如乙醇[EtOH])和本领域已知的其它物质。此外,疫苗制剂可能含有少量其它辅助物质,如润湿剂、乳化剂(如洗涤剂)和pH缓中液。另外,可增加疫苗制剂有效性的许多佐剂也是适合的。这类佐剂包括,但不限于下列一类相关化合物包括N-乙酰基-胞壁酰基(muranyl)-L-苏氨酰基-D-异谷氨酰胺和N-乙酰基-去甲-胞壁酰基(muranyl)-L-丙氨酰基-D-异谷氨酰胺的基团,以及氢氧化铝。本发明的疫苗中所用的免疫原性多肽可以是重组、合成或从减毒HGV颗粒分离的。多肽通常被配制成中性或盐形式的疫苗。本领域熟知的药学上可接受的有机或无机盐。HGV肝炎相关病原体疫苗,典型地通过皮下或肌肉内注射非肠胃方式使用。其它合理的制剂包括口服剂和栓剂。口服剂通常使用赋形剂(如药物级糖、糖精、纤维素或类似物),常含有10-98%的免疫原性多肽。口服组合物以丸剂、胶囊、片剂、溶液剂、悬浊剂、粉剂等形式存在。并被制成允许持久的和长期的释放。栓剂利用常规的粘合剂和载体,一般含有0.1-10%的免疫原性多肽。鉴于上述信息,可生产抗HGV肽相关病原体的多价疫苗,它由一种或多种结构性或非结构性的病毒病原体多肽组成。这些疫苗含有例如,重组表达的HGV多肽、从HGV病毒颗粒分离的多肽、合成多肽或嵌合多肽形式的装配表位。另外,还可制备保护性疫苗,它通过使用灭活的HGV授予抗HGV肝炎感染的保护。这种失活可通过制备病毒裂解液,接着用适宜有机溶剂,洗涤剂或福尔马林处理裂解液来完成。从减毒HGV病毒株也可制备疫苗。利用上述细胞培养物和/或动物模型系统可获得这种减毒HGV。一般在体外或体内多次传代后分离减毒菌株,通过本领域已知方法进行减毒菌株的检测。检测减毒株的一种方法是用抗HGV抗原的抗体探针、序列特异的杂交探针,或使用被感染动物的序列特异性引物的扩增,或体外培养物中的HGV感染分析。另外,除了上面的方法,可根据从本说明书所示信息中获得的基因组信息,构建该减毒HGV株。典型地可删除感染病原体基因组的一个区域,该区域编码例如与病毒病理有关的多肽。这种删除不含干扰病毒复制。另外,重组的减毒HGV构建物允许一个或多个能引起抗HGV的保护性免疫反应的表位的表达。这种所需的免疫反应可包括体液和细胞免疫。然后,将减毒HGV的基因组用于转化细胞,并让这些细胞在允许病毒复制的条件下生长。该减毒株不仅可用作疫苗,而且可作为病毒抗原和/或HGV颗粒的生产来源。还能产生含HGV表位的杂交颗粒免疫原。HGV表位的免疫原性可通过在真核系统中(如哺乳动物或酵母系统)表位的表达而增强,其中表位与已知的颗粒形成蛋白质融合或装配。一种这样的蛋白是乙型肝炎的表面抗原。其中HGV表位直接和颗粒形成蛋白编码序列连接的重组构建物将产生杂交蛋白,该蛋白对相关的HGV表位和颗粒形成蛋白是有免疫原性的。另外,不包含在颗粒形成中的颗粒形式蛋白编码序列的选择部分,可被与HGV表位对应的编码序列替换。例如,与颗粒形成蛋白发生特异免疫反应的区域可被HGV表位序列替换。在酿酒酵母(saccharomycescerevisiea)和哺乳动物细胞中,已表明乙型肝炎表面抗原可被表达并被装配到颗粒中(Valenzuela,等,1982和1984;Michelle,等)。这些颗粒显示出具有被增强了的免疫反应性。以前已公开了使用杂交蛋白,即带有杂合病毒序列的重组构建物来形成这些颗粒(EPO175,261,1986年3月26日公布)。这种含HGV表位的杂交颗粒在疫苗应用中也是有用的。本发明疫苗以与制剂方法相容的剂量和对预防和治疗处理为药理学有效的量使用,以这样的剂量免疫,对预防或治疗处理是药理学有效的。使用的免疫原的量依赖接受治疗的个体,治疗个体免疫系统产生保护性免疫反应的能力和所需的保护水平。本发明的HGV疫苗可以单剂量或多剂量使用。还根据治疗个体的需要和耐受力确定剂量范围。除HGV免疫原性多肽外,疫苗制剂可与其它免疫调节剂结合而被使用。在另一种HGV接种方法中,在合适的调控子控制下,编码HGV蛋白的DNA构建物可被直接导入哺乳动物体内组织。导入这种构建物产生“基因免疫”。细胞摄取相似DNA构建物,并表达编码的蛋白(Wolf,等;Ascadi,等)。注射的DNA并未表现出整合到宿主染色质上或复制。这种表达引起了实质性的体液和细胞免疫反应,包括在动物系统中免受体内病毒的攻击(Wang,等,1993;Ulmet,等)。在一个实施方案中,用局部麻醉剂如盐酸布比卡因和尼泊金甲酯的等渗盐水进行预处理以利于细胞DNA吸收,而后将该DNA构建物注射到骨骼肌肉中。注射的DNA构建物被肌肉细胞吸收,并表达所编码的蛋白。同用可溶性病毒亚基蛋白接种比较,基因免疫接种具有在体内真实表达病毒蛋白的优点。这些病毒蛋白的表达和宿主细胞主要组织相容性抗原和其它蛋白有关,正如用天然病毒感染发生的情况。同许多可溶性亚单位蛋白疫苗相比,这种类型的免疫接种能够诱导体液和细胞免疫反应。相应地,该类型的免疫接种保留了许多活的减毒疫苗的有利特征,而没有用传染性病原体的接种和护理安全性问题。直接将编码所需疫苗抗原的质粒或其它DNA构建物注射到体内组织是一种传送方式。也可使用其它传送DNA构建物的方式。这包括各种以脂质为基础的方法,其中DNA被用脂质体,阳离子脂试剂或细胞转染剂(Cytofectin)(如脂质转染剂(Lipofectin))进行包装。如Feigner和Rhodes(1991)所归纳的,这些方法便于体内吸收和表达。对这些基本方法的各种修改如下掺入这些多肽或其它的部分,以便于(i)靶向特殊细胞;(ii)DNA构建物吸收后的细胞内处理;(iii)便于表达。另外,编码需要的疫苗抗原序列可被插入到合适的反转录病毒载体。将所得的重组反转病毒载体接种个体以在体内表达疫苗抗原。接着抗原诱导免疫应答。如上面所提及的,这种方法已显示出能针对病毒抗原诱导体液和细胞免疫(Irwin,等)。另外,本发明的HGV疫苗可与其它疫苗,如其它的肝炎疫苗结合使用。H.合成肽利用HGV多肽的编码序列,即可产生与这些多肽相应的合成肽。使用本领域标准方法和设备(AppliedBiosystems,FosterCityCA),可商业合成或制备合成肽。另外地,通过寡核苷酸合成的标准方法可直接合成编码肽的寡核苷酸序列,或若是长的编码序列,则由一系列克隆步骤合成,这些步骤包括多个相应于编码序列的寡核苷酸片段的串联排列(Crea;Yoshio等;Eaton等)。用标准重组方法能够表达寡核苷酸的编码序列(Maniatis等;Ausubel等)。V.该病毒基因组的鉴定如实施例4所示,HGV基因组看起来象RNA分子,并与黄热病毒科的病毒所列出的病毒序列有最接近的序列相似性。该科包括黄病毒、瘟疫病毒和由一种丙型肝炎病毒组成的未分类的属。HGV病毒没有明显的与其它可辨别的黄病毒成员相同的全(即整个病毒长度)序列------除了下面讨论的蛋白结构域单元。黄热病毒科的一般成员是包被型病毒,该病毒在蔗糖梯度中的密度介于1.1和1.23g/ml,并对热、有机溶剂和洗涤剂敏感。如实施例5所示,HGV具有与一种包被型黄热病毒科病毒(HCV)相似的密度特征。HGV病毒颗粒整体也显示对有机溶剂是敏感的(实施例5)。黄热病毒科的病毒颗粒含有一个线性单链(ss)RNA的单分子,它也是编码病毒蛋白的唯一的mRNA。此ssRNA分子长度一般为9-12Kb大小。病毒蛋白来源于一个多蛋白前体,此前体后来加工成为成熟病毒蛋白。黄热病毒科的大部分成员在3’末端没有poly(A)尾部。病毒颗粒具有约15-20%重量的脂。黄热病毒科的成员具有一个核心蛋白和2或3个与膜相关的蛋白。黄热病毒科中三个属中成员的类似结构蛋白在序列水平上相互间显示出极少的相似性。非结构性蛋白含有RNA依赖的RNA聚合酶(RDRP)、解旋酶和丝氨酸蛋白水解酶的保守结构域单元。利用本领域已知的计算机算法,如“MACAW”(Schuler,等)能够检测保守氨基酸的结构域单元的短的模块。这些结构域单元可能与被这些蛋白加工的底物的限制物有关(KooninandDolja)。这些结构域的顺序在黄热病毒科的所有成员中是保守的。HGV基因组含有在黄热病毒科成员中发现的蛋白结构域单元,例如(i)解旋酶基因;(ii)类丝氨酸蛋白水解酶结构域;(iii)RNA依赖的RNA聚合酶(RDRP)(见图5,“GDD”序列)。本文公开了多个不同HGV毒株/分离株的序列信息。该信息能被本领域技术人员使用,利用杂交技术、引物延伸和本文所述的RT-PCR分离新的毒株/分离株(例如,以公开的HGV变异体序列为基础的变性引物)。在现在的情况下,HGV是一种新的分离株,被认为是黄热病毒科的成员。在该病毒科里,鉴定由一种病毒编码的结构蛋白,允许最明确地确定一种病毒分离株是否是一种病毒种类的成员。非结构性蛋白在一族病毒种内的不同病毒种间是最为保守的。这点被认为是维持酶功能必需的结果,例如下列病毒多蛋白的水解酶切,以及通过病毒解旋酶和病毒RNA依赖的RNA聚合酶的RNA基因组的复制。对黄热病毒科的任一属内的几个种类的鉴定,例如黄病毒属,证明在种类间这些保守功能的基因比结构蛋白的基因更为保守。相应地,与一种已知种类的“变异分离株”相比,一种病毒分离株是否代表新的种类的主要决定因子之一,是确定已知病毒种和该新病毒分离株间结构蛋白的总体同源性。在非结构性蛋白中发现大约200个或少于200个氨基酸的区域内找到局部同源性,是决定分离株是变异体还是新种的非决定性标志。典型地,具有少于或约为40%总体结构蛋白同源性的病毒分离株被分类为不同种类(病毒)或为不同属。同描述在“GENBANK”中的任一病毒相比(根据本领域标准方法比较),HGV的每个结构区域的同源性都较低于40%。因此,HGV被认为是一新种类,而且可能是正链RNA病毒的一个新属。在确定病毒分离株的系统发育位置中检测到的另一个重要区域是5’和3’末端的非翻译区(UTR)。在病毒分离株之间比较了这些区域。例如,所有的HCV成员,黄热病毒科的一个未分类的属,具有大于该属所有其它成员在该区具有的90%的保守性的5’末端非翻译区。另外,HCV的成员享有大约24~50个核苷酸长度的3’端非翻译区。当5’端非翻译区作为BLASTN中的具有FASTA的一个疑问序列时,在“GENBANK”(Ver.86)中没有发现任何病毒的有意义的序列。另外,HGV含有一个长度至少约250个核苷酸,并与任何其它已知病毒具有很少同源性的3’端非翻译区。已知黄热病毒科的成员在很多种动物中复制,范围从(I)吸血节肢动物载体(蜱和蚊),在那里它们不引起疾病;到(ii)较大范围的脊椎动物宿主(人、灵长类动物、其它哺乳动物、袋形动物和鸟类)。30多种黄热病毒科的病毒引起人的疾病,范围从热病、或疹,到潜在的致死疾病,如出血热、脑炎、或肝炎。黄热病毒科至少10种成员在家畜中导致严重的具有经济重要性的疾病。VI.应用A.本发明一方面,本发明涉及基本分离的,从一种庚型肝炎病毒(HGV)多核苷酸来源的多核苷酸。在一种实施方案中,根据下面几点来鉴定HGV多核苷酸(i)灵长类动物中的传染;(ii)血清学上明显区别于甲型肝炎病毒(HAV)、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒(HDV)和戊型肝炎病毒(HEV);和(iii)是黄热病毒科的成员。本发明的多核苷酸可以包括DNA或RNA(或其类似物或变异体),并可按照本领域已知的方法通过重组、分离或合成产生。一般地说,本发明的HGV多核苷酸长度为至少10个核苷酸。在另一个实施方案中,HGV多核苷酸长度为至少15个核苷酸。在另一个进一步的实施方案中,HGV多核苷酸长度为至少20个核苷酸。在一个具体的实施方案中,本发明的多核苷酸包括了HGV基因组的cDNA或cDNA互补链。在一个较特定的实施方案中,这样的cDNA或cDNA互补链与选自SEQIDNO14、SEQIDNO37、SEQIDNO19或其互补链的一段多核苷酸具有至少40%的序列同源性。在另一个实施方案中,这种cDNA与选自SEQIDNO14、SEQIDNO37、SEQIDNO19或其互补链的一段多核苷酸具有至少55%的序列同源性。在一个具体的实施方案中,本发明cDNA或cDNA互补的多核苷酸将具有从选自SEQIDNO14、SEQIDNO37、SEQIDNO19或其互补序列的序列而产生的序列。在另外一般的实施方案中,本发明的多核苷酸为与HGV进行特异性杂交的多核苷酸探针。在其它一般的实施方案中,本发明的多核苷酸编码HGV表位。更具体地说,编码多核苷酸的这种表位可能包括从SEQIDNO14、SEQIDNO37或SEQIDNO19的序列产生。在另外一般的实施方案中,本发明的多核苷酸包括一段连续的多核苷酸序列,其具有同HGV多核苷酸进行选择性杂交的能力。在这一方面,HGV被鉴定为包含开放阅读框(ORF)的基因组,该ORF编码,同下列氨基酸序列之一具有至少40%的序列同源性的氨基酸序列SEQIDNO15的2873个氨基酸序列,SEQIDNO38的190个氨基酸序列,或SEQIDNO20的67个氨基酸序列。更特别地,该多核苷酸探针与HGV进行特异性杂交。这种多核苷酸探针带有检测标记或其它修饰,或被固定到一固相支持物上。如上所述的DNA多核苷酸还可编码HGV特异性免疫反应的抗原决定簇。在这一方面,HGV被鉴定为具有包含编码氨基酸序列的开放阅读框(ORF)的基因组、cDNA或其互补链。该氨基酸序列同下列氨基酸序列之一具有至少40%的序列同源性SEQIDNO15的2873个氨基酸序列、SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列。根据本发明,在另一个特定实施方案中,同HGV抗原决定簇进行特异反应的HGV编码的DNA多核苷酸包括同下列氨基酸序列之一具有至少55%的序列同源性的氨基酸序列SEQIDNO15的2873个氨基酸序列或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列。在其它特定实施方案中,该DNA多核苷酸可能表现为与从SEQIDNO14、SEQIDNO37、SEQIDNO19或其互补链中选出的一段多核苷酸具有约40%的序列同源性。在另外进一步的实施方案中,本发明包括编码HGV来源的多肽的一段DNA多核苷酸。特别地,由该多核苷酸编码的多肽包括一段具有至少15-60个氨基酸的连续序列,它同由一个HGV基因组、cDNA或其互补链编码的至少15-60氨基酸的一段连续序列具有55%的序列同源性。在一个特定实施方案中,多核苷酸编码的HGV多肽可在PNF2161cDNA信息源λ-gt11文库内编码。在其它特定实施方案中,该DNA多核苷酸可编码一个HGV表位。在进一步的实施方案中,该多核苷酸可作为与HGV特异性杂交的探针。在一个相关方面,本发明包括一种重组载体,该载体含有编码一段HGV多肽的DNA多核苷酸。在另一个相关的方面,本发明包括用这种载体转化的细胞。在另一个相关方面,本发明包括一段多核苷酸探针,该探针与一个HGV肝炎病毒基因组、cDNA或其互补链进行特异性杂交。在一个较特定的实施方案中,该多核苷酸探针序列同一段从SEQIDNO19、SEQIDNO37、SEQIDNO14或其互补链来源的序列具有至少40%的同源性。在另一个特定的实施方案中,该多核苷酸探针是从SEQIDNO19、SEQIDNO37、SEQIDNO14或其互补链来源的。在另一相关方面,本发明包括检测试验个体中HGV肝炎病毒核酸的方法。根据本方法,从个体中获取包含核酸的样品。然后该样品同至少一种多核苷酸探针结合,该探针能同HGV肝炎病毒基因组特异性杂交。然后检测由HGV核酸与探针杂交形成的HGV核酸/探针复合物。这种检测可通过含有至少一个报告分子部分的探针与HGV核苷酸杂交实现。在一个较特定的实施方案中,上述方法包括HGV核酸特异探针的使用,其中两个探针(引物)定义该HGV核酸中一个内部区域。在这个实施方案中,每一探针含有一条3’端内含于HGV核酸内部区的链。然后将该核酸/探针杂交复合物通过引物延伸反应转换成含有多片段的双链探针。通过不断重复下列步骤来扩增包含探针的片段(i)使双链片段变性,产生单链片段;(ii)单链与探针杂交,形成链/探针复合物;(iii)在有DNA聚合酶和所有四种脱氧核糖核苷酸存在的情况下,由链/探针复合物产生双链片段;(iv)重复步骤(i)~(iii),直至达到所需的扩增程度。然后根据已建立的方法鉴定扩增产物。本发明的方法可还包括第三种多核苷酸探针,它能与上面描述的内部区进行选择性杂交,但不能和扩增所用的特异性探针/引物序列杂交。在另一个特定实施方案中,利用靶扩增方法,例如自身维持序列扩增、连接酶链式反应、或链置换扩增检测HGV核酸/探针复合物。在进一步特定的实施方案中,采用信号放大技术,例如支链DNA探针或Q-β复制酶方法来完成检测。在另一相关方面,本发明包括一种试剂盒,用于分析样品中是否存在HGV肝炎病毒来源的多核苷酸。在一般实施方案中,该试剂盒包括至少含一种核苷酸序列的多核苷酸探针,该探针可与HGV多核苷酸进行特异性杂交,以及合适的容器。在一个特定的实施方案中,该试剂盒包括定义HGV多核苷酸内部区的两个多核苷酸探针,其中每一探针具有3’端内含于该区的一条链。在进一步的实施方案中,该探针可用作聚合酶链式反应扩增的引物。在更进一步相关的方面,本发明包括基本分离的HGV肝炎病毒颗粒。本发明还包括来自基本分离的HGV肝炎病毒的多肽或多肽制剂。在这一方面,HGV病毒被鉴定如下(i)在灵长类动物中可传播;(ii)血清学上明显不同于甲型肝炎(HAV)、乙型肝炎(HBV)、丙型肝炎(HCV)、丁型肝炎(HDV)和戊型肝炎(HEV);和(iii)为黄热病毒科的一个成员。正如上面所说明的,可通过常规方法制备HGV多肽,包括化学合成和重组DNA表达。也可将该多肽固定于一个固相支持物上。在一个特定实施方案中该多肽与至少一种抗HGV抗体发生特异性免疫反应。在更进一步的特定实施方案中,该多肽包含与HGV特异性免疫反应的抗原决定簇。在本文中,HGV被鉴定为具有包含编码氨基酸序列的开放阅读框的基因组,该ORF编码的氨基酸序列同下列序列之一具有约40%的序列同源性SEQIDNO15的2873个氨基酸序列或SEQIDNO38的190个氨基酸序列和SEQIDNO20的67个氨基酸序列。在一个较特定的实施方案中,该ORF编码同上面提及的氨基酸序列之一具有至少55%的序列同源性的氨基酸序列。在再进一步的实施方案中,该多肽序列来源于SEQIDNO15的2873个氨基酸序列或其片段、SEQIDNO38的190个氨基酸序列或其片段或者SEQIDNO20的67个氨基酸序列或其片段。在另外特定的实施方案中,来自HGV肝炎病毒的多肽包括一段至少约60个氨基酸的连续序列,该序列是由HGV基因组、cDNA或其互补链编码的。更具体地说,这些肽序列是由PNF2161cDNA来源的λ-gt11文库编码的。在一个较特定的实施方案中,重组表达的HGV多肽可包括从SEQIDNO20、SEQIDNO38或SEQIDNO15来源的一段多肽序列。在另一个的实施方案中,这种多肽可由来源于SEQIDNO14或者其互补序列的序列编码。在进一步相关的实施方案中,根据本发明,HGV肝炎病毒多肽可为包含HGV多肽和次级多肽的一种融合多肽。更具体地说,这种融合多肽可包括β-半乳糖苷酶或谷胱甘肽-S-转移酶蛋白序列作为次级多肽的信号序列。另外,这种次级多肽可包含一种颗粒形成蛋白。上面所述的多肽可来源于结构性或非结构性病毒蛋白。在更进一步相关的方面,本发明包括一种克隆载体,该载体在适当条件下,具有表达cDNA开放阅读框(ORF)的能力,此ORF是从HGV肝炎病毒基因组、cDNA或其互补链来源的。在本发明的这一方面,ORF被可操作性地连接至与所需宿主相容的控制序列上。在一个相关方面,本发明包括用这样一个载体转化的细胞。在一个较特定的载体实施方案中,ORF可来源于SEQIDNO14或其互补链。在更进一步的特定实施方案中,该ORF可来源于SEQIDNO37或SEQIDNO19。在一相关方面,本发明包括产生HGV肝炎病毒多肽的方法。该方法包括在适宜于开放阅读框(ORF)序列表达的条件下,培养含有上述载体的细胞。在一个较特定的实施方案中,该ORF序列编码一多肽序列,该多肽序列选自SEQIDNO15,SEQIDNO38或SEQIDNO20或其片段。另外,该ORF序列可来源于HGVcDNA或其互补链。在另外特定实施方案中,载体是在大肠杆菌细胞中表达的λ-gt11噬菌体。在进一步相关的方面,本发明包括一种诊断试剂盒,该试剂盒用于筛选含有特定抗HGV肝炎病毒感染的抗体的血清。该试剂盒可包括基本分离的HGV多肽抗原,该抗原包含与至少一种抗HGV抗体特异性免疫反应的表位。这种试剂盒还包括检测上述抗体抗原结合的方法。根据这一试剂盒,HGV被鉴定为具有包含编码氨基酸序列的开放阅读框(ORF)的基因组,cDNA或其互补链。这种氨基酸序列同SEQIDNO15的2873个氨基酸序列、SEQIDNO38的190个氨基酸序列和SEQIDNO20的67个氨基酸序列相比,典型地具有至少40%的序列同源性。在特定的实施方案中,该试剂盒可包括重组产生的或化学合成的多肽抗原。该试剂盒的多肽抗原也可被吸附在固相支持物上。在一个更具体实施方案中,上述试剂盒的检测手段包括与所述多肽抗原相连的固相支持物。该试剂盒还包括未吸附的报告分子标记的抗人抗体。在这个实施方案中,该抗体与HGV多肽抗原结合可通过报告分子标记抗体和该抗体结合来检测。在相关方面,本发明包括检测试验个体中HGV肝炎病毒感染的方法。这一检测方法包括将从HGV试验个体取得的血清同基本分离的HGV多肽抗原反应,并检测该抗原中结合的抗体存在。在一个具体实施方案中,该方法包括吸附在固相支持物的多肽抗原,并且将血清和载体反应。结果,该载体和报告分子标记的抗人抗体反应。然后检测固相支持物中是否有报告分子标记的抗体存在。在进一步的方面,本发明包括HGV肝炎病毒疫苗组合物。这些组合物包括基本分离的HGV多肽抗原,其中抗原包括与至少一种抗HGV抗体有特异性免疫反应的表位。可根据本领域已知的方法产生肽抗原包括重组表达或化学合成。该肽抗原优选在药学上可接受载体中以药理学有效剂量存在。在更进一步的相关方面,本发明包括同HGV肝炎病毒表位特异性免疫反应的单克隆抗体。在另一个相关方面,本发明包括同HGV特异性免疫反应的多克隆抗体的制备。在一个更具体的实施方案中,由亲和层析制备这种多克隆抗体。在一个相关方面,本发明包括生产HGV抗体的方法。这一方法包括用基本分离的HGV多肽抗原施用于试验个体,其中抗原包括与至少一种抗HGV抗体特异性免疫反应的表位。该抗原以使个体足以产生免疫反应的剂量使用。而在另一个相关方面,本发明包括用于筛选含HGV抗原血清的诊断试剂盒。该诊断试剂盒包括同HGV多肽抗原特异性免疫反应的基本分离抗体,以及检测该多肽抗原和抗体结合的方法。在一个实施方案中,该抗体与固相支持物相连。在一具体实施方案中,该抗体可以是单克隆抗体。该试剂盒的检测方法包括二次、标记的单克隆抗体。选择性地,或另外该检测方法可包括一个标记的、竞争抗原。在另一个相关方面,本发明包括检测试验个体中的HGV感染的方法。根据本发明的这一方面,将从试验个体获得的血清同上述试剂盒的基本分离HGV特异性抗体进行反应。然后检测HGV特异抗体是否有结合抗原的存在。在更进一步的方面,本发明包括HGV感染的体内成熟细胞。在一个具体实施方案中,该细胞是在组织培养基中培养的肝细胞。更具体地说,该组织培养细胞是无限增殖的肝细胞,或是由HGV感染的灵长类动物肝脏中获得的一个细胞系。在一个相关方面,本发明包括繁殖HGV的方法。该方法包括在如上所述的利于提高HGV繁殖的条件下,体外培养成熟的、HGV感染的细胞。在另一相关的方面,本发明包括由这一繁殖方法产生的HGV颗粒。在另外的相关方面,本发明包括嵌合多肽。该多肽可包括至少两种HGV表位,其中多肽基本上缺乏在天然HGV编码序列中正常插入两表位间的氨基酸。在更具体的实施方案中,这种嵌合多肽与一固相支持物相连。更进一步相关的方面,本发明包括编码上述嵌合多肽的核酸。在另一个相关方面,本发明包括检测试验个体中的HGV感染的方法,该方法包括将从个体获得的含抗体的样品与一嵌合多肽接触,如上所述,并检查抗原中结合抗体的存在。在更进一步相关的方面,该发明包括HGV疫苗组合物。该疫苗组合物包括含有多于一个的HGV表位嵌合多肽。该嵌合多肽在药学上可接受载体中以药理学有效剂量存在。B.HGV的免疫检测由本发明方法获得的抗原的一种用途,是用作诊断试剂,检测HGV肝炎病毒感染的试验个体中是否有抗体,从而表明个体的感染与否;例如,470-20-1抗原、SEQIDNO14或其互补链编码的抗原以及完整病毒序列任一链的部分编码的抗原。本发明的抗原在检测HGV时,可以单独使用,或相互结合使用。本发明的抗原也可与对其它肝炎病原体如HAV、HBV、HCV、和HEV的诊断试验一起使用。在一种诊断构型中,将检验血清与固相试剂反应,该试剂具有通过本发明获得的表面结合抗原,如470-20-1抗原。在抗HGV抗体与该试剂结合,并洗去未结合的血清成分后,将该试剂与报告分子标记的抗人抗体反应,使得报告分子按固相支持物上结合的抗HGV量的比例与试剂结合。再次洗涤试剂以除去未标记的抗体,并确定与试剂相连的报告分子的量。一般地该报告分子为一种酶,这种酶可以通过将固体相在有合适荧光或比色底物存在时培育固体相而检测(Sigma,St.Louis,Mo)。上面检测中的固体表面试剂通过已知的技术将蛋白质材料连接到固体支持材料,如聚合玻璃珠、浸润棒(dipsticks)、96孔平板或滤纸材料上而制备。这些连接方法常常包括蛋白质非特异性吸附到载体上或一蛋白质的共价吸附,典型地通过将减毒游离胺基连至固相支持物上的化学活跃基团上,例如激活的羧基、羟基或醛基。另一方面,链霉抗生物素蛋白包被的平板可与生物素标记的抗原结合使用。还参与形成本发明的一部分是检测系统或试剂盒,该试剂盒通常包括具有表面结合重组HGV抗原的载体(例如上述的470-20-1抗原)和检测表面结合抗HGV抗原抗体的报告分子标记的抗人抗体。在第二种称为同源检测的诊断形式中,结合到固相支持物上的抗体在反应介质中发生一些变化,这些变化可在介质中直接检测到。直到现在为止提出的同源检测的已知一般类型包括(a)自旋标记报告分子,其中结合抗原的抗体的检测是根据报告的流动性的变化(自旋断裂峰增宽)来完成的,(b)荧光报告分子,其中结合物的检测是根据荧光效率或极化的变化来完成的,(c)酶报告分子,其中抗体结合引起酶/底物相互作用,及(d)脂质体结合的报告分子,其中结合导致脂质体裂解并释放被包被的报告分子。对本发明蛋白抗原的修改方法遵循制备均相检测试剂的常规方法。在上述的每一种检测法中,检测方法包括将试验个体的血清与蛋白抗原反应,并且检测抗原中结合抗体的存在。该检验包括将标记抗人抗体连接到被检抗体上(如取于急性的、慢性的或恢复期),并且测定结合到固相支持物上的报告分子的数量,如第一种方法,或可包括观察结合到同源检测试剂上的抗体的效果,如第二种方法。第三种诊断形式包括能检测HGV特异性抗原的HGV抗体的使用。例如,利用抗原捕获试验检测读HGV抗原,其中候选血清样中的HGV抗原与HGV特异性单克隆或多克隆抗体反应。将抗体连接到一固相底物上,然后用第二不同标记的抗HGV抗体检测抗原。利用本发明的肽,可用标准方法制备抗体。另外,可产生基本分离的抗体(基本上是没有可能影响反应的血清蛋白),(如亲和纯化(Harlow等))。C.HGV的杂交试验由本发明的方法获得的核酸序列的一种用途是用作存在于血清中的HGV顺序的诊断试剂,由此表明该个体中的感染。从本发明编码序列,特别是克隆470-20-1和SEQIDNO14获得的引物和/或探针,可以单独或相互结合的方式用于HGV的检测。在一种诊断形式中,在PCR或RT-PCR条件下试验血清反应,例如使用来自470-20-1序列的引物。由引物靶向的序列的特异性扩增可检测扩增反应中所用的血清中的HGV的存在。实施例4描述了运用本发明克隆来源的引物,使用聚合酶链式扩增反奕,来筛选不同来源的材料。这些扩增反应的结果证明从本发明克隆所得的引物(如,实施例4)能够通过利用各种不同来源模板的扩增反应检测同源序列。实施例4中的扩增反应包括使用从血清直接获得的核酸作为模板材料。另一方面,探针可以从本发明的HGV序列获得,然后可标记这些探针,并将其用作针对从试验血清或组织样品获得的核酸的杂交探针。可以用各种报告分子标记探针,并对其作相应检测如放射性同位素标记和化学发光检测报告分子系统(Tropix,Bedford,Mass)。靶扩增方法,具体体现为聚合酶链式反应,自我维持序列扩增技术[“3SR”,(Guatelli,等,Gingerse,等,1990),也称为“NASBA”(VamGemen,等)]。连接酶链式反应(Barany),链置换扩增[“SDA”,(Walker)],和其它技术,增加靶序列的拷贝数。信号扩增技术,例如支链DNA探针(HornandUrdea;Urdea;Urdea;等)和Q-β复制酶法(Cahill,等;Lomell;等),首先结合特异分子探针,然后复制该探针的全部或部分或以其它方式扩增探针信号。对于本发明公开的特异核酸序列或在相同或相似(相关)病毒基因组中的连续序列的检测,可使用扩增和检测方法,作为对PCR扩增的替代方法。在核酸诊断领域中已知大量的这类方法(The1992SanDiegoConferenceGeneticRecognition,Clin.Chem.39(4)705(1993))。1.自我维持序列扩增自我维持序列扩增(3SR)技术产生与PCR相似体积,而且是等温的扩增。不同于温度循环驱动的PCR,3SR操作如一种协同的三种酶反应a)由逆转录酶合成cDNA,b)由RNA酶H降解RNA链,和c)由T7RNA聚合酶转录RNA。由于整个反应顺序是等温发生(典型地为42℃),不需要昂贵的温度循环设备。没有通过加热、有机溶剂、或其它机制使双螺旋变性,扩增的只是单链模板(主要为RNA)。在3SR扩增中合适的引物可以由本领域普通技术人员从本发明的病毒序列中选择。例如,对于用3SR技术等温扩增病毒序列,通过加入T7启动子序列和优选的寡核苷酸的5’末端的T7转录起始位点将引物470-20-1-77F(SEQIDNO9)修饰。这种修饰产生了适宜的3SR引物T7-470-20-1-77F(SEQIDNO9)。在没有修饰或T7启动子时,引物470-20-1-211R(SEQIDNO10)可被用于这些反应中。用AMV逆转录酶(30U),RNA酶H(3U),T7RNA聚合酶(100U),在100μl的反应物中培育从PNF2161抽提的RNA,该反应物中含有20mMTris-HCl,pH8.1(室温),15mMMgCl2,10mMKCl,2mM亚精胺盐酸,5mM二硫苏糖醇(DTT),1mM的dATP,dCTP,dGTP和dTTP7mM的ATP,CTP,GTP和UTP,以及0.15μM每种引物在42℃下,在1-2小时的保温期间发生扩增。起初,引物T7-470-20-1-77F与靶RNA退火,并由AMV逆转录酶延伸以形成起始RNA链的cDNA互补链。由RNaseH降解RNA链后,逆转录酶催化第二条DNA链的合成,获得含有(双链)T7启动序列的双链模板。RNA转录导致单链RNA产生。然后该RNA重新进入下一轮扩增的循环,最后获得高浓度的产物RNA池(pool)。产物主要是与包含T7启动子(T7-470-20-1-77F)的引物相同的单链RNA,并具有相当少量的cDNA。另一方面,另一种引物(470-20-1-211R)可能含有T7启动子,或两种引物都含有该启动子,这导致RNA两条链的产生为反应的产物。3SR反应产物可通过RNA分析的标准技术(如Northen印迹、RNA狭缝印迹或斑点印迹用RNA染色染料直接凝胶电泳)来检测。另外,产物可通过利用生物素-亲和素亲和相互作用或核酸探针的特异性杂交来检测。在3SR产物的快速和特异分析技术中,产物与放射性标记的寡核苷酸470-20-1-152R(SEQIDNO21)在溶液杂交后,接着进行非变性的聚丙烯酰胺凝胶电泳。这种试验(凝胶迁移漂移类试验)使得可检测比未杂交的寡核苷酸对应的带移动得慢的特异性探针产物杂交。2.连接酶链反应(LCR)作为检测系统的另一实例,该HGV序列可构成连接酶链式反应(LCR)引物的设计基础。LCR利用了DNA连接酶的缺刻封闭活性,使得具有近邻5’-磷酸(“供体”寡核苷酸)和3’-羟基(“受体”寡核苷酸)末端的两个直接近邻的寡核苷酸连接。DNA连接酶的以模板依赖方式仅连接完全互补末端的特性,导致了很高程度的特异性,这样,除非要连接的末端与靶链序列完全吻合,否则连接不会发生。作为对PCR的另一个替代方法,具有在引物和靶分型核酸之间判别单个碱基错配的特异性方面的某些优点,LCR可用于检测或“分型”具有与HGV序列同源的病毒株。这些技术适合于评估特异性突变的存在,当已知这样的碱基变化具有抗药性时(如LarderandKemp;Gingeras,等,1991)。在模板互补供体和受体寡核苷酸以及同供体和受体互补的寡核苷酸存在时,LCR的指数级扩增是可能的。在这个实施方案中,在一个循环反应中,每一轮产生连接反应后面几轮反应的另外模板。例如,可用引物470-20-1-211R(SEQIDNO10),一个邻接寡核苷酸(B,SEQIDNO22)和同类寡核苷酸(211R’,SEQIDNO23和B’,SEQIDNO24)来对本发明的序列作LCR扩增。首先通过标准方法进行逆转录,产生cDNA,然后在25μl反应体系中扩增,反应体系包括4种LCR引物(每种0.1~1μM),20mMTris-HCl,pH8.3(室温),25mMKCl,10mMMgCl2,10mM二硫苏糖醇(DTT),0.5mMNAD+,0.01%TritonX-100和5单位DNA连接酶(威斯康星州Madison市EpicentreTechnologies公司生产的Ampligase,或其它商业公司提供的热稳定型DNA连接酶)。进行下列温度循环94℃1分30秒;94℃1分钟;65℃2分钟,重复25~40次。产物合成的特异性取决于引物与模板在3’端位置的匹配。产物可用聚丙烯酰胺凝胶电泳后作溴化乙啶染色来进行检测。另一种方法是把某一种受体寡核苷酸(211R’或B)作5’-放射标记,在电泳后作放射自显影观测。此外,也可用特异性可结合部分(如生物素)在3’端标记上供体寡核苷酸,而用特异性可检测基团(如荧光染料)在5’端标记受体,作固相捕获和检测。3.扩增DNA的分析方法关于扩增DNA的分析,已有多种方法介绍。其中一些方法有利于高产率的应用,而凝胶电泳则是不现实的,例如快讯高分辨HPLC技术(Katz和Dong)。但在一般情况下,用核酸探针筛选传染性病原的方法包括有一个单独的扩增后杂交步骤,以确保达到检测病原所需的特异性。这种检测方法之一是以亲和力为基础的杂交捕获技术(Holodniy等)。在这种方法中,用一种生物素标记引物作PCR。在扩增之后,双链产物经变性,然后与过氧化酶标记探针(与掺入有生物素标记引物的单链互补)杂交。然后将杂交产物放在缓冲液中培养,缓冲液盛于包裹有亲和素(或链霉亲和素)的表面中(如膜滤器、微孔、胶乳或顺磁珠)。包裹固态物与拟分析的PCR产物相接触,必须含有足够多的生物素结合位点,以便捕获到所有的自由的生物素标记引物,以及极低浓度的生物素标记PCR产物。对固态物冲洗3~4次以后,在含有过氧化氢的柠檬酸缓冲液与邻苯二胺共同培养,以检测结合杂交产物。另一种方法是通过探针包裹的表面来介导捕获,然后通过生物素标记引物和亲和素报告物酶结合物来进行基于亲和性的检测(Whetsell等)。4.其它方法本发明的病毒序列也可使用支链DNA探针,形成信号扩增检测方法的基础。支链探针(Horn和Urdea;Urdea)已被用来检测和定量稀有的RNA和DNA序列(Urdea等)。在这一方法中,用与目标RNA或DNA互补的序列来合成寡核苷酸探针(RNA、DNA或核酸类似物)。探针还含有一个或多个与目标RNA或DNA不能互补的独特支链序列。这一独特序列构成了供分支二级检测探针作杂交的目标,在二级检测探针中含有一个或多个其它的独特序列,作为三级探针的目标。在信号扩增的路径中的第一个分支点,不同的独特序列指引二级、三级等检测探针的杂交。在这一序列中的最后一个探针通常与一个用于检测的酶相连接(如碱性磷酸酶)。引物的顺序杂交最终形成一个高度分支的结构,其臂最终止于与酶连接的探针。酶促转化是最后一次扩增,选择高灵敏度的化学发光底物(如密执安州底特律市Lumigen公司的LumiPhes,作为一种碱性磷酸酶标记底物)可以达到所需的灵敏度,即每一测定初始目标序列在一万个分子或一万个以下。在这种检测方法中,扩增仅取决于分子杂交,而不是酶促反应,因而比PCR等方法更不易受临床样本中的抑制物的影响。因此,这种检测允许用较粗放的技术,在测试样品中有核酸释放,而不必在测定前作严格的提纯。本发明对病毒序列灵敏检测的扩增也可通过Q-β复制酶技术来完成(Cahill等;Lomell等;Pritchard等)。这一方法要设计一个与目标序列互补的特异性探针。然后通过标准的分子克隆技术将这一探针插入Q-β噬菌体的可复制RNA序列中。在复制子的特定区域插入并不能阻止Q-β复制酶的复制。作分子杂交及多次冲洗之后,加入复制酶,探针的扩增开始。“可逆目标捕获”是一种能减少因未杂交探针的复制而产生的背景的技术(Morrissey等)。扩增后的复制子可以用DNA、RNA或核酸类似物探针,通过常规分子杂交技术来检测到。其它用于扩增和检测稀有DNA和RNA的方法见于文献中。在分子诊断领域的一些应用中,这些方法要优于PCR方法。这些替代技术构成了对本发明揭示出的序列进行检测、定性(例如本文描述的序列的多个相关菌株和序列多样性,抗药性的基因型变化)或定量分析的基础。本发明的另一构成部分是测试体系或试剂盒,用于进行上述扩增/杂交实验。这种试验盒一般包括用于扩增反应的特异性引物或杂交探针。D.治疗用途以上所述,本发明的HGV抗原可用于制备疫苗。更进一步,针对本发明的多肽抗原所产生的抗体可用于被动免疫治疗或被动免疫预防。这类抗体可以与其它治疗注射用抗体相似的剂量进行注射。例如,在其它病毒性疾病,如狂犬病、麻疹和乙型肝炎的潜伏初期,可按每磅体重0.02~0.1ml的量注射γ蛋白,以干扰感染症状的形成。因此,与HGV抗原相反应的抗体可以单独或与其它抗病毒剂一起,被动注射到感染了HGV的宿主体内,以增强宿主对付感染的能力。本文公开的HGV序列将HGV确认为黄热病毒科的成员(见上)。黄热病毒科分为3个属黄病毒,鼠疫病毒(Petstiviruses)和丙型肝炎病毒属(Francki等)。所有的黄病毒属均含有一个正链RNA基因组,其长度为9.0~12kb,编码一条由3000~4000个氨基酸构成的单一长多肽。这一多肽经蛋白水解,分割成大约10个蛋白质,包括一个病毒衣壳蛋白、病毒被膜蛋白和至少5个非结构蛋白(NS)。非结构蛋白包括一个似胰凝乳酶丝氨酸蛋白酶、RNA解螺旋酶(NS3)以及一个依赖于RNA的RNA聚合酶(NS5)。黄病毒属的NS3蛋白是对病毒多肽进行蛋白水解所必需的。N5蛋白则是病毒基因组复制所必需的(Chambers等,1990)。此外,一些细胞蛋白也被确认参与到黄热病毒科的复制之中。例如,细胞信号肽酶是在几个酶切位点对病毒多肽进行酶切以及允许病毒蛋白酶进行表达所必需的(Hijkata等)。那些能够阻止这些蛋白在黄病毒复制中执行各自功能的抑制剂也可能对于治疗HGV感染有治疗价值。此外,细胞因子或其它已知有抗病毒活性和/或调节人体免疫系统作用的多肽对于治疗HGV感染也可能具有功效。有一种核苷酸类似物,1-B-D-呋喃核糖-1-2,4-三唑,3-羰酰胺(也称为三氨唑核苷,Patterson等),能够抑制黄热病毒科中依赖于RNA的RNA聚合酶,同时可望抑制HGV中NS5蛋白的活性。三氨唑核苷的作用方法被认为是参与排除细胞间鸟嘌呤池,并干扰病毒RNA的加帽反应(Patterson等)。在感染HCV的个体中,注射三氨唑核苷后可观测病毒滴度和血清中的丙氨酸转移酶(ALT,作为肝功失调的指示酶)水平均显著下降(Reichard等;DiBisceglie等,1992)。三氨唑核苷看起来对治疗黄热病毒科感染有广泛的功效,因此,对因HGV而造成肝部疾病的人注射三氨唑核苷,可望得到良好的结果。另一类已知对治疗黄热病毒科感染有效的化合物包括有,细胞因子干扰素α、干扰素β和干扰素γ(Baron等,Gutterman)。干扰素被认为通过下列起到抗病毒剂的作用,(i)诱导干扰病毒RNAs的复制和翻译的细胞蛋白的表达,和(ii)通过激活人细胞免疫体系的成员(Baron等)。干扰素对于治疗病毒性感染,包括HBV、HDV和HCV感染,有广泛的适用性(Gutterman,Farci等)。尤其是有许多研究已表明,干扰素在单独使用或与其它抗病毒治疗方法结合使用时,均对治疗丙型肝炎病毒感染有效(DiBisceglie等,1989;Kakumu等)。由于HGV具有明显的亲肝性质,而且属于黄热病毒科的成员,HGV感染可望对类似的干扰素治疗作出反应。另一类具有显著抗病毒活性的化合物是病毒蛋白酶抑制剂(Krausslich等)。所有的黄热病毒科均编码一个似胰凝乳酶丝氨酸蛋白酶,这一酶是对基因组多肽的非结构区进行多位点切割所需的。构成这一蛋白酶切位点的氨基酸残基已被清楚描述,包括一个组氨酸,一个天冬氨酸和一个丝氨酸残基(Grakoui等)。对黄病毒和黄热病毒的进一步研究表明,这一活性位点中丝氨酸的突变可阻止病毒复制(Chambers等,1990b)。HGVNS3抑制剂可以设计为模仿酶切割的转换状态。也可以从已有的合成化合物中广泛筛选出这种抑制剂。选出的HGVNS3蛋白酶抑制剂的活性可以通过体外转录/转译体系来确定,这一体系已广泛用于黄热病毒科的研究中(Hijikata等;Grakoui等)。另外,可以将HGV基因组克隆到适合于真核蛋白表达的载体中去,如杆状病毒或痘苗病毒,在组织培养体系中确定化合物的功效(Grakoui等)。采用这种方法,已成功地获得了HIV蛋白酶的有效抑制剂(Vacca等;Roberts等)。另一种治疗因HGV感染造成疾病的方法依靠合成编码本发明提出的HGV序列片段的反义核苷酸(TonkinsonandStein)或寡核苷酸类似物。与黄热病毒科内所有病毒相同,HGV基因组是一条正链RNA分子,大小为9~12kb。病毒基因组为一条单链,因此,HGV对反义寡核苷酸极为敏感。可用来抑制病毒复制的可能的目标序列包括HGV5’端未转译区,HGV核糖结合位点或其它可能干扰HGV转译的序列。反义寡核苷酸可以通过商用合成仪来合成。优选采用二硫代磷酸酯骨架来合成寡核苷酸,这样更有利于抵抗核酸酶切(Marshall&amp;Caruthers)。此外,也可采用其它的寡核苷酸类似物,如那些未荷电或酰胺型骨架(Egholm等)。这些寡核苷酸有商业供应(Biosearch,Millipore,Bedford,MA),由于它们不带电荷,故能很好地与生物膜杂交,而生物膜一般会阻止带电荷大分子的通过。寡核苷酸(或其类似物)在反义应用时,一般长度大于8个核苷酸,以便于与HGV基因组内的目标序列杂交。例如,当DNA寡聚体与病毒RNA目标序列杂交时,杂交复合物能被RNAseH这样的细胞酶所分解。然后,HGV模板的减少将减轻HGV导致的疾病的严重性。上述治疗方法的实用性和功效可以通过在体外使用上述细胞体系和在体内使用上述动物模型体系而作出评价。下面的实施例将说明本发明,但绝不是限制本发明。材料和方法利用商品上可购得自动寡核苷酸合成仪制备合成的寡核苷酸接头和引物。也可以从商业公司购买用户设计的合成寡核苷酸。标准的分子生物学及克隆技术基本上按Ausubel等,Sambrook等和Maniatis等描述的方法进行。与采用抗血清和/或抗体来筛选和检测免疫反应蛋白抗原相关的常规操作基本上按所述的进行(Harlow等)。同样,在检测抗病毒抗体时用的ELISA和Western印迹。按其生产厂商(北芝加哥Abbott公司或新加坡GenelabsDiagnostics公司)提供的方法或采用本领域已知的常规技术进行(Harlow,等)。实施例实施例1构建PNF2161cDNA文库A.从血清中分离RNA在1毫升未稀释PNF2161血清中添加PEG(分子量为6000)至8%,在4℃条件下以12K离心15分钟,产生沉淀。按Chomczynski描述的基本方法,从获得的血清沉淀物中提取RNA。沉淀物用含4M异硫氰酸胍,0.18%2-巯基乙醇和0.5%十二烷基肌氨酸钠的溶液处理。处理后的沉淀物再用酸性苯酚氯仿抽提数次,用乙醇来沉淀RNA。这一溶液在-70℃静置约10分钟,然后用微量离心管在4℃离心10分钟。获得的沉淀物再用100μlDEPC(焦碳酸二乙酯)处理水和10μl3MNaOAc(pH5.2)作混悬,然后在溶液中加入2份100%乙醇和1份100%异丙醇。将溶液在-70℃下静置至少10分钟。在5℃下以12000×g离心15分钟,得到RNA沉淀物。沉淀物用70%乙醇冲洗,然后真空干燥。B.合成cDNA(1)第一链的合成cDNA分子的合成按下述方法完成。按Gubler等的方法,用随机核苷酸六聚体引物(cDNA合成试剂盒,BMB,Indianapolis,IN或GIBCO/BRL)将上述RNA制备物转录为cDNA。在第二链cDNA合成之后,将T4DNA聚合酶添加到混合物中,使cDNA分子的平端数达到最大。反应混合物在室温下培育10分钟。反应混合物用苯酚/氯仿和氯仿异戊醇抽提。添加2份100%乙醇,在-70℃下冷却15分钟,使cDNA沉淀出。通过离心收集cDNA,沉淀物用70%乙醇冲洗后,真空干燥。C.双链cDNA分子的扩增cDNA沉淀物用12μl蒸馏水再悬浮。在cDNA悬浮液中加入5μl磷酸化接头(接头AB,这是一条由SEQIDNO1和SEQIDNO2组成的双链接头,其中SEQIDNO2相对于SEQIDNO1处于3’至5’方向,是与SEQIDNO1部分互补的序列),2μl10×连接缓冲液(0.66MTris-HCl,pH7.6,50mMMgCl2,50mMDTT,10mMATP)和1μlT4DNA连接酶(0.3到0.6Weiss单位)。通常,cDNA和接头按1∶100的比例混合。反应在14℃下温育过夜。次日早晨将反应液在70℃下温育3分钟,使连接酶失活。在100μl含1.5mMMgCl2和500mMKCl(缓冲液A)的10mMTris-Cl缓冲液(pH8.3)中,加入约1μl接头连接cDNA制备物,2μM带有如SEQIDNO1所示序列的引物,dATP、dCTP、dGTP和dTTP各200μM,2.5单位栖热水生菌(thermusaquaticus)DNA聚合酶(Taq聚合酶)。反应混合物加热至94℃,经30秒变性,降温至50℃,持续30秒,使引物退火,然后加热至72℃,经0.5~3分钟,通过Taq聚合酶使引物延伸。由连续加热、降温和聚合酶反应构成的扩增反应借助于Perkin-ElmerCentusDNA热循环仪,重复进行25-40次(Mullis;Mullis等;Reyes等,1991;Perkin-ElmerCetus,Noralk,CT)。在扩增反应之后,用苯酚/氯仿,氯仿/异戊醇对溶液作抽提,然后用2份乙醇沉淀。获得的扩增cDNA沉淀物再悬浮于20μlTE(pH7.5)中。D.将cDNA克隆到λ载体中用于构建cDNA的接头含有一个EcoRI位点,可将扩增cDNA直接插入λ-gt11载体(Promega,MadisonWI或Stratagene,LaJolla,CA)。λ载体可以从厂商(Promega)处采购,它已经用EcoRI消化过,并用碱性磷酸酶处理,以去掉5’磷酸,防止载体的自身连接。将EcoRI消化过的cDNA制备物连接到λ-gt11(Promega)上。连接反应的条件如下1μl载体DNA(Promega,0.5mg/ml);0.5或3μlPCR扩增的插入cDNA;0.5μl10×连接缓冲液(0.5MTris-HCl,pH7.8;0.1MMgCl2;0.2MDTT;10mMATP;0.5mg/ml牛血清白蛋白(BSA);0.5μlT4DNA连接酶(0.3至0.6Weiss单位))。最后,添加蒸馏水,使最终反应液容量达到5μl。连接反应液在14℃下培育过夜(12-18小时)。用λDNA包装体系(“GIGAPAK”,Stratagene,IaJolla,CA),通过常规方法对连接上的cDNA作包装,然后分装成不同的浓度,以确定滴度。采用标准的X-gal蓝/白试验来确定文库的重组频率(Miller;Maniatis等)。每一文库的重组率也可按下列方法来确定。选择一些随机克隆,分离出相应的噬菌体DNA。然后,以分离的噬菌体DNA作模板,从cDNA分子的EcoRI插入位点处的侧翼λ序列中得到的λDNA序列作引物,进行聚合酶链式反应(Mullis;Mullis等)。对PCR产物作电泳分析,即可判断是否存在插入片段。从血清样品PNF2161产生的插入cDNA的噬菌体文库已保藏在美国典型培养物保藏中心,12301ParklawnDr.,Rockville,MD20852,并且保藏登记号为ATCC75268(PNF2161cDNA信息库)。实施例2重组文库的免疫筛选对实施例1中产生的λ-gt11文库进行免疫筛选,确定是否有可由PNF2161血清识别的抗原的产生。这些文库由PNF2161血清产生的。使用埃希氏大肠杆菌接种株E.coliKM392,对噬菌体作平板培养,以形成噬菌斑。也可以使用E.coliY1090R(Promega,MadisonWI)。按Ausubel等描述的基本方法,用血清抗体对λ-gt11克隆表达的融合蛋白进行筛选。按每150mm平板约2×104个噬菌体对每一个文库进行平板培养。平板上覆盖硝化纤维素滤膜,过夜。滤膜用TBS(10mM,TrispH7.5;150mMNaCl)清洗,用AIB(TBS缓冲液,含1%明胶)封闭固定,然后在AIB中稀释100倍的初级抗体作培养。用TBS冲洗后,滤膜用次级抗体和结合了碱性磷酸酶的羊抗人IgG(Promega)进行培养。用一个底物(如BCIP,5-溴-4-氯-3-吲哚-磷酸盐),用NBF(氮蓝四唑盐(Sigma))形成反应噬菌斑。初级筛选所得的阳性区再被涂板和免疫筛选,直到获得纯噬菌斑为止。实施例3筛选PNF2161文库λ-gt11中PNF2161的cDNA文库按实施例2的方法,用PNF2161血清作筛选。筛选的结果列于表1中。表1PNF2161文库1.由所示人源构建的cDNA文库;2.在所示λ-gt11文库中重组克隆的比例,通过蓝/白噬菌斑试验确定,并经过对随机抽样克隆作PCR扩增进行确认;3.对每一所示文库作免疫筛选时用的抗血清来源。通过上述筛选分离出的克隆之一(PNF2161克隆470-20-1,SEQIDNO3;β-半乳糖苷酶码框内融合转译序列,SEQIDNO4)被用来产生延伸克隆,如实施例6所示。克隆470-20-1核酸序列被列为SEQIDNO3(蛋白质序列SEQIDNO4)。不用SISPA克隆接头分离出的核酸序列被列为SEQIDNO19(蛋白质SEQIDNO20)。实施例4免疫反应470-20-1克隆的鉴定A.免疫反应克隆的Southern印迹对免疫反应克隆的插入片段作筛选,测定其与下列对照DNA杂交的能力人外周血正常淋巴细胞(购自斯坦福大学血库,Stanford,CA)DNA和大肠杆菌KM392基因组DNA(Ausubel等;Maniatis等;Sombrook等)。用EcoRI和HindIII对10μg人淋巴细胞DNA和2μgE.coli基因组DNA进行消化。限制性消化产物在琼脂糖凝胶上作电泳分离(Ausubel等),并按产品说明,转移到尼龙膜或硝酸纤维素膜(SchleicherandSchuell,Keene,NH)上。按下述方法从免疫反应克隆中制备探针。使用对应于λ-gt11序列(处于gt11载体EcoRI克隆位点的侧翼)的引物,对每一个克隆进行扩增。以每一个免疫反应克隆作为模板,通过聚合酶链式反应进行扩增。所获扩增产物用EcoRI进行消化,扩增片段作凝胶纯化,并从凝胶上提取出来(Ausubel等)。然后,所获扩增片段(来自免疫反应克隆)用商品化试剂盒(BMB),通过32P-dNTPs作随机引物标记。然后,将随机引物标记的探针杂交到上述制备的尼龙膜上,以检测插入序列是否杂交到对照DNA上。470-20-1插入片段不会与任一个对照DNA杂交。作为阳性杂交对照物,从人的C-K基因片段(Hieter)中得到的一个探针被用作人类DNA的单基因拷贝对照物,而同样将一个大肠杆菌聚合酶基因片断用作大肠杆菌DNA的对照物。B.基因组PCRPCR检测首先是用作鉴定一些基因组DNA的外源性,这些基因组DNA在构建文库时可能因疏忽大意而发生克隆错误,其后,PCR又被用来检验在克隆来源和其它有关样品中是否存在克隆序列。一些不同类型的样品可被作检验,如SISPA扩增的核酸,从主要样本来源中提取的核酸,以及从有关来源材料(如从动物传代研究中)中提取的核酸。“基因PCR”这一术语是指检测在有关生物体的基因组中是否存在特定的序列。例如,对口鬃来源克隆的基因PCR包括的基因组DNA如下1.人DNA(1μg/rxn.)2.口鬃DNA(0.1-lμg/rxn.)3.大肠杆菌(10-100ng/rxn.)4.酵母(10-100ng/rxn.)人和口鬃DNA作为直接的和最终的病原体来源进行检验。对大肠杆菌基因组DNA,作为商业酶制剂的一种经常污染物,进行了检测。也对酵母进行检测,作为无所不在的生物,即DNA能污染试剂,因此而被克隆。此外,也扩增一个阴性对照(即仅有缓冲液或水)和包括大约105/rnx.的阳性对照。扩增反应条件的变化,根据特定序列来确定,但是严密地遵循下列标准的PCR规则PCR是在反应液中进行的,每100μl的此反应液含有10mMTris,pH8.3,50mMKCl,1.75mMMgCl2,每一种引物1.0μM,dATP、dCTP和dGTP各为200μM,dUTP为300μtM,2.5单位TaqDNA聚合酶,和0.2单位尿嘧啶-N-糖苷酶。循环是在94℃至少1分钟,而后30-40次重复变性(92-94℃,15秒钟)、退火(55-56℃,30秒钟)和延伸(72℃,30秒钟)。PCR试剂的配制,以及扩增反应的建立都是在保证没有扩增DNA的一个特别设计的实验室中进行的。为了进一步阻止扩增序列的污染造成的试验的“假阳性”结果,该PCR是用dUTP代替TTP进行,使得扩增序列从生化上区别于天然DNA。为了酶促提供不可扩增的任何污染的PCR产物,在所有的PCR反应中包括了尿嘧啶-N-糖苷酶。一旦热循环结束,反应保持在72℃,防止尿嘧啶-N-糖苷酶的复性和扩增的含U序列的可能降解。利用标准技术(“AMPLIWAX”,Perkin-ElmerBiotechnology;或者使用手工技术),进行“HOTSTARTPCR”,以使上述一般规则对种类不同的序列扩增更有活力,这是理想地要求不同的扩增条件有最大的敏感性和特异性。对扩增DNA的检测,是通过它和特异寡核苷酸探针杂交,该探针定位在两个PCR引物序列的内部,并和两引物没有或有很小的重叠。在有些情况下,利用溴化乙锭荧光,直接可看到电泳的PCR产物,但每次都要进行探针杂交,以确定特异和非特异扩增产物间的区别。在溶液中和放射性探针杂交后在8-15%的聚丙烯酰胺凝胶(根据扩增序列的大小调整浓度)中电泳,接着放射自显影。利用基因组PCR,抗人、大肠杆菌和酵母的DNA,检测克隆470-20-1。在阴性对照反应中没有检测到特异序列,也没有在任何检测的基因组DNA中,和有105拷贝的DNA(导致易检测的信号)的反应中检测到。这种敏感性(105/反应)对含有1μg总DNA的反应中检测人的单拷贝序列是合适的,代表大约1.5×105个细胞中的DNA。C.直接对血清进行聚合酶链式反应(PCR)利用经过选择的克隆序列作引物进行聚合酶链式反应(PCR),对血清以及其它的克隆来源或相关来源的物质直接进行测验。在这些实验中,用聚乙二醇(PEG)直接从血清中沉淀HGV病毒颗粒,或者利用超速离心法从PNF和其它确定的血清中沉淀病毒颗粒。为了纯化RNA,将沉淀物溶解于硫氰酸胍中,再用酸性胍苯酚进行提取(Chomczynski等)。另一种选择是将上述方法作以改动,利用一些商品试剂(如“TRIREAGENT”(MolecularResearchCenter,Cincinnati,OH)或“TRIZOL”(LifeTechnologies,Gaithersburg,MD)和相关流程分离RNA。此外,通过利用“PURESCRIPT”试剂及流程(GentraSystems,Minneapolis,MN)在事先不进行病毒颗粒的沉淀和浓缩的情况下,直接从血清或其它含病毒的液体中分离出适于作PCR分析的RNA。分离出的DNA被直接用作PCR的模板。对RNA利用反转录酶(Gibco/BRL)进行反转录,其cDNA产物便可作为随后PCR扩增的模板。在为470-20-1时,把从等量的PNF血清中(每份约20~50μl)提取的核酸作为输入模板加入到每一个逆转录-聚合酶链式反应(RT-PCR)或聚合酶链式反应(PCR)中。引物设计是基于470-20-1序列基础上的,具体如下470-20-1-77F(SEQIDNO9)和470-20-1-211R(SEQIDNO10)。利用MMLV-RT(Gibco/BRL)和随机六聚体(Promega)进行逆转录反应,需要在室温下温浴约10分钟,42℃下15分钟,99℃下温浴5分钟,然后迅速冷却到4℃。合成的cDNA可以不经纯化直接进行PCR扩增,每100μl反应液中含有1.75mMMgCl2,每种引物0.2~1μM,每种dATP、dCTP、dGTP和dTTP均为200μM以及2.5-5.0单位的TaqDNA聚合酶(“AMPLITAQ”,Perkin-Elmer)。利用“GENEAMPSYSTEM9600”热循环仪(Perkin-Elmer)或在相当的循环条件下利用其它的热循环仪(Perkin-Elmer;MJResearch,Watertown,MA),将循环反应在94℃下至少进行一分钟,循环过程重复40~50次,变性(94℃下15秒钟循环10次;92℃或94℃下后续的循环需要15秒钟)、退火(55℃30秒钟)和延伸(72℃30秒钟)。阳性对照由以下组成(i)预先扩增的PCR产物,已利用Hoechst33258荧光分析法对其浓度进行了估计,(ii)纯化了的包含目标DNA序列的质粒DNA,(iii)纯化了的RNA转录物[来自质粒克隆,这种质粒已将目标DNA置于噬菌体RNA启动子的控制之下(如T7,T3,或SP6)和利用商用体外转录试剂盒得到的RNA。此外,可将对应于约10~100拷贝/rxn.的一等份阳性对照DNA掺加到有从源样品的克隆物中提取出的核酸参加的反应中,来控制DNA扩增反应抑制剂的产生。每一份分离提取物的测定至少要使用一个阳性对照。通过与特异性寡核苷酸探针470-20-1-152F(SEQIDNO16)的杂交来确定产物的特异性。用20μl包括约1×106cpm32P标记的470-20-1-152F的反应液与10μlPCR产物进行杂交。利用聚丙烯酰胺凝胶电泳分离特异的杂交片段与未杂交的寡核苷酸,然后进行放射自显影。除了PNF之外,从正常血清中提取的核酸也可利用“血清PCR”流程序列进行逆转录和扩增。在正常人的血清中未探测到任何信号。应用470-20-1特异引物,在PNF血清的多份提取物中都能重复探测到特异信号。D.对不依赖于序列的单引物扩增(SISPA)未克隆的核酸进行扩增用SISPA扩增的cDNA作模板(实施例1)。利用经选择的克隆序列来设计序列特异的引物,被用于扩增模板中的目标DNA片段。典型地,在克隆操纵中,用SISPA扩增的样品作模板。例如,扩增引物470-20-1-77F(SEQIDNO9)和470-20-1-211R(SEQIDNO10)是从克隆470-20-1序列(SEQIDNO3)中选出的。这些引物用于以SISPA扩增的PNF2161cDNA为模板的扩增反应中。可通过以下手段对扩增的DNA片段进行识别(i)用特异性的寡核苷酸探针470-20-1-152F(SEQIDNO16)作杂交探测,这种探针是基于470-20-1序列(SEQIDNO3)设计的。和/或(ii)根据片段的大小识别。应用于DNA印迹探测的探针应根据厂商的推荐(BMB)利用末端转移酶作地高辛标记。然后,可用Southern印迹或液体杂交分析法(Kumer等)对扩增的DNA作杂交分析。用于扩增反应的阳性对照DNA是预先扩增的CPR产物,其浓度可用Hoechst33258荧光分析法或用纯化的含有目标插入序列的质粒的方法进行测定。对SISPA扩增的PNF2161进行PCR扩增,所得cDNA中可探测到470-20-1特异性信号。同时,还可探测到阳性对照DNA模板,而阴性对照反应并未发生。E.对肝的RNA样品进行扩增采用Cathal等的方法从肝的活组织检查材料中制备RNA,其中组织的提取是在5M的硫氰酸胍溶液中用4M的LiCl直接沉淀进行的。用2M的LiCl溶液洗涤RNA沉淀,再用苯酚氯仿萃取以除去蛋白杂质,最后用乙醇再回收RNA。470-20-1特异性引物也可用于以下述RNA来源作底物的扩增反应正常的口鬃肝RNA,正常的tamarin(SanguinusLabiatus)肝RNA和MY131肝RNA。MY131是一种用静脉注射接种1mlPNF2161血浆的口鬃。肝酶(SCID)含量明显上升,病毒感染已引起明显的组织学变化。组织学相关在MY131的肝中表现得最明显,MY131的肝取自SCID活性最高或接近最高时。用HCV的非编码引物(SEQIDNO7和SEQIDNO8),MY131的肝RNA不能产生扩增产物。进行两个试验,重复每个试验的扩增反应,扩增反应结果见表2。表2用470-20-1引物作PCR</tables>这些结果表明470-20-1序列存在于亲本血清样(PNF2161)和来自PNF2161样品的传代动物(MY131)的肝RNA样品中。可是,两种对照RNA都呈现470-20-1序列阴性。F.用RNA作模板通过PCR从一系列血清中筛选HGV序列1.高丙氨酸转氨酶(HIGH-ALT)供体利用HGV特异性引物,通过PCR对来自肝炎病人和肝功不正常的献血者血液的血清进行筛选来评估HGV和肝病的疾病相关性。后者由来自捐献血液的血清组成,这些捐献血液的每毫升血清中ALT水平都高于45国际单位(IU)。选择一个由152种全血清组成的血清序列。下面血清选自血清系列104个高丙氨酸转氨酶(High-ALT)血清[从斯坦福大学血库(SUBB)中筛选出];34个N-(ABCDE)肝炎血清(来自北加利福尼亚,埃及和秘鲁);14个来自怀疑患有肝病或肝炎病毒感染者的血样。本系列血清的阴性对照如下9个经过高度筛选不含病毒感染危险因子的献血者的血清(SUBB)(“极正常”血清,如O-阴性;RH-阴性;对HIV,已知的肝炎病原体和CMV都呈阴性;以前经过多次输血都未引起疾病的捐献血液);和2个随机献血者的血清。这些血清通过利用470-20-1引物77F(SEQIDNO9)和211R(SEQIDNO10)进行RT-PCR来分析是否存在HGV特异性序列。如实施例4C所述,必须进行RNA提取和RT-PCR反应,除非引物470-20-1-211R被5’-生物素化以促进对扩增产物进行快速筛选,这种筛选方法涉及溶液杂交和利用链霉亲和素包裹的顺磁玻璃珠进行亲和性捕获。用特异性的标记探针和杂交序列通过亲和互作所得的捕获物进行杂交来分析核酸的方法在核酸分析领域中是众所周知的。用于每个RT/PCR反应的RNA可来自30-50μl的血清中,这取决于所能得到的用于血清测验的血清数量。对每份血清都设置重复实验,每个反应的阳性对照分别对应于RNA转录物的10、100或1000个拷贝,还有适当的阴性对照(缓冲液)。阴性对照都没有活性,并且在每个PCR过程中每个反应至少可探测到10个拷贝。当特异性的杂交信号只出现在两个重复反应的某一个之中时,所得到的结果是不确定的。使用专门为应用电化学发光的寡核苷酸探针(QPCR系统5000TM,Perkin-Elmer)进行亲和性杂交捕获设计的仪器,可对这一系列血清的扩增产品进行有效的、高敏性的分析。对利用QPCR-5000TM的方法早已被描述(Dicesare等)。通过与探针470-20-1-152F(5’端用电化学放光的钌螯合物标记)杂交并应用“QPCR5000”仪器对每个反应的产物进行分析。在一个给定的扩增过程中,若截断点(cutoff)确定在阴性对照的平均数加三个标准差处,那么确证实验要选择34个可能的阳性对照。采用溶液杂交和电泳(实施例4C)对34个样品进行分析。这34个样品中,有6种血清(即6/152)在重复反应中都发现有特异性的杂交序列。在这6个样品中,有三个与阳性对照相比具有强烈活性一种是来自SUBB含高丙氨酸转氨酶的血清,另两种是采自埃及的N-(ABCDE)血清。在采集了第一个样品之后一年,又从高阳性的SUBB血清供给处采得第二个血样,通过上述的PCR方法确定第二个血清样品呈HGV阳性。这一结果证实在某一人体中HGV感染仍在继续。把这种血清被称为“JC”。进一步确定,血清供给者呈HCV阴性(通过血清学反应测验和PCR确定)和HAV、HBV抗体阴性。此外,用这种方法测定一个来自埃及的第三个N-(ABCDE)血清样、一个北加利福尼亚患N-(ABCDE)肝炎的献血者的血清样和一个N-(ABCDE)肝炎血清样,结果也都表现出微弱阳性。其它的两份血清结果不确定,因为在两个扩增反应中只有一个发现有特异性序列存在。随后再从这些HGV阳性和结果不确定的血清中取等份血清作PCR分析,结果8份被测定的血清中6份呈HGV阳性,另两份不确定。用另一套引物对HGV阳性样品继续确证。用作诊断扩增的这套引物(GV57-4512,SEQIDNO121和GV57-4657MR,SEQIDNO122)是从一个HGV保守区中选择出的,该保守区存在于假定的NS5编码区内。对5种HGV分离物都扩增出约2.2kb的片段。用于扩增反应的引物是470EXT4-2189R(SEQIDNO119)和470EXT4-29F(SEQIDNO120)。对扩增的DNA片段进行测序和序列对比。通过对比找到了高度保守区,同时,也设计出了在5个序列的共有变异区可掺入混合碱基合成的最适引物序列。得到的NS5引物如下GV57-4512MF,SEQIDNO121和GV57-4657MR,SEQIDNO122。这些引物可用于从试验样品中扩增出165bp的诊断片段。从另一个高度保守区中又衍生出一个内部探针序列GV22dc-89MF(SEQIDNO123),此探针可用来探测特异性的扩增的产物。要在不严格的条件下探测最小的HGV变异序列,则要求探针必须足够长。象在应用470-20-1引物(实施例4C)时一样,对样品进行诊断性的NS5序列分析,也要在相同的条件下进行样品的制备、扩增和溶液杂交。对血清样品应用470-20-1引物对和NS5引物对进行PCR分析所得结果的一致性见表3。表3</tables>从上面所述的8个HGV阳性血清中再取额外等份用470-20-1引物系列(SEQIDNO9和SEQIDNO10)和NS5引物系列作进一步的PCR分析。在这些分析中,8个血清样中有5个呈现一致性的HGV阳性。结果见表4。相对地,两个随机献血者或9个经高度筛选的“极正常”血清在每一种PCR分析中都呈HGV阴性。这些结果进一步说明了肝病产生和HGV病毒间存在着联系。表4对高丙氨酸转氨酶献血者的血清作进一步测定。除了上述最初的血清系列中所包括的104种血清之外,总共又测定了495个血清样品,其结果如下在这495个样品中,利用470-20-1-77F(SEQIDNO9)和470-20-1-211R(SEQIDNO10)引物对进行测定发现其中6个呈HGV阳性。这6种血清有如下的HCV分布R25342,HCV阴性;R17749,HCV阳性;J53171,HCV阳性,HBV阳性;J54406,HCV阴性;R08074,HCV阴性;和X31049,HCV阴性。阳性结论都是在至少两个独立反应中都出现阳性重复的基础上作出的。应用NS5引物对通过PCR确证R25342呈阳性。因此,检出率约为1.2%(599个测定样品中有7个阳性)。从高丙氨酸转氨酶献血者身上获得的新血浆样品也来自SUBB,Peninsula血库(Burlingame,CA)和纽约血液中心(NewYork,NY),对这些样品也将通过PCR(470-20-1引物对)检测HGVRNA。总共测定了214个样品,有5个(约2.3%)呈HGVRNA阳性。这5种血清的HCV分布如下T55806,HCV阳性;T55875,HCV阴性;T56633,HCV阴性;R38730,HCV阴性;3831781,HCV阴性。随后又从这些献血者中的两个人身上采得的样品T55806和T55875也呈HGV阳性。利用NS5引物对通过PCR确认T55806、T55875和T56633呈阳性。2.对所接受的捐献血样进行筛选为了评估HGV在正常献血人群中的流行情况,在SUBB从筛选出的为输血献血的人中收集血清。总共有968个样品,代表769个独立的献血者,用于HGVRNA检测。应用470-20-1引物对通过PCR对所获样品进行筛选。总共有16个血清样被鉴定为具有可检测的HGVRNA。其中,有6个是来自3个献血者的含重复样品,这样通过RNAPCR在769个献血者中检测出13个呈HGV阳性。对所有的阳性样品再利用NS5引物对进行PCR检测确认也呈阳性。这些献血者血液中ALT水平正常,其它的血清学指标也正常。因此,在正常的献血人群中,被测血清的阳性检出率为1.7%。所以,在接纳的和被排除的献血者中都探测到了HGV的存在。3.从在不同地域居住的人群中采样通过PCR评估HGV在地区来源广泛的肝炎患者中的感染情况。本质上如实施例4C中所描述,应用470-20-1PCR引物进行PCR反应。对来自埃及、希腊、澳大利亚(见实施例4F-4)、秘鲁、英格兰、意大利、德国、南韩、美国和日本的血清样品进行测定,在所有的被测群中都探测到有HGVRNA的存在。4.输血后HGV感染和非肠道性传播在几个输血后的肝炎病例(来自日本和欧洲的病人包括在实施例4F-3)中都检测出HGVRNA。在总共4个病例中,一个来自日本,两个来自美国,另一个来自澳大利亚。对他们进行多个时间点的HGVRNA存在性分析,其中3例(i)可获得病人输血前血样以确定病人以前的HGV状况。(ii)可获得为三位病人献血的人的血样,用于确定供血者的HGV状况。第一例是一个日本病人,在1980年12月2日输血。输血后患了非乙、非丙型肝炎。从此病人身上采5份血清样,应用470-20-1引物对通过PCR检测HGVRNA。在其输血后两周到8个月期间都能在其血清中探测到HGVRNA存在。一个在输血超过一年后采的样品检测结果是不确定的(即只在一个重复反应中呈现阳性)。由于没有获得该病人输血前的血样,故未能进行输血前的HGVRNA检测。BIZ和STO病例(分别见表5、表6)来自一个在NIH进行的预料中的心脏外科研究(Alter等,1989)。对于每一个病人,可得到输血前的血清,并被运用470-20-1引物对通过PCR确定为HGVRNA阴性。从输血后第一天至输血后第198周,BIZ被测试为HGVRNA阳性,在总共9个BIZ的血液捐献者中,8个中的2个受试者被发现为HGV阳性。从输血后第5周至输血后第92周,STO被测试为HGVRNA阳性。表5与输血相关的HGV传染病例BIZ</tables>表6与输血相关的HGV结果病例STO</tables>第四种情况也被预期地限定,是一个参加在澳大利亚悉尼进行的输血后肝炎研究的心脏外科手术的病人,该病人(PA-124)没有其它可识别的危险因素,在外科手术期间接受了14个单位的血液(4个单位浓集(packed)的红细胞,10个单位的血小板)。在这14个单位中,一个为HGV阳性;其它13个为HGV阴性。除开活性的HCVEIA(第一个产生试验),14个血液捐献者的HBV和HCV血清学为阴性。没有其它的HCV试验证实阳性结果。在病人PA-124(表7),首先用手术后两周得到的样品增加血清ALT,在14周期间,至少十次观察到为手术前的水平。对来自PA-124的输血前,4周和8周的血清进行的HCV的CPR结果均为阴性。使用470-20-1PCR引物试验该病人血清的HGVRNA。输血前的样品为HGVRNA阴性。阳性的结果被证实在输血后,与ALT增加同时以及接着发生。在输血后一年检测出了HGVRNA的存在。这些数据支持了HGV可以经胃肠外传染的结论。表7与输血相关的HGV传染病例PA-124除开预先限定的输血后传染的情况外,HGV感染的另外的情形被鉴定在限于多次输血和静脉内药物使用(IVDU)的危险人群。(表8)。表8被编码的血清的HGVRT-PCR检测选择的肝炎和胃肠外危险组在100个多发性输血的镰状细胞性贫血和地中海贫血的病人中,19个(19%)被发现具有可测的血清HGVRNA。同样,49个中的9个血友病病人(18%)为470-20-1和NR5引物HGV阳性。值得注意地,54个中的15个(28%)IVDU被发现为对HGVRNA呈PCR阳性。这些胃肠外危险人群的感染比率(18-28%)看来比带有增加的ALT的血液捐献者的比率(1-2%)要高。这些结果增强了HGV传染的胃肠外途径的显著性。5.被选择的肝炎病人群的PCR筛选用聚合酶链反应测试来自急性和慢性肝炎、肝细胞性癌、HBV感染或HCV感染的病人的血清中的HGV的存在(数据示于表8中)。在每一组来自患肝病的病人的样品中,证实了HGV阳性样品(除开来自具有自身免疫性肝炎和初级胆汁肝硬变病人的样品,这两种情况不被认为仅仅与感染原有关)。如来自输血后肝炎病人的血清收集品所示(实施例4F-4),HGV感染建立于急性肝炎期间,但循环病毒RNA在慢性感染估计为数月至数年的期间中仍旧被检测到。在带有HBV和HCV感染的病人中观察到约10-20%的共感染比例。因此HGV感染被表明与被或不被其它肝炎病毒共感染的肝炎有关。共感染可能反映了这些肝炎病毒的类似危险因素和传染途径。如上面所提到的,在胃肠外危险人群中,具有较高的HGV流行,例如血友病,IVDU和多发性输血的贫血病人(与其它肝炎危险人群相比)。6.人的持久性HGV感染输血后肝炎病例BIZ、STO和PA-124被表明在输血和急性感染后的分别长达3.8,1.8和1.0年的时间仍具有PCR可检测的病毒RNA。在原始阳性样品(实施例4F-1)之后1年和1.5年,从献血者JC得到另外的血清样品。这些跟踪血清样品也为HGV阳性。来自其它高ALT献血者(T55806,T55875,R25342),在最初检测到HGV感染的血清样品之后几个月所获得的其它血清也为阳性。类似地,当HGV感染建立在实验灵长类动物(CH1356,实施例4H)时,在接种后长于1.5年时,检测到HGVRNA。这些数据证实了人和实验灵长类动物中的持久的HGV病毒血症(viremia)。G.用于序列测定的来自病人RNA的长片断的扩增为了获得不同的HGV分离株的序列信息,用PCR引物来扩增HGV基因组的一些信息区域。引物470EXT4-2189R(SEQIDNO119)和470EXT4-29F(SEQIDNO120)用来扩增含有原始470-20-1序列的2.2kb片断。使用“SUPERSCRIPTII”逆转录酶(Gibco/BRL,Gaithersburg,MD)逆转录来自于样品的RNA。使用有效大范围PCR试剂(“XLPCRBUFFERS”和“rTth-XL”,PerkinElmer/AppliedBiosystemDin.,FosterCity,CA)扩增产生的cDNA。如果在琼脂糖凝胶电泳中检测到正确大小的带,扩增反应被认为阳性。通过扩增产物的初步DNA序列测定,样品被证实为阳性。通过这个扩增方法,下面血清样品被检测为HGVRNA阳性PNF2161;R10291(JC);和每一个来自北美,埃及,和日本人群的样品。然而没有阳性样品从来自秘鲁人血清的样品中检测出来。多种HGV阳性样品的成功扩增证实了通过使用上面讨论470-20-1引物对的PCR扩增所得到的结果。然而未能获得扩增可能反映出不良的RNA性质或低的拷贝数或分离株之间的局部序列差异,致使选择的引物组不能普遍地发挥作用。为了获得HGV基因组的推断的5’-非翻译区的序列信息,用引物扩增来自5’-非翻译区(基于HGVPNF2161-变异体)的片段。两片段通过下面引物组确定FV94-22F(SEQIDNO124)和FV94-724R(SEQIDNO125),提供728个碱基对片段,以及FV94-94F(SEQIDNO126)和FV94-912R(SEQIDNO127),提供847个碱基对片段。使用刚才描述的启动有效的大范围PCR的条件。只要另外证实样品中HGVRNA的存在,可从大多数测试样品中获得产物。H.HGV对灵长类动物的感染性用PNF1261接种两个黑猩猩(称为CH1323和CH1356),六个恒河猴(cynomolgus)(CY143,CY8904,CY8908,CY8912,CY8917和CH8918)和六个口鬃(Mystax)(MY29,MY131,MY98,MY187,MY229,MY254)。用接种前和接种后的血清监测ALT和HGVRNA序列的存在(通过PCR筛选确定,如上所述)1个恒河猴(cynomologous)(CY8904)显示出阳性RNAPCR结果(接种后39天)和总共17个分离血液提取物显示不确定结果。在1个称为CH1356的黑猩猩中,通过RT-PCR观察到持久性的病毒血症。如表9所示,没有观察到明显的ALT增加,循环病毒仅在接种后的很长时间才被检测出。在接种118天以及之后,观察到病毒血症。在第一次接种后的时间点(8天)还可观察到可作参考的反应性。表9来自用PNF2161接种的CH1356的ALT和PCR结果接种前的平均ALT基线为50。上面显示的数据表明在实验灵长类动物中,HGV感染一直持续到1.7年。I.病毒基因组的鉴定从cDNA文库分离的470-20-1(实施例1)意味着在PNF2161检测到的病毒基因组为RNA。证明HGV病毒基因组为RNA的其它实验包括下面这些。原始克隆来源中的RNA或DNA的选择性降解(如通过无脱氧核糖核酸酶的核糖核酸酶或无核糖核酸酶的脱氧核糖核酸酶),接着用HGV特定形引物扩增,检测扩增产物用来从DNA模板中识别RNA。另一方法是利用扩增反应(来自作为模板的原始克隆来源的核酸和HGV特异性引物),在反应中(i)在不存在任何依赖于RNA的DNA聚合酶(即逆转录酶)的情况下,采用依赖于DNA的RNA聚合酶,和(ii)依赖于DNA的DNA聚合酶和依赖于RNA的DNA聚合酶。在该方法,如果HGV基因组为DNA或具有DNA中间产物,那么扩增产物用两种类型的扩增反应检测。如果HGV基因组仅为RNA,扩增产物仅用含有逆转录酶的反应。如实施例4C中所描述,使用蛋白酶K和SDS,接着用酚提取将全部核酸(即DNA或RNA)从PNF2161中提取出来。接着用聚合酶链反应(PCR)扩增纯化的核酸,其中(i)在PCR之前进行逆转录步骤,或(ii)省略逆转录步骤。仅当在PCR反应之前进行逆转录时可重复地获得扩增。作为对照,在单独反应中,DNA模板被成功地扩增,这些结果证实HGV病毒基因组的性质为RNA。最初出现在PNF2161中的克隆双链DNA序列的链可通过包括下面的各种方式推出。可对来自感染原血清的未扩增基因RNA进行RNA印迹法或斑点印迹法,接着通过将重复印迹杂交至对应于克隆序列的每条链的探针上。另一方面,从M13载体(Messing)分离的单链cDNA探针或多链特异性的寡核苷酸探针被用于增加的敏感性。如果源血清含有单链RNA,那么在杂交严谨的适宜条件下仅用一个探针(即来自470-20-1克隆的一条链的序列)产生信号。如果源血清含有双链DNA,那么两条链探针都将产生信号。由使用一个或另一个特异性引物的逆转录开始的聚合酶链反应是RNA印迹法的一个更高敏感的替代方法。从存在于PNF2161血清中的纯化病毒体提取的基因组RNA被用作每一个RT/PCR的输入模板。不是用任意的六聚体进行cDNA合成,而是用HGV序列特定性的引物。一种cDNA合成反应是用互补于克隆序列的一条链的引物(例如470-20-1-77F)来进行的,第二种cDNA合成反应也是运用从反义链(例如470-20-1-211R)衍生的引物来进行。使用两个HGV特异性引物扩增得到的首链cDNA,为了PCR的成功扩增,对照(例如DNA对照)被包括在内。还为了控制当使用描述的特异性引物时获得的逆转录效率,也使用来自克隆序列每条链的RNA转录物。通过琼脂糖凝胶电泳,用溴化乙锭染色检测特异性产物。与用于逆转染的引物无关,DNA对照(即PCR扩增的双链DNA对照)被成功地扩增。仅在反义链引物被用于cDNA合成时,单链RNA转录物(即逆转录效率和链特异性的对照)被扩增。仅在引物470-20-1-211R被用于逆转录时,PNF衍生的HGV多核苷酸产生特异性的扩增产物,这表明存在于血清中的原始HGV多核苷酸序列与470-20-1-211R互补,可能为单链RNA。实施例5PNF2161的蔗糖密度梯度分离A.PNF-2161致病原(agent)的分带使用来自HoeferScientific(SanFrancisco,CA)的梯度制备仪(maker)制备10-60%蔗糖(“ULTRAPURE”,Gibco/BRL)在TNF(50mMTris-HCl,pH7.5,100mMCaCl2,1mMEDTA)中的连续梯度。将约12.5ml的梯度在-70℃保存,在37℃迅速融化,接着以TNE稀释的0.4mlPNF血清覆盖。在4℃,用SW40转子(BeckmanInstruments)以40,000rpm(rav约200,000×g)的转速梯度离心约18小时。从管的底部收集体积约为0.6ml的级分,将0.5ml直接称重至超速离心管中用于密度的计算。表10PNF级分测定的密度和470-20-1的出现</tables>*“+”和“-”记分最初以40次PCR为基础。为了区另“+”,“++”,“+++”和“++++”,将产生最初正记分(7-18)的级分用30次PCR进行扩增。通过在4℃,用Ti70.1转子(约110,000×g)以40,000rpm转速离心2小时使推断的病毒颗粒成为片状沉淀物,使用酸性苯酚胍方法(“TRIREAGENT”,MolecularResearchCenter,Cincinnati,OH)和使用糖原作为载体以提高回收的乙醇沉淀提取RNA。将纯化的核酸溶解于含有2mMDTT和1U/μl重组RNA酶抑制剂的无RNA酶的缓冲液中。梯度级分的RNAPCR分析(实施例4C)显示在密度范围为1.126-1.068g/ml(表10)的级分,在470-20-1特异性信号中有一个明显的峰。在这种情况下,470-20-1信号被显示出形成了分离的带,与病毒颗粒在蔗糖梯度中的预期行为一致。B.病毒颗粒相对密度PNF2161已被证实被HCV共感染(见上面)。为了将470-20-1病毒颗粒的性质与其它已知肝炎病毒颗粒相比较,将血清PNF2161和纯化的肝炎A病毒的样品铺在蔗糖梯度上(如上所述)。收集0.6ml的级分,使之沉淀,提取RNA。使用HAVC(SEQIDNO5;SEQIDNO6);HCV(SEQIDNO7,SEQIDNO8)和470-20-1(SEQIDNO9,SEQIDNO10)特异性引物将从各级分分离的RNA进行扩增反应(PCR)。通过在琼脂糖凝胶上将扩增反应进行电泳分离,然后溴化乙锭染色来识别产物的带。分析的结果列于表11中。表11</tables>这些结果表明470-20-1颗粒与类似于HAV相比,更类似于HCV颗粒。另外,在蔗糖梯度离心之前,用氯仿处理血清PNF2161和HAV颗粒。实验结果表明470-20-1病原体可能为一被膜病毒,因为它比无被膜病毒(HAV)具有更类似于被膜黄热病毒科(Flaviviridae)成员的性质。实施例6470-20-1延伸克隆的产生A.锚式PCR如实施例1所描述,直接从PNF2161提取RNA。将RNA通过“CHROMASPIN”100凝胶过滤柱(Clontech)以除去小分子量杂质。用BMBcDNA合成试剂盒合成cDNA。cDNA合成后,将PNFcDNA连接到超过KL-1/KL-2SISPA或JML-A/JML-B50100倍的接头上(分别为SEQIDNO11/SEQIDNO12,和SEQIDNO17/SEQIDNO18),使用引物KL-1或引物JML-A将其扩增35次。通过来自10μl含有EcoRI酶解(脱磷酸化)的λgt11臂(1μg)和EcoRI酶解的PNFcDNA(0.2μg)珠连接反应物的1μl等分试样的锚式PCR,产生470个延伸克隆。使用λgt11反向引物(SEQIDNO13)结合470-20-77F(SEQIDNO9)或470-20-1-211R(SEQIDNO10)进行连接反应物的PCR扩增(40次)。PCR的所有引物浓度为0.2μM。将扩增产物(9μl/100μl)在1.5%琼脂糖上进行分离,印迹至“NYTRAN”(SchleicherandSchuell,Keene,NH),从470-20-1特异性的用地高辛标记的寡核苷酸探针检测。按照制造商的推荐使用末端转移酶(BMB)进行地高辛标记。杂交的带用凝胶纯化,克隆至“TA克隆载体pCRII”(Invitrogen),并测序。鉴定了许多5’和3’延伸至470-20-1的克隆。所有序列以来自自至少两个独立分离群的序列测定的共有序列为基础。以类似方式重复该锚式PCR方法以获得另外的5’和3’延伸序列。使用λgt11反向引物(SEQIDNO13)结合前面伸展克隆获得的序列衍生而来的HGV特异性引物进行PCR扩增反应。这些反应的底物是未包被的PNF21612-cDNA来源的DNA。按照制造商的建议(AppliedBiosystems,FosterCity,CA)使用AppliedBiosystemsmodel373ADNA序列测定系统中的“DYEDEOXYTERMINATORCYCLESEQUENCING”(Sanger等方法的改进)进行序列测定。序列数据示于序列表中。在核酸和氨基酸水平将序列与“GENBANK”,EMBL数据库和dbSET(全国医学文库)序列进行比较。检索程序FASTA,BLASTP,BLASTN和BLASTX表明这些序列的核酸和氨基酸序列都是新的。校准使用选择性引物对获得的各个克隆以产生共有序列。一系列用于构建HGV-PNF2161变异体序列的共有序列如下4E3,SEQIDNO26;3E3,SEQIDNO27;2E5,SEQIDNO28;1E5,SEQIDNO29;4E5,SEQIDNO30;3E5,SEQIDNO31;2E3,SEQIDNO32;1E3,SEQIDNO33;4E5-20,SEQIDNO34;5E3,SEQIDNO39;6E3,SEQIDNO40;7E3,SEQIDNO42;5E5,SEQIDNO43;6E5(44F),SEQIDNO44;8E3,SEQIDNO98;9E3,SEQIDNO109;10E3,SEQIDNO110;11E3,SEQIDNO116;12E3,SEQIDNO118;5’-末端,SEQIDNO175和3’-末端,SEQIDNO167。排序各个共有序列,鉴定重叠序列,确定HGV-PNF2161变异体的共有序列。将这个共有序列从其它四个HGV变异体中获得的序列进行比较JC(SEQIDNO182),BG34(SEQIDNO176),T55806(SEQIDNO178)和EB20-2(SEQIDNO180)。HGV-PNF2161变异体的共有序列由表示为SEQIDNO14的9391个碱基对组成。此序列代表一连续可读框(SEQIDNO15)。多蛋白质的Kyet-Doolittle疏水性方图如图11所示。原始470-20-1克隆与延伸获得的序列的关系被图解示于图1中。从图中可以看出,具有与470-20-1蛋白质编码序列相反极性的DNA链包括一长的连续的可读框。将HGV的氨基酸序列与蛋白质序列的PIR数据库(IntelliGenetics,Inc.,MountainView,CA)中的所有病毒序列进行比较。运用“FASTA”程序的1.7版本程序的“SSEARCH”程序(Pearson,等)进行比较。在HGV序列和黄热病毒科的两种病毒之间找到了局部序列相似的区。相似的序列在图5A和5B中。存在于这些顺序中的是这些病毒的依赖于RNA的RNA聚合酶(RDRP)的结构域单元。保守的RDRP氨基酸结构域单元在图5A和5B中用冒号和大写字母,黑体字(KooninandDolja)表示。这些顺序证明HGV编码序列的这一部分相当于RDRP。这个顺序的数据与关于HGV的RNA基因组的数据结合起来支持了HGV是黄热病毒科中的一员的位置。HGV多蛋白质(SEQIDNO15)与HoCV(猪霍乱病毒)和HCV的全部氨基酸序列的一致性分别为17.1%和25.5%。如此水平的全部氨基酸序列一致性证明HGV是从HoCV和HCV分离的分离的病毒体。为了证实它,在病毒BVDV(牛病毒性腹泻病毒)的黄热病毒科的两个成员和HCV中,16.2%的氨基酸可全部与HGV对准。一个属的成员在全部校准时,通常显示出高的同源性,例如,BVDV与HoCV比较显示出71.2%的同一性。当被全部排序时,HCV为其中一员的未命名属的各个成员(变异体)的一致性为65%至100%。B.cDNA末端快速扩增(RACE)PCR5’末端克隆通过用RACE(cDNA末端快速扩增)技术改进的锚式PCR方法获得相当于HGV基因组的5’-末端的克隆。该RACE方法最早由Frohman等(1988)和Belyausky等(1989)描述。简单地说,按如下方法获得HGV的5’-末端克隆。使用任意六聚体引发首链cDNA合成,用“SUPERSCRIPTII”或“rTth”逆转录酶(GIBCO/BRL)进行合成。首链合成后,通过碱水解(NaOH)将RNA模板降解。通过加入乙酸中和cDNA样品,并通过吸收至玻璃基质载体(“GENOBIND”,Clontech,PaloAlto,CA)而被纯化。纯化后,通过乙醇沉淀浓缩cDNA,用80%乙醇洗涤两次。起初描述的RACE方法改进如下。在氯化钴存在下,使用T4RNA连接酶将单链寡核苷酸锚(SEQIDNO174)(Clontech)连接到首链cDNA的3’末端。从制造商获得带有两处修饰的寡核苷酸锚(i)将锚的3’-末端用一个防止多连体形成的氨基酸修饰,(ii)5’-末端含有一个允许连接到首链cDNA上的磷酸基团。连接了锚后,cDNA被用作模板,用于使用一些特异性引物结合与锚序列互补的引物(AP引物,SEQIDNO134)进行的CPR扩增。将得到的扩增产物通过琼脂糖凝胶电泳进行分离,转移至滤膜上,与巢居的HGV特异性寡核苷酸探针杂交。分离与HGV杂交探针的带,将其克隆至“pCR-II”(Invitrogen,SanDiego,CA)并测序。C.HGV3’末端克隆通过改进的锚式RT-PCR方法,获得相当于HGV基因组3’-末端的克隆,简单地说,在cDNA合成之前,多聚腺苷酸聚合酶(GIBCO/BRL,Gaithersburg,MD)被用于催化将聚腺苷酸尾部加成到PNF2161RNA上。按照制造商的推荐完成聚腺苷酸的加成。在纯化聚腺苷酸修饰的RNA后,使用引物GV-5446IRT(SEQIDNO184)进行利用“SUPERSCRIPTII”(GIBCO/BRL)完成的逆转录。通过使用下面引物系列的PCR扩增得到的cDNAGV59-5446F(SEQIDNO171)和GV-5446IR(SEQIDNO172)。扩增后,将产物通过琼脂糖凝胶电泳进行分离,转移至滤膜中,并与地高辛标记的寡核苷酸探针杂交(E5-7-PRB,SEQIDNO173)。分离和纯化与寡核苷酸杂交的产物,将共克隆至“pCR-II”并测序。通过这种方法分离的两个克隆为MP3-3(SEQIDNO168)和MP3-7(SEQIDNO169)。实施例7分离470-20-1融合蛋白质A.表达和纯化470-20-1/谷胱甘肽-S-转移酶融合蛋白质如下完成含有470-20-1肽的谷胱甘肽-S-转移酶(Sj26)融合蛋白质的表达。通过使用引物gt11F(SEQIDNO25)和gt11R(SEQIDNO13)的聚合酶链反应,接着通过EcoRI酶解,从λgt11470-20-1克隆分离相当于原始λgt11470-20-1克隆的237个碱基对插入片段(在两侧都含有SISPA接的17个核苷酸)。将插入片段克隆至修饰的pGEX载体pGEXMOV中。pGEXMOV编码在羧基末端融合了六个组氨酸的sj26蛋白质(sj26his)。将470-20-1多肽编码序列在位于载体sj26his编码序列下游的克隆位点引入载体。因此,470-20-1多肽被表达为sj26his/470-20-1融合蛋白质。融合蛋白质中sj26蛋白质和6个组氨酸区使得融合蛋白质可以通过采用谷胱甘肽偶联的珠(Smith,D.B.,等)和固定的金属离子珠(Hochula;Porath)的双重色谱方法而进行亲和纯化。将大肠杆菌菌株W3110(ATCC目录号为27352)用pGEXMOV和含有470-20-1插入片段的pGEXMOV转化。通过加入2mM异丙基-β-硫代半乳糖苷(IPTG)诱导sj26his和470-20-1融合蛋白质。通过谷胱甘肽亲和层析或通过根据公开的方法(Smith,D.B.,等,Porath)结合常规的离子交换层析的固定金属离子层析(IMAC)纯化融合蛋白质。纯化的470-20-1融合蛋白质与PNF2161发生免疫反应。然而,纯化的sj26his蛋白质不与PNF2161发生免疫反就,这表明470-20-1肽和PNF2161之间存在特异性的免疫反应。B.分离470-20-1/β-半乳糖苷酶融合蛋白质在32℃,将用λ噬菌体gt11或gt/470-20-1侵染的KM392溶原菌保温直至培养物达到O.D.为0.4。接着在43℃,在水浴中将培养物保温15分钟以诱导gt11肽的合成,在37℃,再保温1小时。将细菌细胞沉淀,并溶于溶菌缓冲液中(10mMTris,pH7.4,2%“TRITONX-100”和1%抑蛋白酶肽)。通过离心(10K,10分钟,SorvallJA20转子)澄清细菌溶菌产物,将澄清的溶菌产物与偶联了抗-β-半乳糖苷酶(Promega)的琼脂糖4B珠一起保温。按照制造商的说明进行β-半乳糖苷酶融合蛋白质的结合和洗脱,用溶菌缓冲液进行一般的蛋白质的结合和柱的洗涤。将结合蛋白质用0.1M碳酸盐/碳酸氢盐缓冲液(pH10)洗脱。纯化的470-20-1/b-半乳糖苷酶蛋白质与PNF2161和抗-b-半乳糖苷酶抗体均发生免疫反应。然而,通过gt11溶原菌表达的纯化的β-半乳糖苷酶不与PNF2161发生免疫反应,但与抗-β-半乳糖苷酶抗体发生免疫反应。实施例8纯化470-20-1融合蛋白质以及制备抗-470-20-1抗体A.谷胱甘肽亲和纯化材料包括50ml还原形式谷胱甘肽亲和基质(Sigma),XK26/30Pharmacia柱,2.5×10cmBio-Rad“ECONO-COLUMN”(Richmond,CA),Gilson(Middleton,WI)HPLC,DTT(Sigma),还原形式的谷胱甘肽(Sigma),尿素和磷酸氢二钠。下面溶液用于融合蛋白质的纯化。缓冲液A磷酸缓冲盐溶液,pH7.4缓中液B50mMTrispH8.5,8mM谷胱甘肽(还原形式的谷胱甘肽)洗涤缓冲液8M尿素,100mMTrispH8.8,10mM谷胱甘肽,1.5MNaCl。让带有含470-20-1插入片段的质粒的大肠杆菌生长于发酵罐中(20升)。收集细菌,使用微流动仪(micro-fludizer)将其溶菌于含有2mM苯甲基磺酰氟(PMSF)的磷酸缓冲盐溶液(PBS)中。除非另有说明,下面所有过程均在4℃进行。通过将溶菌的细菌放入“OAKRIDGE”管中,并用Beckman型号JA-20转子,以20Krpms(40K×g)的转速旋转制备用于装填的粗溶菌产物。将上清液通过0.4μm滤器以及接着通过0.2μm滤器过滤。将2.5×10cm“ECONO-柱”用在室温下在PBS中膨胀2小时的谷胱甘肽亲和基质填充。通过用4床体积的PBS洗涤平衡该柱。在8ml/分钟的流速将柱用粗溶菌产物装填。随后以同样流速将该柱以5倍体积的PBS洗涤。通过将流速调至0.75-1ml/分钟并加入缓冲液B洗脱该柱。将5倍柱体积的缓冲液B泵入通过该柱,收集2分钟的级分。典型的洗脱分布图被示于图2中。存在于这级分的蛋白质的含量和纯度通过标准的SDSPAGE评价(图3)。基于其预测分子量和它与PNF2161血清的免疫反应性,识别470-20-1/sj26his融合蛋白质。为了下一步操作,可从含有融合蛋白质的级分或通过分离含有融合蛋白质的凝胶部分从凝胶中分离该蛋白质。B.通过阴离子交换纯化克隆470-20-1融合蛋白质溶液包括下列缓冲液A(10mM磷酸钠,pH8.0,4M尿素,10mMDTT),缓冲液B(10mM磷酸钠,pH8.0,4M尿素,10mMDTT,2.0MNaCl);和洗涤溶液(8M尿素,100mMTrispH8.8,10mM谷胱甘肽,1.5NaCl)。以4.0ml/分钟的流速将粗溶菌产物(或其它蛋白质源,如来自上面的被收集级分)装填至“HIGH-Q-50”(Biorad,Richmond,CA)柱上。接着以4.0ml/分钟的流速用5柱体积的缓中液A洗涤该柱。洗涤后,开始产生梯度,并以15柱容积由缓冲A至缓冲液B过柱。接着梯度升级至100%缓冲液B,使用一柱体积。典型的梯度示于图4A中。每10分钟收集一级分。通过标准的SDS-PAGE(图4B和4C)评价470-20-1/sj26his融合蛋白质的纯度,并收集相关级分(大约级分34-37,图4C)。C.制备抗-470-20-1抗体将在佛氏佐剂中的纯化的470-20-1/sj26his融合蛋白质皮下注射至兔中。在第0天和第21天,注射约1mg的融合蛋白质。在6周和8周有代表性地收集兔血清。用纯化的sj26his蛋白质类似地免疫第二只兔。从表达470-20-1/sj26his融合蛋白质,sj26his蛋白质和β-半乳糖苷酶/470-20-1融合蛋白质的细菌中制备小溶菌产物。将溶菌产物在凝胶上分级分离。并转移至膜上。将来自两只兔子的血清进行各自Western印迹。用470-20-1融合蛋白质免疫的动物血清与用pGEXMOV或含有470-20-1插入片段的pGEXMOV转化的IPTG诱导的大肠杆菌W3110的微量溶菌产物中的所有sj26his融合蛋白发生免疫反应,该血清还与来自470-20-1λgt11构建物的小溶菌产物中的融合蛋白质发生免疫反应。第二只兔与微量溶菌产物中的sj26his和470-20-1/sj26his融合蛋白质都发生免疫反应。该血清没有被预计与来自470-20-1λgt11构建物的小溶菌产物中的470-20-1/β-半乳糖苷酶融合蛋白质发生免疫反应。没有血清被预期与β-半乳糖苷酶发生免疫反应。将用融合蛋白质免疫的动物的血清中存在的抗-470-20-1抗体通过亲和层析纯化(使用470-20-1配体)。另外,可将融合蛋白质酶解以提供没有sj-26蛋白质序列的470-20-1抗原。接着如上所述单独使用470-20-1抗原产生抗体。实施例9兔抗肽血清将肽设计成包括整个HGV序列,尤其是包括非结构和结构基因中的每一个功能基团。肽是通过常规方法商业合成的。代表性的肽示于表12中。表12**NS3肽在C末端具有外来的半胱氨酸,它在HGV-PNF2161变异体多肽序列中不存在;实际序列为Q。将肽偶联至KLH上。使用兔作为宿主在多个位点皮下注射偶联的肽,通过商业手段制备抗肽兔血清。将两周的免疫记录与隔周采血一起使用。兔抗肽血清显示为肽特异性并具有高的效价。兔抗肽血清还可识别大肠杆菌和杆状病毒中表达的相应的重组蛋白质。抗体终点效价为1∶50,000-1∶625,000稀释度。兔抗肽7(NS4a)具有仅为1∶1,000的低的终点效价。相应地,抗在例如杆状病毒系统中表达的NS4a蛋白质的兔血清可能是更为有利的试剂。兔抗肽血清可用于相应的在例如在杆状病毒和痘病毒中表达的HGV蛋白质的免疫沉淀。兔抗肽血清还可用作EIA中的俘获抗体来检测HGV抗原。兔抗肽血清还可进一步用于识别HGV蛋白质。实施例10血清学A.一批血清的Western印迹法470-20-1融合抗原(上面描述的)被用于筛选一批血清,这一批血清中的许多是从患有肝炎以及未感染的对照个体中来的人血清。亲和纯化的470-20-1融合抗原(实施例8)被以2μg/cm上样至12%SDS-PAGE中。在200V下,将凝胶电泳2小时,将抗原从凝胶转移至硝酸纤维素滤膜上。将该膜用含1%牛血清白蛋白,3%正常羊血清,0.25%明胶,100mMNaPO4,100mMNaCl和1%脱脂干奶粉的溶液封闭2小时。将膜干燥,并切成1-2mm的条;每条均含有470-20-1融合抗原。将条一般性地用TBS(150mMNaCl;20mMTrisHCl,pH7.5)重新水合,在室温下将其在血清中(1∶100)中摇动保温过夜。将条每次在TBS加上“TWEEN20”(0.05%)中洗涤,一共洗涤两次每次5分钟,接着在TBS中洗涤,一共洗涤两次每次5分钟。在室温下,再将条在二抗(Promega碱性磷酸酶结合的抗人IgG,1∶7500)中摇摆保温1小时。再将该条在TBS+“TWEEN20”中洗涤两次,每次5分钟,在TBS中洗涤两次,每次5分钟。通过将条在含有BCIP(实施例2)和NBT(实施例2)的底物溶液的pH9.5缓冲液(100mMTris,100mMNaCl,5mMMgCl2)中保温检测结合抗体。让显色反应持续约15分钟,到时通过在蒸馏水中洗涤3次停止显色反应。从下面组的个体中获得试验血清(i)献血者,HBVAb,表面Ag阴性,HCV,HIV,HTLV-1Abs阴性;(ii)HBV,血清来自被乙型肝炎病毒感染的人;(iii)HCV,血清来自被在第二代HCVELISA分析中有活性的丙型肝炎病毒感染的人;和(iv)HXV,个体血清学为HAV,HBV,HCV或HEV阴性。筛选的结果示于表13中。表13470-20-1血清分段结果一览表</tables>*不确定,弱反应性这些结果意味着470-20-1抗原存在于大量不同的血清样品中。该抗原与正常人血清不发生免疫反应。B.抗体检测的全面ELISA记录将聚苯乙烯96孔平板(“IMMULONII”(PGC)).用5μg/ml(100μl/孔)抗原的0.1M碳酸氢钠缓冲液,pH9.5覆盖。将平板用“PARAFILM”密封,4℃保存过夜。将平板抽气,用300μl10%正常羊血清封闭,37℃下保温1小时。用PBS0.5%“TWEEN-20”将平板洗涤5次。将抗血清稀释在1×PBS,pH7.2中。将所需稀释度的抗血清(0.1ml)加到每个孔中,在37℃下,将平板保温1小时。接着用PBS0.5%“TWEEN-20”将平板洗涤5次。结合了辣根过氧化物酶(HRP)的羊抗人抗血清(Capple)被以1/5,000稀释在PBS中。将0.1ml的这种溶液加至各孔中。在37℃下,将平板保温30分钟,再用PBS洗涤5次。SigmaABTS(底物)仅在被加入到平板前才制备。该试剂由50ml0.05M柠檬酸,pH4.2,0.078ml30%氢氧化钠溶液和15mgABTS组成。将0.1ml底物加入到每个孔中,在室温下保温30分钟。加入0.05ml5%SDS(w/v)使反应停止。在410nm处测定相对吸光度。实施例11所选择的HGV抗原的表达将HGV全部编码序列亚克隆至多于50个的分离的重叠cDNA片段中。大多数cDNA片段的长度的范围为约200bp~约500bp。将cDNA片段分别克隆至表达载体pGEX-HisB中。该载体类似于上面所述的pGEX-MOV。pGEX-hisB为pGEX-2T(Genbank登记号A01438;商业上可购得的表达载体)的修饰。通过在凝血酶酶切位点的正下游插入NcoI位点而将载体pGEX-2T修饰。这个位点后面接着的是BamHI位点,再接着是聚组氨酸(6个组氨酸)编码序列,再接着是在pGEX-2T中发现的EcoRI位点。感兴趣的编码序列一般被插在NcoI位点和BamHI位点之间。在图6(SEQIDNO115)中,插入序列编码GE3-2抗原。载体序列的其它部分与pGEX-2T相同。融合蛋白质的表达基本如上所述用其它pGEX衍生的表达载体来完成。全部50个片段的克隆基本上如下所述完成,其中为50个编码区中的每一个选择了特异性引物。每个HGV插入DNA从使用如实施例4C中描述的一组特异性引物从PNF2161或其它HGV(+)血清提取的RNA通过PCR扩增而来。一般地,5’引物含有NcoI限制性位点,3’引物含有BamHI限制性位点。扩增片段中的NcoI引物使扩增的编码序列可以在框内融合至表达载体pGEX-Hisb或pGEXMOV中的GST-sj26编码序列中。将扩增的HGV插入DNA用限制性内切酶NcoI和BamHI酶解。凝胶纯化酶解的插入DNA,并用NcoI和BamHI酶解的pGEXhisB或pGEXMOV连接。将大肠杆菌菌株W3110(ATCC#27325,美国典型培养物保藏中心,Rockville,MD)用连接产物转化。选择抗氨苄青霉素克隆。通过使用与插入分子(引物GLIF(SEQIDNO235)和GLIR(SEQIDNO236)旁侧的pGEX载体序列同源的引物,对来自抗氨苄青霉素的克隆进行PCR扩增证实了插入片段的存在。PCR扩增产物的大小为插入片段的大小加上从载体衍生而来的约160bp。选择带有适宜插入片段的转化体,并使其进行如实施例7所描述的由IPTG进行的蛋白质诱导。通过Western印迹法分析表达的重组蛋白质对推断的HGV感染的人血清的特异的免疫反应性。称为GE3,GE9,GE15,GE17,GE4,EXP3,GE1-N和GE-57的8个片段编码当与推断的HGV感染的人血清反应时产生清晰的免疫应答的抗原。A.克隆GE3,GE9,GE15,GE17,GE4,EXP3,GE1-N和GE57使用各片段特异性的PCR引物,从SISPA扩增的双链cDNA或从PNF2161或T55806获得的RNA通过聚合酶链式反应制备克隆GE3,GE9,GE15,GE17,GE4,EXP3,GE1-N和GE57的编码序列插入片段。下表14列出了每个克隆与SEQIDNO14的相同部分,以及用于产生每个克隆插入片段的引物系列。表14*这些序列相对于SEQIDNO78而给出。GE57的氨基酸序列被表示为SEQIDNO241。在GE-35’引物(GE-3F,SEQIDNO46)一无义点突变被引入以修饰本来的NcoI限制性位点。使用上述引物产生PCR扩增产物。将扩增产物用凝胶纯化,用NcoI和BamHI酶解,再用凝胶纯化。将纯化的NcoI/BamHIGE3,GE9,GE15,GE17,GE4,GE1-N和GE57片段独立地连接到脱磷酸化的NcoI/BamHI切口的pGEX-HisB载体上。将纯化的NcoI/BamHIEXP3片段连接到脱磷酸化的NcoI/BamHI切口的pGEX-MOV载体上。将每个连接混合物转化至大肠杆菌W3110菌株,筛选抗氨苄青霉素克隆。将抗氨苄青霉素克隆重新悬浮于Tris/EDTA缓冲液中,使用引物GLIF(SEQIDNO235)和GLIR(SEQIDNO236)通过PCR分析以证实插入序列的存在。8个代表性克隆分别称为GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57。B.表达GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57融合蛋白质将带有包含GE3-2,GE9-2,GE15-1和GE17-2,GE4-8,EXP3-7,GE1-N和GE57载体的抗氨苄青霉素细菌的菌落分别接种到含有氨苄青霉素的LB培养基中。让培养物生长至OD为0.8-0.9,到时加入IPTG(异丙基硫代-β-半乳糖苷;Gibco-BRL)使最终浓度为0.3-1mM以诱导蛋白质表达。在存在IPTG时,继续保温3-4小时。通过离心收集细菌细胞,并将其重新悬浮于SDS样品缓冲液(0.0625MTris,pH6.8,10%甘油.,5%巯基乙醇,2.3%SDS)中。将重新悬浮的沉淀物煮沸5分钟,通过离心除去不溶的细胞碎片。通过聚丙烯酰胺凝胶电泳(PAGE)以及未诱导的溶菌产物分析GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57的IPTG诱导的培养物中获得的上清液。接着将来自凝胶的蛋白质转移至硝酸纤维素滤膜上(即通过Western印迹法)。首先将滤膜与针对GST蛋白质的兔多克隆抗体或鼠多克隆单克隆抗体(来自SierraBiosource,CA)一起保温以检测适宜大小的GST融合蛋白质的表达。上面克隆的期望蛋白质大小分别为40,38,39,32,42,64,42和33KDa。RM001与适宜分子量的融合蛋白质的带的免疫反应性证明了上面克隆的融合蛋白质通过细菌细胞的成功表达。克隆蛋白质的表达还通过在考马斯亮蓝染色的凝胶上的由IPTG诱导的适宜大小的过表达蛋白质的出现而被监测。C.HGV蛋白质的Western印迹分析一旦HGV克隆蛋白质的表达通过使用抗GST抗体Western印迹被证实,接着将如上制备的一组滤膜接触一些HGV(+)和HGV(-)人血清。将用于所有细胞溶菌产物的Western印迹分析的人的血清用λ-gt11-硝酸纤维素滤膜预吸收。λ-gt11-硝酸纤维素滤膜制备如下。简而言之,在LB中制备KM392培养物的过夜培养物。用含有0.2%麦芽糖的新鲜LB将培养物稀释10倍,在37℃下,摇荡保温1小时。1小时后,将培养物与等量的MgCa溶液(0.01MMgCl2和0.01MCaCl2)混合。将λgt11加入该混合物中至效价为2×104PFU/ml,不断摇荡保温30分钟。30分钟后(1ml噬菌体/大肠杆菌混合物),加入15ml熔化(55℃)的LB上层琼脂(具有0.8%琼脂的LB)将8ml混合物涂布至每个15cm的LB琼脂平板上。在上层琼脂凝固后,在37℃下将平板保温3-5小时。产生噬菌斑后,将硝酸纤维素滤膜放置在平板上,在37℃下,再将平板保温过夜。取下硝酸纤维素膜,并用TBS(50mMTris-HCl,pH7.5,150mMNaCl)加上0.05%“TWEEN20”充分洗涤。再用0.05%明胶的TBS将洗涤过的滤膜封闭。将滤膜用TBS洗涤三次(每次洗涤5分钟)。为了人血清的预吸收,将每血清在封闭溶液(描述在实施例10中)稀释100倍。接着将10ml稀释血清与上面制备的2个λgt11滤膜一起保温过夜。除开硝酸纤维素滤膜,将预吸收的血清用于Western印迹分析。Western印迹分析证明GE3-2,GE9-2,GE15-1,GE17-2,GE4-8,EXP3-7,GE1-N和GE57对HGV(+)血清显示出特异性的免疫反应性。GE-4-8与J21689血清发生免疫反应。J21689通过HGVPCR(实施例4)被确定为HGV(+)血清,HCV(+)被通过HCVPCR和血清学分析确定。EXP3-7蛋白质与JC和T55806发生免疫反应。JC在实施例4F中被鉴定为HGV阳性血清,这种血清由于其高的ALT而被血库拒收。起始血清样品一年之后获取的第二个JC样品,通过PCR分析仍为HGV阳性。T55806在实施例4F中也被鉴定为HGV阳性血清,这种血清由于其高的ALT而被血库拒收。这种血清与HCV共阳性(co-positive)。另外,GE15-1和GE-17对PNF2161和T55806显示出弱但为特异性的免疫反应性。GE1-N与PNF2161,JC,T55806,T56633,T27034和R0001发生免疫反应。T56633,T27034和R0001在实施例4F中被鉴定为HGV(+)血清。GE57与E57963和R0001发生免疫反应。E57963为HGV和HCV共阳性血清。GE3-2和GE9-2也特异性地与HGV血清发生免疫反应。然而8种抗原中没有一种与HGV阴性血清T43608和R05072发生免疫反应。使用采用结合了谷胱甘肽的珠(Smith,D.B.,等)和固定的金属离子珠(Hochuli;Porath)的双重层析方法。基本上如实施例7从细菌细胞溶菌产物纯化GE3-2和GE9-2融合蛋白质。如下将纯化的蛋白质进行Western印迹分析。将各种量的纯化HGV蛋白质(例如GE3-2和GE9-2蛋白质)上样于12%丙烯酰胺凝胶上。PAGE之后,通过标准方法将蛋白质从凝胶转移至硝酸纤维素膜上。将各膜与大量人或小鼠血清中的每一份一起保温。通过洗涤膜,除去过量血清。依据被筛选的血清,将这些膜与结合了碱性磷酸酶的山羊抗人抗体(Promega)或结合了碱性磷酸酶的山羊抗小鼠抗体(Sigma)。再次洗涤膜以除去过量的山羊抗人IgG抗体。并暴露于NBT/BCIP中。具有GE3融合蛋白质的普通染色的膜的照相示于7A-7D中。这些图显示了使用下面血清的纯化GE3-2蛋白质的Western印迹分析的结果,N-(ABCDE)人(JC)血清(图7A),N-(ABDE)人(PNF2161)血清(图7B),极正常(SN2)血清(图7C)以及针对GST-sj26蛋白质的小鼠单克隆抗体(RM001)(图7D)。在各个图中,泳道1含有事先染色的分子量标准(Bio-Rad),泳道2-5分别含有下列量的GE3-2融合蛋白质4μg,2μg,1μg和0.5μg。数字代表1μg/0.6cm凝胶(孔的大小)的上样量。人JC,PNF2161和极正常2血清的稀释度为1∶100。抗sj26的稀释度为1∶1000。JC印迹中在大约97K见到的带与GE3.2融合蛋白质制备中的少量污染物发生反应。蛋白质标准的大小为142.9,97.2,50,35.1,29.7和21.9KD。如图7A-7D所示,GE3-2对JC血清显示出特异的免疫反应性。GE3-2微弱地与PNF2161血清反应,被评为不明确的或阴性。在平行实验中,GE9-2对PNF2161血清显示出微弱但为特异的免疫反应性。实施例12构建典型表位文库A.Y5文库聚合酶链反应被用来扩增来自PNF2161SISPA扩增的cDNA的3个重叠DNA片段。使用JML-A/B接头(SEQIDNO54和SEQIDNO55)制备PNF2161SISPA扩增的cDNA。使用1μMJML-A引物将1微升的该材料再扩增30次(94℃下,1分钟,55℃下,1.5分钟和72℃下,2分钟)。整个反应体积为100μl。将3个扩增的产物混合,并将其按照制造商的指示通过一次流过“WIZARDPCR柱”(Promega)而与过量的PCR引物分离,该“WIZARDPCR柱”为一种在高离子强度的缓冲液中结合DNA,在低离子强度的缓冲液中释放DNA的硅基树脂。用100μl蒸馏水将扩增的DNA从柱上洗脱下来。将洗脱的DNA在1.5%琼脂糖TBE凝胶中(Maniatis等)分级分离,溴化乙锭染色后,在紫外线下目测观察到150-1000bp的DNA片段的一个强的斑点。1μl再扩增的cDNA被用作使用表15所示每一引物对的PCR反应中的模板。表15</tables>将引物用未扩增表15所示大小的HGV特异性的DNA片段的扩增。在扩增反应中,引物对以1μM的浓度使用。在100μl的整个反应体积中,在94℃下,1分钟,54℃下,1.5分钟,72℃下,3分钟,使扩增进行30次。三个不同引物对的PCR反应中的每一个都导致了具有期望大小的产物的特异性扩增。对于每一引物对的反应,将来自3个独立的PCR反应的扩增产物混合,并如上所述用“WIEARDPCR柱”纯化,将纯化产物稀释于50μl蒸馏水中。将来自每一纯化产物的样品(14μl,含有约1-2μg每一引物对扩增的DNA片段)混合。将所有三种不同的扩增片段的混合样品加入5μl10×DNA酶酶解缓冲液(500mMTrispH7.5,100mMMnCl2)和2μl蒸馏水中。从该酶解混合物中吸取10μl样品,置于含有5μl终止溶液(100mMEDTA,pH8.0)的试管中。该样品为0“酶解分钟”的时间点。将酶解反应的其余部分放置于25℃下。将1μl以1/25稀释的无RNA酶的DNA酶I(Stratagene)加入到该酶解混合物中。在各个时间点,将10μl等分样品取出,与5μl终止溶液混合,将DNA酶I酶解的DNA产物在1.5%琼脂糖TBE凝胶上进行分析。一些酶解实验的结果表明40分钟的酶解提供了DNA片段在100-300bp大小范围中的良好分布。在室温下使剩下的全部酶解混合物重复进行DNA酶I的酶解过程。加入18μl终止缓冲液终止酶解,使用“WIZARDPCR柱”纯化酶解的DNA产物。用50μl蒸馏水洗脱“WIZARD-PCR柱”,将洗脱的DNA加入下面反应混合物中7μl限制性内切酶缓冲液C(Promega,10mMMgCl2,1mMDTT,50mMNaCl,10mMTris,pH7.9,1×浓度);11μl1.25mMdNTPs;和2μlT4DNA聚合酶(Boehringer-Mannhiem)。在37℃下,将反应混合物放置30分钟,到时加入70μlpH8.0的苯酚/氯仿并混合。除去苯酚/氯仿,再提取一次以产生总共150μl含DNA样品的水溶液。用2体积的无水乙醇和0.5体积的7.5M乙酸铵将DNA进行乙醇沉淀。在“ZPPENORFMICROFUGE”中,以14,000rpm转速离心,将DNA形成片状沉淀物,在42℃下干燥,并重新悬浮于25μl蒸馏水中。将DNA连接至5’脱磷酸的SISPA接头KL1(SEQIDNO62)和KL2(SEQIDNO63)上。一些不同浓度的SISPA接头和DNA被用于试验。在下面连接反应条件,发生高水平的连接(如下所评价的)6μlDNA,2μl5.0×10-12MKL1/KL2接头,1μl10×连接酶缓冲液(新英格兰生物实验室)和1μl400单位/μlT4DNA连接酶(新英格兰生物实验室),总反应体积为10μl。在16℃下,将连接反应过夜。如下平行地进行两个反应。在100μl的总反应体积中,将被连接材料的2μl样品用KL1SISPA引物扩增(在94℃下,1分钟,55℃下,1.5分钟以及72℃下2分钟,共进行25次循环)。通过1.5%琼脂糖TBE凝胶电泳分离1/5PCR反应扩增的产物来分析连接的程度。将凝胶用溴化乙锭染色,在紫外线下观察这些带。用“WIZARDPCR柱”纯化来自重复反应的扩增产物,以50μl蒸馏水将纯化的DNA洗脱。在30μl的总体积中,将25μlPCRKL1/KL2扩增的DNA的等分试样用36单位EcoRI(Promega)酶解。在37℃下,将反应过夜。使用“SEPADEXG25”旋转柱纯化酶解的DNA。在过夜反应中,将EcoRI酶解的DNA连接到事先用EcoRI酶解的λgt11臂上,并用小牛肠碱性磷酸酶处理(Stratagene,LaJolla,CA)。按照制造商的指示使用“GIGAPACKGOIDPACKAGINGEXTRACT”(Stratagene)将连接混合物分装。获得的重组噬菌体的量的滴定通过将1/10稀释度的包装噬菌体涂敷到KM-392的菌苔上来进行,其中平板含有20μl100mg/ml的X-gal溶液(5-溴-4-氯-3-吲哚基-β-D-半乳糖苷;Sigma)和20μl0.1MIPTG溶液(异丙基-1-硫代-β-D-半乳糖苷,Sigma)。获得了含有大于75%重组噬菌体的1.2×106噬菌体/ml的效价。使用引物11F(SEQIDNO25)和11R(SEQIDNO13)通过任意挑选的噬菌体的PCR分析确定重组噬菌体百分数。含有DNA片段的包装文库从扩增的DNAF1/R1,F2/R3和F4/R4的酶解衍生而来,称为Y5文库。B.ENV文库如下制备称为ENV文库的表达文库。1μlPNF2161SISPA扩增DNA被用作使用下面引物对的聚合酶链反应中的模板GEP-F15(SEQIDNO128)和GEP-R15(SEQIDNO129),它们产生525个核苷酸HGV片段;以及GEP-F17(SEQIDNO130)和GEP-R16(SEQIDNO131),它们产生765个核苷酸HGV片段。在94℃下,1分钟,52℃下,1.5分钟和72℃下3·分钟将PCR扩增进行35次。纯化扩增产物并用DNA酶酶解。基本上如实施例12A中的描述,在λgt11中将KL1和KL2接头连接至cDNA上,扩增DNA片段,构建文库。文库的重组频率大于70%。通过使用由λgt11旁侧区衍生的衍生物的聚合酶链反应对插入片段的分析证实了重组频率,并表明插入片段的大小范围为150-500个核苷酸。C.NS3文库如下构建称为NS3的表达文库。通过使用引物470ep-F9(SEQIDNO132)和470ep-R9(SEQIDNO133)以及模板PNF2161SISPA扩增核酸的聚合酶链反应将第一个片段扩增。预期的扩增反应的产物为77个碱基对。通过在TAE凝胶上的分离将扩增片段用凝胶纯化。用“GENE-CLEAN”(Bio101,LaJolla,CA)进一步纯化片段。使用伸展克隆GE3L-11(SEQIDNO41)作为源物质还将片段F9/R9扩增。在扩增反应中约25ng的GE3L-11被用作带有F9和R9引物的模板。使用“TAQSTART”(Clonetech,PaloAlto,CA)在94℃下,1分钟,52℃下,2分钟,72℃下3分钟让F9/R9扩增进行30次。混合两个反应的扩增产物。将产物用DNA酶I酶解(10μlGE3L产物和25μlPNFSISPA产物)。基于GE3L的扩增产物代表了大多数扩增产物起始物质。基本上如实施例12A中的描述,在λgt11中将KL1和KL2接头连接至cDNA上。扩增DNA片段,构建文库。获得的效价为2.5×106噬菌体/ml,重组噬菌体的百分数被确定为大于99%,对插入片段大小的聚合酶链反应分析证实了该重组频率。并表明插入片段的大小为150-550核苷酸。另外,还使用GEP-F10/GEP-R10引物(分别为SEQIDNO135和SEQIDNO136)将第二个片段进行扩增。1μlPNF2161SISPA扩增的核酸被用作模板。获得了大小为57个核苷酸预期片段。得到的扩增产物被用于刚才描述的F9/R9扩增。当这个片段被插入λgt11时所获得的效价为1.47×106噬菌体/ml,重组频率为90%。D.NS2文库使用描述在实施例12A中的方法构建NS2表位文库。从1μlPNF2161SISPADNA(基本上如实施例12A描述的制备)扩增4种含有全部或部分HGV蛋白质NS2,NS3和NS5b的DNA片段。使用表16所出的引物以及SISPA扩增的PNF2161DNA作为模板制备该文库。表16</tables>在94℃/1分钟,48℃/2分钟,73℃/3分钟,将所有扩增进行35次。所有扩增产生了至少一种预期大小的片段。以约1∶1∶1∶1比例混合扩增产物,用DNA酶I部分酶解。如上面,将酶解产物连接到KL1SISPA接头,将其扩增并用EcoRI酶解。将酶解片段连接到λgt11上。分装连接反应物。接种分装的连接产物。得到的文库被确定含有一70%带有观察到的大小为150-500个核苷酸的插入片段重组噬菌体。E.VNS5A文库用引物470EXT4-2189R(SEQIDNO119)和470EXT4-29F(SEQIDNO120)分离含有HGV蛋白质NS4b和NS5a以及NS4a的3’末端和NS5b的5’末端的全部编码序列的2.1kbpDNA片段。如实施例4G中所描述的,进行使用这些引物的PCR扩增。在包括下面的多次HGV感染的血清中观察到了成功的扩增T56633来自由于其所捐献的血液的ALT值高于临界值而被拒收的血液捐献者;样品E21-A和E20从患有肝炎的埃及人获得;以及样品AH0591从形成急性肝炎的澳大利亚人获得。基本上如实施例6中所描述,将E21-A和E20的扩增产物克隆至载体T/A(获自于InVitrogen,SanDiego,CA)的T伸出位点。接着通过用约150单位限制性内切酶EcoRI酶解约20μg质粒DNA,分离来自这2个质粒的2.1kbHGV插入片段。在37℃下保温过夜后,将酶解产物用TAE琼脂糖凝胶电泳分解。将产物从含有感兴趣片段的琼脂糖凝胶部分切割下来。将琼脂糖熔化,按照制造商的指示使用“GENECLEANII”试剂盒(Bio101,LaJolla,CA)提取释放的DNA。如实施例12A中所描述,将从E21-A和E20样品产生的纯化的2.1kb片段以及从样品T56633和AH0591的PCR扩增获得的DNA片段分别用DNA酶I酶解。对于所有4个样品,确定导致大小为100-1000nts的片段被分离的酶解条件。纯化和修整后(实施例12A),将从4个HGV感染的样品分别连接到不同组的SISPA接头。连接后,将DNA进行SISPA扩增。在37℃下,将扩增的DNA分别用约100单位的EcoRI酶解过夜。接着将酶解的DNA通过使用G25树脂的旋转柱层析(5’3’Inc,Boulder,CO)纯化。以1∶1∶1的比例将来自样品T56633,AH0591和E21-A的酶解DNA混合,并如实施例12A所描述,将DNA的混合物连接到λgt11的EcoRI位点。分装后,使用“GIGAPACKIIIXL”提取物(Stratagene,LaJolla,CA)在IPTG和XGAL存在下,接种得到的文库,测定其具有约1.0×106噬菌体/ml的效价,重组频率为约70%。实施例13免疫筛选表位文库A.分离具免疫活性的Y5克隆基本上如实施例2中所描述,将两个HGV阳性血清,PNF2161和JC用于免疫筛选Y5文库。以约15,000噬菌体/平板的量将Y5噬菌体文库涂敷在20个平板上。将平板温育约5小时,用硝酸纤维素滤膜(SchleicherandSchuell)覆盖过夜。通过在AIB(1%明胶加上0.02%叠氮化钠)中保温约6小时将滤膜封闭。将封闭的滤膜再用TBS洗涤一次。将10个Y5文库滤膜与PNF2161血清和10个带有JC血清的滤膜一起搅拌保温过夜。两血清以1∶10稀释在AIB中。为了减少非特异性抗体结合,稀释血清已通过与吸收了野生类型的λgt11的硝酸纤维素滤膜一起保温过夜而被事先处理。将滤膜从血清中移去,用TBS洗涤三次,与结合了碱性磷酸酶的山羊抗人二抗(Promega,以1/7500稀释在AIB中)一起保温1小时。将滤膜用TBS洗涤4次。通过将滤膜在含有NBT和BCIP的AP缓冲液(100mMNaCl,5mMMgCl2,100mMTris,pH9.5)中保温来检测结合的二抗。挑取在最初筛选中测试为阳性的噬菌体,并用500μlPDB中(100mMNaCl,8.1mMMgSO4,50mMTrispH7.5,0.02%明胶)洗脱。通过以总密度为100-500噬菌体/100mm平板,重新涂敷洗脱的噬菌体来纯化具有免疫反应性的噬菌体。基本上如上所述,将平板用适宜HGV阳性血清重新进行免疫筛选。显色反应后,挑取一些分离的阳性噬菌体,放入500μlPDB中。保温1小时后,将2μl重新纯化的噬菌体PDB溶液用作含有11F(SEQIDNO25)和11R(SEQIDNO13)PCR引物的PCR反应的模板。这些引物与位于λgt11的EcoRI位点的5’端70个核苷酸和3’端90个核苷酸的序列同源。在94℃/1分钟,55℃/1.5分钟,和72℃/分钟将PCR反应扩增30个循环。将PCR扩增反应物在琼脂糖凝胶上进行大小的分级分离。纯化噬菌体的PCR扩增产生了用于每一单个噬菌体扩增反应的单链,其中纯化的片段含有DNA插入片段加上噬菌体5’和3’旁侧序列的约140个碱基对。按照制造商的教导,使用“S-300HR”旋转柱(Pharmacia)纯化来自产生单条带的PCR反应的扩增产物。采用AppliedBiosystems自动测序仪377A和适当记录测定DNA的量和DNA序列。如上面所述的用JC血清筛选Y5文库导致了示于表17中的阳性链克隆的纯化和DNA序列测定。阳性链克隆相当于存在在SEQIDNO14的HGV序列一多蛋白质阅读框的5’-3’翻译。表17</tables>1.该克隆含有双链(double)插入片段,克隆插入片段的核苷酸69至126相当于HGV序列这些克隆描述了在HGV的推断NS5蛋白质中的2个免疫原性区。这两个区与示为SEQIDNO14的序列相对应,为位置6636-6821和7278-7385。另外,用PNF2161血清筛选Y5文库导致了示于表18的下面的阴性链克隆的纯化和DNA序列测定。阴性链克隆相当于互补于示于SEQIDNO14中的HGV序列的序列的5’-3’的翻译。表181.该克隆含有双插入片段,克隆插入片段的核苷酸46-105相当于HGV序列2.该克隆含有双插入片段,克隆插入片段的核苷酸19-118相当于HGV序列3.该克隆含有双插入片段,克隆插入片段的核苷酸70-126相当于HGV序列4.插入片段在核苷酸19和35之间含有外部非HGV序列所有这些序列含有使用PNF2161血清分离的原始HGV克隆470-20-1的部分。如下分离来自Y5文库的另外的表位克隆。用实施例13描述的方法将Y5文库用HGV感染的血清J21689和T56633筛选,获得多于400个的阳性噬菌体,这表明被两种HGV感染的血清识别的强免疫原性的序列的存在。将10个阳性噬菌体纯化并进行DNA序列测定。DNA序列测定获得的结果描述在表19中。表19</tables>*开始/结束的位置相对于SEQIDNO14而给出。将这些序列与前面筛选文库获得的比较,表明这些克隆均含有包含在前面分离的表位克隆Y5-10中的相同表位。两个克隆,Y5-114-2B和Y5-121-19A通过它们的5’末端比前面观察的克隆Y5-10,Y5-12和Y5-26的起始端更靠近NS5a羧基端14个氨基酸的事实而被识别。没有一个上述克隆具有位于在克隆Y5-10中所观察到3’末端的内部3’末端。因此这个表位的最小序列包含在氨基酸序列中(SEQIDNO272)。B.来自ENV文库的抗原克隆用HGV血清J21094筛选ENV文库。基于首次产生(C-100)HCV试验,该血清(J21094)被鉴定为HCV阳性。通过PCR和其它HCV抗原,对原始J21094血清样品,以及后来获得的J21094样品的后续试验证实初始个体的血清为被HCV感染。借助使用470-20-1和NS5引物对的PCR分析,获得了HGV核酸存在的证据。大量噬菌体克隆被鉴定为与J21094血清发生免疫反应。噬菌体通过噬菌斑纯化和顺序。7个克隆(Q7-12-1,Q7-16-2-2,Q7-15-2,Q7-17-2-1,Q7-19-1和Q7-19-2-1)含有相同的插入片段。Q7-12-1的核苷酸序列被列为SEQIDNO143(多肽序列,SEQIDNO144)。通过刚才描述的方法获得的另一个克隆,Q7-16-1与Q7-12-1具有相同的5’末端,但在3’末端短26个氨基酸。C.来自NS3文库的抗原克隆使用下面血清筛选F9/R9噬菌体和F10/R10噬菌体的混合物(1∶1)PNF2161,J21689和E57963。J21689和E57963为通过PCR(使用多个引物)测试为HCV和HGV共阳性(co-positive)的血清。每次免疫筛选是用10个平板或约150,000噬菌体。一些在筛选中被鉴定为免疫阳性的克隆如下。免疫Y12-10-3(多核苷酸序列,SEQIDNO145;多肽序列,SEQIDNO146)通过其与J21689血清的免疫反应性而被识别。该克隆表达来自HGVNS3的88个氨基酸插入片段。克隆Y12-15-1(多核苷酸序列,SEQIDNO147;多肽序列,SEQIDNO148)通过其与E57963血清的免疫反应性而被识别。该克隆表达来自HGV的NS3蛋白质的64个氨基酸插入片段。这个序列位于克隆Y12-10-35’端约70个氨基酸处。D.来自NS2文库的抗原克隆通过用HGV阳性血清T56633筛选NS2文库分离多个阳性噬菌斑,随后纯化11个噬菌斑,并进行DNA序列测定。包含在噬菌斑中的插入片段的位置(以SEQIDNO14为标准)描述在表20中。表20在此表中,位置根据SEQIDNO14而给出。克隆的实际序列为所指片段的互补链。所有免疫克隆表达相同可读框(ORF)部分。互补于编码多蛋白质的序列的HGV多核苷酸链编码可读框。该可读框为互补于SEQIDNO14的序列中的核苷酸322至6865。在互补链核苷酸6388处,存在一个可作为翻译起始位点的甲硫氨酸,它可以供产生159个氨基酸的蛋白质之用。所有11个被测序的克隆的共同的最小氨基酸序列位于核苷酸6342至6606(相应于SEQIDNO14的互补链)。由HGV-PNF2161的负链的这个区编码的氨基酸序列被示为SEQIDNO273。具免疫活性的负链区的亚克隆和随后的Western印迹分析描述如下。E.来自VNS5A文库的抗原克隆将约1.5×105来自VNS5a文库的噬菌体涂敷,接着用实施例13中描述的方法用HGV阳性血清J29374筛选。用J29374对VNS5a文库的免疫筛选导致了多个阳性噬菌斑的分离。将6个噬菌斑纯化并随后进行DNA序列测定。获得的DNA序列的原始链可通过其SISPA接头序列存在于克隆5’和3’末端的那些来确定。获得的克隆(以SEQIDNO14为标准)的起始和终止位置以及它们的来源总结在表21中。表21所有这些克隆共同含有Q11-22-1克隆的序列(SEQIDNO274)。这个氨基酸序列紧接着Y5-10表位的最小序列的5’端。因此它定义了HGVNS5a中另外一个独特的表位。观察到的3种HGV变异体的氨基酸序列与PNF-2161和JC分离株的序列的比较表明有极少数氨基酸取代基。实施例14具有免疫反应性的克隆的进一步鉴定A.亚克隆1.Y5克隆克隆Y5-10,Y5-16和Y5-5被选择用于亚克隆至表达载体pGEX-HisB中。设计除去位于这些克隆末端的外部接头序列的PCR引物。这些引物还被引入(i)位于各个插处片段5’末端的NcoI位点,和(ii)位于各插入片段3’末端的BamHI位点。使用这些引物(见表22),从2μl噬菌斑纯的贮藏物扩增DNA片段。如下进行扩增94℃/1分钟,50℃/1.5分钟,72℃/2分钟将扩增进行30个循环。扩增后,使用“WIZARDPCR”旋转柱纯化得到的DNA,其中样品稀释成50μl,并用NcoI和BamHI酶解过夜。将最小量的30单位的各种酶用于限制性核酸内切酶酶解中(NcoI,BoehringerMonnhiem;BamHI,Promega)。将酶解的PCR片段过夜连接到已用NcoI和BamHI酶解的表达载体pGEX-HisB中。使用热休克方案(Ausubel,等,Maniatis,等)将各组连接质粒独立地用于转化大肠杆菌菌株W3110。在含有100μg/ml氨苄青霉菌的LB平板选择转化体,抗体克隆被用于接种2ml含有100μg/ml氨苄青霉素的LB。还制备表达非重组sj26/his蛋白质的培养物。在37℃保温过夜后,将培养物以1/10稀释至2ml含有氨苄青霉素的新鲜LB中,在37℃下再保温1小时。加入IPTG使最终浓度为0.2mM,在37℃下,将培养物再培养3小时。通过离心使细菌成沉淀,并将细菌沉淀重新悬浮于100μlPBS中。将100μl2×SDS样品缓冲液(0.125MTris,pH6.8,10%甘氨酸,5%β-巯基乙醇,2.3%SDS)加入到沉淀物中。旋涡振荡得到的溶菌产物,加热至100℃,并保持5分钟。将每种溶菌产物的等分试样上样至12%丙烯酰胺SDS-PAGE凝胶中。通过电泳对表达蛋白质按大小进行分级分离。使用标准方法(Harlow,等)将分离蛋白质从凝胶转移至硝酸纤维素滤膜上。用考马斯亮兰蛋白质染色含有表达蛋白质的另一凝胶。带有质粒Y5-10,Y5-5和Y5-16的转化体表达了显著量的正确大小的重组融合蛋白质。通过将Western印迹(上面制备的)和与sj2发生特异性免疫反应的小鼠单克隆抗体(SierraBioSourle,Gilroy,CA)一起保温证实了重组融合的一致性。如下获得被挑选的克隆含有适宜插入片段的另外的证明。通过用含有少量能表达已接种的重组克隆的细菌的牙签接种40μlTE溶液来制备各个克隆的噬菌体溶液。从各溶液吸取5μl样品,分别进行PCR扩增。扩增采用适宜的正向引物(例如可能表达Y5-10的克隆的Y5-10)和与位于3’至质粒pGEX-HisB克隆位点的序列同源的反向引物(SEQIDNO104)。PCR扩增如下进行25次94℃/1分钟,50℃/1.5分钟,72℃/2分钟。在这些条件下,选择用于进一步分析的所有克隆产生不具其它明显的带的正确大小的DNA带。从Y5-10,Y5-16和Y5-5插入片段(表达为sj26-his融合蛋白质)表达的抗原的免疫反应性如下确定。将上面制备的粗溶菌产物的等分试样(15μl)通过使用12%丙烯酰胺凝胶的SDS-PAGE按大小进行分级分离。将蛋白质电印迹(“NOVEXMINICELLMINIBLOTII”,SanDiego,CA)至硝酸纤维素滤膜上。接着将滤膜分别与下面血清中的一种进行保温JC,PNF2161,极正常血清4(SN4)(R05072)作为阴性对照。另外,将一滤膜与抗sj26单克隆抗体(RM001;SierraBiosource)进行保温。如所预料的,表达由Y5-10,Y5-5和Y5-16插入片段的编码的抗原的细菌产生的重组蛋白质全都与JC血清反应。没有观察到与PNF2161或SN4血清反应。所有蛋白质看来被以与通过它们与抗sj26单克隆抗体的反应性而确定的类似的水平表达。Y5-5和Y5-10编码的蛋白质被选择用于进一步的纯化。培养带有含有pGEX-HisB载体的Y5-5-和Y5-10-的大肠杆菌,如上所述诱导融合蛋白质的表达。在1500psi下,使用FrenchPress将细胞溶解在含有2mMPMSF的PBS中。离心粗溶菌产物以除去细胞碎片。以高流速将上清液上样至甘胱谷肽亲和柱上,将柱用10柱体积的PBS洗涤。将Y5-5和Y5-10融合蛋白质用10mM含有10mM谷胱甘肽的TrispH8.8洗脱。用缓冲液A(10mM含有8M尿素的Tris,pH8.8)以1/10将各融合蛋白质样品稀释,并将其上样至镍电荷螯合(nickelcharged-chelating“SEPHAROSE”快速流动柱上。将各柱用缓冲液A重复洗涤直至没有其它污染物被洗脱下来。用一个梯度的咪唑缓中液A洗脱融合蛋白质。在20柱体积中使一个咪唑梯度从0度至0.5M。收集各级份。通过使用12%聚丙烯酰胺凝胶的标准SDS-PAGE分析每组级分。分别制备含有Y5-5和Y5-10融合蛋白质级分的库。图8A-8D显示了下面样品(μg/道)的Western印迹分析的结果泳道1,Y5-10抗原1.6μg;泳道2,Y5-10抗原0.8μg;泳道3,Y5-10抗原0.4μg;和泳道4,Y5-10抗原0.2μg。将人血清JC(图8A)和极正常2血清(图8B)以1∶100稀释。将抗GST小鼠单克隆抗体RM001(图8C)以1∶1000稀释。图8D显示通过SDS-PAGE分析,被转移至硝酸纤维素膜上和用PonceauS蛋白质染色(Kodak,Rochester,NY;Sigma)的Y5-10抗原。箭头指示Y5-10抗原的位置。这些结果证明Y5-10与N-(ABCDE)人血清JC特异性地发生免疫反应。图9A-9D显示下面样品的Western印迹分析结果。泳道1,Y5-5抗原3.2μg;泳道2,Y5-5抗原1.6μg;泳道3,Y5-5抗原0.8μg;泳道4,Y5-5抗原0.4μg;泳道5,Y5-5抗原0.2μg;泳道6,GE3-2抗原0.4μg;和泳道7,Y5-10抗原0.4μg。将人血清JC(图9A),T55806(图9B)和极正常2血清(图9C)以1∶100稀释。将RM001,抗GST小鼠单克隆抗体(图9D)以1∶1000稀释。箭头指示抗原Y5.5,GE3.2和Y5.10的位置。这些结果表明Y5-5抗原与JC血清的特异的免疫反应性。另外,抗原GE3-2和Y5-10与T55806发生反应。然而,Y5-5抗原不与HGV阳性血清T55806发生反应。Y5-10抗原还被通过SDS-聚丙烯酰胺凝胶电泳被按大小分级分离。将凝胶用考马斯兰染色。用激光光密度计扫描凝胶纯度。Y5-10融合蛋白质的纯度为约95%。2.ENV克隆最初通过用HGV阳性血清J21094筛选ENV表位文库将免疫克隆Q7-12-1分离。采用序列特异性引物分离包含在Q7-12-1λgt11克隆中的HGV插入片段。将Q7-12-1插入片段切割下来,并克隆至pGEX-Nde中。插入片段的序列通过DNA序列测定来证实(SEQIDNO275)。3.NS3克隆最初通过用HGV阳性血清E57963筛选NS3表位文库将免疫克隆Y12-15-1分离。采用序列特异性引物分离包含在Y12-15-1λgt11克隆中的HGV插入片段。将Y12-15-1插入片段切割下来并克隆至pGEX-Nde中。插入片段的序列通过DNA序列测定来证实(SEQIDNO276)。最初通过用HGV阳性血清J21689筛选NS3表位文库将免疫克隆Y12-10-3分离。采用序列特异性引物分离包含在Y12-10-3λgt11克隆中的HGV插入片段。将Y12-10-3插入片段切割下来并克隆至pGEX-Nde中。选择性克隆产生的融合蛋白质通过Western印迹分析来评价,插入片段的序列通过DNA序列测定来证实(SEQIDNO277)。4.NS2克隆分离由SEQIDNO14的NS2区序列的互补序列产生的多个负链免疫克隆。存在至少2个由HGV负链编码的重要的ORFs位于SEQIDNO14的互补链的核苷酸6723-7259之间,并还在核苷酸6774处具有5’甲硫氨酸。第二个ORF编码162个氨基酸的蛋白质。将两个负链ORFs序列的选择部分克隆至表达载体pGEX-Nde中。使用适宜的寡核苷酸引物通过PNF2161SISPA物质的PCR扩增获得所有的亚克隆。因此它们包含HGV-PNF2161变异体的序列。表23显示ORF的名称,大小以及相对于SEQIDNO14互补链的位置。表23</tables>表的开始2列确定了以SEQIDNO14互补链为标准的NS2区5’和3’负链ORF的位置。其余的列示由所有9个克隆表达的特异性核苷酸序列。注意到一些克隆表达的特异性核苷酸序列。注意到一些克隆表达位于5’至PRF假设的HGV起始甲硫氨酸的氨基酸。还注意到所列的最后克隆K3P-KF2/KR1为表达ORF5’的所指部分以及接着的ORF3’的所指部分的嵌合体。接着将所有DNA片段克隆至pGEX-Nde中。还鉴定和证实了所含的插入片段克隆。5.NS5A克隆表24列出了大量NS5a克隆以及它们对应于SEQIDNO14的区。表24将这些序列克隆至用于被编码的蛋白质抗原的表达的载体pGEX-Nde。B.被选择的HGV亚克隆的Western印迹分析为了确定上面描述的负链和正链结构的活性,基本上如实施例13B中所描述,从表达各种HGV亚克隆的细菌制备全部细胞溶胞产物。接着通过SDS-PAGE将表达蛋白质等分试样分级分离,将蛋白质转移至硝酸纤维素滤膜上,用HGV阳性或对照血清(如抗si26MABRM01)检测滤膜。将印迹与适宜的报告抗体一起保温。根据被试验的HGV蛋白质,用HGV血清J21689和T56633检测与蛋白质NORF-F3/R2清晰的免疫反应性。NORF-F3/R2亚克隆表达还由负链表位克隆的Q9序列编码的氨基酸序列。观察到的与HGV血清T56633强的反应性证实了HGV负链的这个区的免疫反应性。没有观察到NORF-F3/R2蛋白质与HGV阴性个体R04316的血清或被测试的任何其它5种HGV阴性极正常血清的反应。另外的印迹表明表达5’负链ORF的一半所在的羧基末端的氨基酸的其它主要的5’ORF克隆NORFKF2-R4不与HGV阳性血清T56633反应。这个观察结果与上述Q9表位克隆的位置结合表明负链这部分的免疫原性表位被包含在上面描述的55个氨基酸中(SEQIDNO273)。这序列被包括J21689的其它HGV抗血清识别的事实表明在HGV感染的个体中对这个序列的免疫反应性是比较普遍的。另外,在具有Y12-10-3蛋白质时,观察到了清晰的与HGV感染血清J21689,J29374和E57963的免疫反应性。这种反应的特异性还被在不存在通过IPTG诱导的Y12-10-3蛋白质表达的情况下,没有观察到与HGV抗血清J29374或E57963的免疫反应性而得到支持。用7种试验的极正常血清,没有观察到与Y12-10-3发生反应。实施例15多抗原HGV诊断分析虽然上述表位克隆看起来不与所有的HGVPCR阳性血清反应,但许多克隆与大部分被再检测的HGV感染血清反应。这些蛋白质不另外显示与HGV阴性血清的真正交叉反应性。因此可以设计一种诊断分析法,将其中几个这种蛋白质混合,这样将各自的蛋白质反应性加起来。这种分析被期望对检测HGV阳性血清具有相对高的灵敏性,对HGV阴性血清具有相对低的背景反应性。用于这种分析中的一般表位/抗原包括,但不局限于NORF-F3/R2(NS2-Neg链),Y12-10-3(NS3),Q11-F2-R1(NS5a),Y5-10(NS5a),Y5-5(NS5a),Q11-F2-R2(结合2个NS5a表位)。对于这种分析,一般选择含有识别HGV阳性血清不同亚组(Subset)的不同唯一的表位的各个抗原。另外,该抗原一般不与HGV阳性血清明显反应。按照本发明的指示,可分离另外有用的免疫原性克隆。多抗原诊断分析可采取多种形式。在一个实施方案中,分析可能需要固定化的各种例如5个HGV蛋白质和位于硝酸纤维素条或其它常规固相形式各分离位置上的对照蛋白质。另外,例如HGV融合蛋白质的非病毒部分可通过插入或缺失被修饰,这样它们将自然地迁移至SDSPAGE和随后的Western印迹分析中容易辨认的位置。接着将条保温在试验血清中。检验结合的抗体后,血清可根据(i)与之发生免疫发生的抗原的编号和(ii)免疫反应的强度来计分。与非HGV蛋白质的反应性将提供不典型的血清。与非HGV蛋白质的反应性将血清分为HGV阴性。可通过混合单一反应区带的纯化抗原蛋白质或通过形成表达2或多个作为简单蛋白质(如HGV镶嵌型多肽)的反应表位的蛋白质构建物而形成基于ELISA的分析。本文描述了构建镶嵌型多肽的方法。上述的Q11-F2-R2构建物实际上代表编码单多肽链上的2个独立表位的“基质蛋白质”(“matrixprotein”)。Western印迹分析可作为该ELISA筛选试验的证明。备选或另外的,可将全长HGV蛋白质,如E2,NS5a和NS3置于单一反应区带中。与这些蛋白质反应的血清也可通过Western印迹分析被证实为HGV阳性。实施例16大的HGV多肽的表达A.大肠杆菌中较大HGV多肽的表达1.克隆和表达为了识别形成的HGV表位(没有被小的重叠HGV构建物或噬菌体文库筛选包括),在基于推判的酶切位点(Bazan等,1989;Chamber,等,1990b;Grakoui等,1993;KyteandDoolittle,1982)的pET-21a(+)载体(Novagen,WI)中产生较大的HGV蛋白质构建物。各HGV蛋白质构建物以与克隆至pGEX载体中的HGV序列类似的形式产生。简而言之,选择的HGV序列为从HGV(+)人血清来源使用HGV序列特异性引物扩增的RT-PCR。引物被设计成含有用于pET载体中克隆操作的适宜的限制性位点。感兴趣的编码序列一般被插入到载体的EcoRI位点和HindIII位点之间以产生与T7.Tag前导序物的5’框内融合和与六聚体组氨酸序列的3’框内融合。T7.Tag(11个氨基酸序列)使融合蛋白质的检测可使用抗-T7.Tag单克隆抗体(Novagen,WI)。在融合蛋白质羧基端的组氨酸六聚体使得蛋白质的纯化可使用固定化的金属离子亲和层析。将HGV片段适当地连接至酶解的pET-21a(+)载体中。将连接产物转化至感受态大肠杆菌中(HMS174;Novagen,WI)。来自转化HMS174的质粒DNA通过使用与插入分子旁侧的pET-21a(+)载体序列同源的引物T7F(SEQIDNO157)和T7R(SEQIDNO158)的PCR被用来分析HGV序列的存在。PCR产物的大小为插入片段大小加上从载体产生的约260bp。对于每一构建物,PCR结果证实了插入序列的存在。选择带有适宜插入片段的转化体,制备带有HGV插入片段的质粒DNA,并引入用于HGV蛋白质表达的HMS174(DE3)感受态大肠杆菌中。用1mMIPTG诱导HGV蛋白质的表达。通过在考马斯兰染色的凝胶上的推判大小的蛋白质的出现监测T7.Tag融合蛋白质的表达。通过使用抗T7.Tag抗体的Western印迹分析(Novagen,WI)来证明融合蛋白质的表达。pET-21a(+)载体表达的HGV蛋白质示表25中。表达蛋白质的起始点和终止点以SEQIDNO14为标准给出。GE-Cap的氨基酸序列示于SEQIDNO185中。表25</tables>*这些序列以SEQIDNO178为标准给出。图12显示通过使用T7.Tag单克隆抗体的Western印迹分析证实的各个HGV蛋白质的表达。图12中的泳道如下泳道1,事先染色的分子量标准(Bio-Rad);泳道2,未诱导的GE-Cap溶菌产物;泳道3-11,分别为IPTG诱导的GE-Cap,E1a,E2,NS2b,NS3,NS4a,NS4b,NS4和NS5b的溶菌产物。泳道12含有1μg纯化的NS5a。每个抗原的位置用箭头标记,如图12所示,HGV蛋白质在大肠杆菌中表达。2.pET载体中表达的HGV蛋白质的Western印迹分析如实施例11C所述,使用大肠杆菌全细胞溶菌产物和被预吸收的血清进行在pET载体表达的HGV蛋白质的Western印迹。分析结果表明,一些pETHGV蛋白质特异性地与HGV阳性血清发生免疫反应,但不与HGV阴性血清发生免疫反应,GE-NS2b-1蛋白质与J21689血清发生免疫反应。在Western印迹分析中,GE-NS5a-3蛋白质与一些HGV(+)血清发生免疫反应,包括JC,T55806,T56633,J21689,E57963和R0001。在这些血清中T55806,J21689和E57963为HCV共阳性(通过PCR分析)。GE-NS2b-1和GE-NS5a-3都不与一些试验的HGV阴性血清发生免疫反应。图10A-10F显示考查抗原GE-NS2b和GE-NS5a3的反应性的Western印迹实验的一系列典型结果。图10A-10F的每一印迹中的泳道如下泳道1,未诱导的GE-NS2b溶菌产物;泳道2,IPTG诱导的GE-NS2b溶菌产物;泳道3,未诱导的GE-NS5a溶菌产物;和泳道4,IPTG诱导的GE-NS5a溶菌产物。将每个印迹与人血清或鼠单克隆抗体一起保温图10A,J29374;图10B,J21689;图10C,T56633;图10D,T43608(极正常血清);图10E,抗T7.Tag;和图10F,考马斯染色凝胶。所用的血清或单克隆抗体在每个印迹上指明。人血清以1∶100稀释,抗T7.Tag鼠单克隆抗体以1∶1000稀释。除开上面所列的血清,用GE-NS5a筛选另外的HGVPCR阳性血清。这些分析结果证实了GE-NS5a抗原与多HGV感染的血清的反应性。GE-NS5b与HGV(+)血清JC发生免疫反应,但T55806不与试验的HGV(+)阴性血清发生免疫反应。图13A-13E显示一系列考查抗原GE-NS5b的反应性的Western印迹实验的结果。每个印迹图中的泳道如下泳道1,预染色的分子量标准(Bio-Rad);泳道2,未诱导的GE-NS5b溶菌产物;泳道3,IPTG诱导的GE-NS5b溶菌产物。将各印迹与人血清或小鼠单克隆抗体一起保温图13A,抗T7.Tqg单克隆抗体;图13B,JC;图13C,T55806;和图13D,T43608(极正常血清)。图13E为考马斯兰染色。图14A到14D显示一系列考查抗原GE-E2反应性的Western印迹实验的结果。图14A-14D中的每一个中的泳道如下泳道1,预染色的分子量标记(Bio-Rad);泳道2,未诱导的GE-E2溶菌产物;泳道3,IPTG诱导的GE-E2溶菌产物。将各印迹与人血清或小鼠单克隆抗体一起保温图14A,抗T7.Tqg单克隆抗体;图14B,3831781;和图14C,T43608(极正常血清)。图14D为考马斯兰染色。使用的血清或单克隆抗体在各印迹上指明。GE-E2蛋白质与HGV阳性血清3831781,但不与极正常血清T43608发生免疫反应(分别为图14B和14C)。抗原GE-Cap和GE-NS4a也与HGV(+)血清J21689特异性地发生免疫反应。B.在昆虫细胞中较大HGV抗原的表达使用重组杆状病毒的蛋白质表达提供了以下优点(i)高水平的重组蛋白质表达,和(ii)高等真核体系的好处,包括有效的蛋白质移位和修饰。这个体系尤其有利用于移位蛋白质的表达,如HGVE1,E2和NS2a。1.克隆和表达草地贪夜蛾(Spodopterafrugiperada)昆虫细胞培养物sf21和苜蓿银纹夜蛾(Aufografacalifomica)核多角体病毒“BACULOGOLD”(Pharmingen,SanDiego,CA)的衍生物被用于HGV多肽的表达。已有的方案被用于昆虫细胞培养和通过用线性化的杆状病毒DNA(King,1992)共转染杆状病毒质粒转化载体产生重组杆状病毒。用常规技术构建杆状病毒质粒转移载体(Maniatis,等,Sambrook,等)。杆状病毒转化载体pAcYM1(King,等,1992)被通过将编码组氨酸六聚体的双链寡核苷酸连接到载体的BamHI编码位点(载体称为pAcYMIH)而修饰。终止密码子(TAA)被放在组氨酸六聚体序列之后。这样在表达蛋白质的羧基末端提供了一个组氨酸六聚体。在pAcYMIH中,pAcYMI亲代载体的BamHI克隆位点仍保持完整,并可被用于克隆框内具有组氨酸六聚体的各种基因。组氨酸六聚体提供了一快速有效的纯化表达蛋白质的方法(Janknecht,等,1991)。第二个杆状病毒转化载体pVT-Bac也用类似方式修饰以提供一个位于表达蛋白质羧基端的组氨酸六聚体。pVT-Bac象pAcYMI一样含有一个强的后期多角体蛋白启动子。另外,pVT-Bac还提供了一个强的昆虫移位信号序列以保证表达蛋白质的有效移位(Tessier,等,1991)。pVT-Bac载体通过将编码一个组氨酸六聚体的双链寡核苷酸连接到载体的BamHI克隆位点(产生pVT-BacH载体)而被修饰。在得到的pVT-BacH载体中pVT-Bac亲代载体的BamHI克隆位点保持完整,可被用于克隆框内具有昆虫前导序列和组氨酸六聚体序列的基因。通过逆转录PCR获得编码各种HGV基因的DNA片段。根据推判的酶切位点(Bazan,等,1989;Chambers,等,1990b;Grakoui,等,1993;KyteandDoolittle,1982)选择HGV基因组的区。下面引物对被用在使用PNF2161来源的核酸的RT-PCR扩增反应。E1,SEQIDNO242,SEQIDNO243;E2B(HGV信号序列),SEQIDNO244,SEQIDNO245;E2C(昆虫信号序列),SEQIDNO246,SEQIDNO247;NS2a,SEQIDNO248,SEQIDNO249;NS2b,SEQIDNO250,SEQIDNO251;NS3,SEQIDNO252,SEQIDNO253;NS4a,SEQIDNO254,SEQIDNO255;NS4b,SEQIDNO256,SEQIDNO257;NS5a,SEQIDNO258,SEQIDNO259;NS5b,SEQIDNO260,SEQIDNO261;和E1-E2-NS2a,SEQIDNO262,SEQIDNO262。将扩增的DNA片段用BamHI或BglII核酸内切酶酶解,并克隆至BamHI切口的pAcYMI,pAcYMIH,pVT-Bac或pVT-BacH载体中。将编码E1和E2羧基末端的锚式(anchor)序列以及NS5b羧基末端水性序列缺失以便于后面的蛋白质纯化。将含有HGV序列的重组杆状病毒质粒转移载体用线性化的杆状病毒DNA共转染,在X-gal(King,等,1992)存在下,选择为白色中心点的重组病毒。将重组病毒两次用噬菌斑纯化和并让其繁殖。在重复性(multiplicity)为5p.f.u/细胞时将单层sf21细胞用重组杆状病毒感染,在27℃下保温60小时。将细胞用PBS洗涤,用TNN缓冲液(50mMTris-HCl,pH8.0,150mMNaCl,0.5%“NONIDET-P40”)溶解。通过以14K将细胞样品离心5分钟分离包涵体。将包涵体重新悬浮在蛋白质解离缓冲液中(10%2-巯基乙醇),10%SDS,25%甘油,10mMTris-HClpH6.8,0.02%溴酚兰),在100℃下保温10分钟。通过SDS-PAGE分析蛋白质表达类型。将蛋白质用0.1%SDS-18%PAGE分离,用考马斯兰染色。大多数HGV蛋白质以高水平表达,可容易地在考马斯兰染色凝胶上检测。NS5a和NS2a多肽用35S甲硫氨酸蛋白质标记而被检测(King等,1992)。如下考查HGVE2蛋白质糖基化作用。将sf21细胞用重组杆状病毒感染,并按如上所述处理。通过0.1%SDS-12%PAGT分离蛋白质,将其电印迹至“IMMOBILON-P”膜上(Millipore,Bedford,MA)上,并与甘露糖残基特异性的雪花莲凝集素反应(Galanthusnivalisagglutinin)反应(BoehringerMannheimDIGGlucan分化试剂盒)。用自身信息序列表达的HGVE2蛋白质被大范围地糖基化,这说明推断的E2信号序列可起如此的作用。2.免疫荧光测定分析用如上所述的杆状病毒构建物感染SF21昆虫细胞。收集细胞,以1.5Krpm的转速离心3分钟,以1×PBS洗涤,再离心。为了免疫荧光分析(IFA)(King,等,1992),将细胞重新悬浮于PBS中,铺至载玻片的孔中,使细胞在载玻片的孔中形成亚汇合层。空气干燥载片。将细胞用预冷却至-70℃的丙酮固定10分钟,用PBS再水合5分钟。吸过过量的PBS。将固定的细胞用下面“封闭”缓冲液处理l小时40mMTris-HClpH7.5,3%山羊血清,1%BSA,1%脱脂奶粉和0.1%明胶。接着将一抗加入到固定的细胞中。一抗包括一系列人HGV阳性血清和阳性对照单克隆抗体。在使用前,用昆虫细胞溶胞产物预吸收血清以除去非特异性蛋白质。在4℃下,将预吸收过夜。未感染的SF21被用作阴性对照。在加入选择性的一抗(血清)后,将载片保温2小时,接着用PBS洗涤几次,除去过量缓冲液。接着将结合了荧光素的二抗(0.5μg/ml浓度)加入至载片上的样品中。二抗的保温时间和温度与一抗的相同。保温后,将载片用PBS洗涤,盖上盖玻片,接着使用荧光显微镜确定细胞的荧光。分析结果如下。表达HGV抗原E1-E2-NS2a的细胞与4/10HGV阳性血清发生免疫反应,与另外的2/10血清发生轻微的免疫反应。表达E1的细胞与1/10血清发生轻微的免疫反应。表达E2的细胞与3/10血清发生免疫反应,与1/10血清发生轻微免疫反应。带有HGV抗原的细胞不与极正常的对照血清发生免疫反应。3.杆状载体中表达的HGV蛋白质的Western印迹分析还对在被重组杆状病毒感染的sf21昆虫细胞中表达的HGV蛋白质进行Western印迹分析。如上所述制备包涵体,将其进行Western印迹分析。用预吸收血清进行Western印迹分析。分析结果证明E2蛋白质(具有内源HGV信号序列的一个变异体E2B,带有昆虫信号序列的第二个变异体E2C)特异性地与HGV(+)血清383178发生免疫反应。图15A-15D显示考查杆状抗原E2B和E2C的反应性的一系列Western印迹实验的结果。图15A-15D的各个印迹中的泳道如下泳道1,预先染色的分子量标准(Bio-Rad);泳道2,E2B溶菌产物;泳道3,E2C溶菌产物;泳道4,β-半乳糖苷酶溶菌产物。各印迹与人或兔血清保温图15A,兔抗E2抗体;图15B,3831781(HGVPCR-阳性血清);图15C,3838857(HGV阴性血清)。图15D考马斯兰染色。使用的血清或兔抗体在各印迹上指明。人血清以1∶100稀释,兔血清以1∶1000稀释。另外,在昆虫细胞中表达的HGV抗原NS2b蛋白质与J21689发生免疫反应。这些结果与用pET表达的HGV蛋白质所获得的结果一致。C.较大抗原在痘苗中的表达1.克隆和表达将HGV基因组的各区整合到用于表达的痘苗病毒基因组中。一般性的HGV多肽表达策略在图16中所出。通过表明推断蛋白质区的开放框画出全部长度的多蛋白(没有按比例)C=强碱性的蛋白质,4A=NS4A,4B=NS4B,5a=NS5A,5b=NS5B。带有核苷酸定位(在多蛋白质下)的各个框代表用于痘苗病毒表达的典型HGV区。框中的数字代表重组病毒的名称。病毒#1由HGVStainT55806的强碱性蛋白质区产生(SEQIDNO185)。产生两组重组病毒。第一组含有相当于HGVcDNA序列分析基础上的各个蛋白质结构域的HGV序列(图16,片段#1-#9)。第二组含有横跨多个蛋白质结构域长达HGV基因组全长的HGV序列(图16,#10,#11,#14)。将HGV基因组的各区克隆至痘苗表达载体的多克隆位点。将包括细菌噬菌体T7体系和大肠杆菌乳糖酵解基因阻遏物的重组痘苗病毒表达系统用于高水平的诱导表达(Fuerst,1986;Zlrog-Stein,1989;Alexander,1992;Moss等)。因此重组蛋白质仅在存在诱导物如异丙基β-D-硫代半乳糖苷(IPTG)时表达。直接克隆和PCR被用于质粒构建。在后者,适于克隆至痘苗病毒中的限制性内切酶位点被掺入用来扩增各DNA片段的引物中。多组氨酸标记也被掺入每一个覆盖HGV各结构域的克隆中,以用于表达蛋白质的纯化。将HGV-PCR扩增产物用适当的限制性内切酶酶解,并连接至痘苗载体上。通过同源重组和药物选择(霉酚酸),将靶HGVcDNA片段整合到疫苗病毒基因组中(Falkner,1988,Earl,1991)。在产生病毒储液之前,将重组病毒用噬菌斑纯化4次。每一克隆的核苷酸长度表示在图16中。较小的克隆组(#1-#9)可用于HGV表位酶谱分析(mapping)。较大克隆(如#10,#11和#14)也可用于实验酶谱分析HGV多蛋白质酶切位点。除图16所示的克隆外,可构建覆盖从NS3-NS5b的多个结构域的另外的重组病毒。将表达质粒转染至用亲代痘苗病毒感染的哺乳动物细胞中。CV-1和BS-C-1细胞存活于补加了10%胎牛血清的基本必需培养基(MZM)。将细胞用于转染(CV-1),重组病毒的选择以及繁殖中(BS-C-1)。2.评价重组蛋白质表达在存在或不存在IPTG的情况下,将BS-C-1细胞用重组病毒感染7小时,以后将细胞用35S-甲硫氨酸标记1小时(Zhang,1991)。简单地说,将1×106BS-C-1细胞用感染复度(multiplicityofinfection)(MOL)为10个噬菌斑形成单位(PFU)/细胞的重组病毒感染1小时,在存在或不存在5mMIPTG的情况下,补加培养基继续感染6小时。在存在或不存在5mMIPTG的情况下,将细胞用600μl没有甲硫氨酸,补加了2.5%透析过的胎牛血清,加上60μci35S-甲硫氨酸(“TRAN35S-标记”ICN,CostaMesa,CA)的培养基脉冲标记6小时。在存在100mMTrispH8.0,150mMNaCl和1%“TRITONX-100”的情况下,在冰中将被标记的细胞溶解10分钟。将核离心沉淀,收集上清液用于分析。通过SDS-聚丙烯酰胺凝胶电泳分析细胞溶胞产物(Fling,1986;Schagger,1987)。将凝胶用荧光自显影溶液“AMPLIFY”(Amersham,ArlingtonHeights,IL)处理之前,将其用50%甲醇和10%乙酸固定,干燥凝胶,将其暴露于X-射线胶片中。运用这种方法已证实了由含有插入片段#4-#11以及#14(图16)的病毒进行的HGV多肽的表达。以类似方式证实了对应于其它区域的多肽的表达。例如,在NS5a构建物中,由IPTG诱导下,产生了迁移至46KDa蛋白质标准之下的独特的多肽。这种蛋白质在不存在IPTG的感染中没有见到,这证实了该蛋白质与NS5a重组蛋白质的一致性。另外,使用抗来自于各病毒感染体的35S-甲硫氨酸标记的细胞溶胞产物的HGV区域特异性的抗血清(例如用来抗来自感兴趣区的分离HGV多肽的兔抗血清)进行限制性免疫沉淀来评价重组病毒的蛋白质表达。例如,已证实NS2,NS3,NS4B,NS5A和NS5B的表达。另一种评价重组蛋白质表达的方法是用HGV-区域特异性抗血清进行Western印迹分析。当全长HGV多蛋白质在#14病毒中表达时(图16),使用HGV区域特异性抗血清进行免疫沉淀检测NS2,NS3和NS5的加工产物,证明了全长HGV克隆在评价多蛋白质加工中的有用性。使用类似于图16所示的表达策略,选择性的HGV蛋白质/抗原可在酵母或CHO细胞中表达。酵母提供了高水平的表达,经济的操作并易于扩大至商业生产。CHO细胞系可使重组蛋白质分泌到用于大规模蛋白质生产和有用分离,例如用于疫苗生产的生长培养基中。实施例17HGV编码的高度碱性(Basic)蛋白质A.用于来自PNF和T55806的HGV转译起始的甲硫氨酸的确定。位于HGV-PVF2161变异体的核苷酸(nt)459(以SEQIDNO14为标准)的甲硫氨酸在多蛋白质的框中。“壳体”区为32个氨基酸长度。在其它HGV分离株中,如T55806,这个区更长(例如约83个氨基酸)位于HGV-PNF2161变异体的核苷酸349(以SEQIDNO14为标准)的甲硫氨酸不在多蛋白质序列的框中,但在HGV-T55806变异体的相同位置的甲硫氨酸在多蛋白质的框中。为了检查是否在HGV-PNF2161的这个位置存在连续(read-through)或核苷体框移位,现进行下面实验。制备构建物含有(i)具有HGVE1区上游的所有MET密码子的HGV基因组序列(如在HGV-PNF2161中,存在6个这种METs,在T55806中存在5个),(ii)对于每个构建物,两个不同的3’末端,使得可以确定是否发生了连续的核糖体移位。对于给定的基因组DNA,如两个转译产物大小相同,这意味着在终止密码子处被超前终止。另一方面,如果发生连续或框移位,预计得到两个有55个氨基酸不同的产物。在pGEX载体中,总共21个含有来自变异体HGV-PNF2161和HGV-T55806的序列的构建物被亚克隆,在大肠杆菌中相应的蛋白质被表达。得到的转译产物的大小通过考马斯兰染色的凝胶和用单克隆抗GST抗体印迹的Western印迹法确定。诱导和未诱导的样品被制备用于每一个构建物。结果证明蛋白质产物的大小与通过在多蛋白质框中的第一个甲硫氨酸起始的转译所预想的一致。没有框移位或连续的证据。B.另外编码的强碱性蛋白质Fickett(1992)的方法被用来筛选基因组序列HGV-PNF2161和HGV-JC以得到可能编码蛋白质的序列(i)前面描述的多蛋白质的替代,(ii)在HGV-PNF2161和HGV-JC之间显示出保守性,以及(iii)在pH大于10时,具有预计的等电点。识别了两种这样的可能蛋白质。第一个蛋白质在HGVPNF2161中由残基628-882(以SEQIDNO14为标准)编码,在HGV-JC中由残基556-810(以SEQIDNO182为标准)编码。该蛋白质为85个氨基酸长度,大于HFC94-1与JC9B之间的75%的同源性,预计pI为11.6-12.3。第二个蛋白质在HGV-PNF2161(以SEQIDNO14为标准)由残基6844-7125编码,在HGV-JC中由6772-7053编码。该蛋白质为94个氨基酸长度,大于HGV-PNF2161和HGV-JC之间的88%的同源性,预计pI为12.4-12.7。这两个典型的蛋白质代表可能表达的强碱性的HGV蛋白质。实施例18克隆另外的HGV分离株和设计诊断引物A.构建HGV-PNF2161的cDNA克隆通过将三个重叠PCR产物克隆至质粒载体pGEM3Z中构建来自PNF2161的几乎为全长的HGV基因组的cDNA克隆(Promega,Madison,WI)。用于构建的PCR产物通过使用“SUPERSCRIPTII”(Gibco/BRL,Gaithersburg,MD)的逆转录,接着使用长靶序列扩增允许的反应条件进行PCR(“rTth-XL”聚合酶和“XLPCRBUFFERS”,AppliedBiosystems,FosterCity,CA)而获得。用于“大范围”PCR反应的rTth酶具有校正错误掺入的核苷酸的校读活性(即3’-5’外切核酸酶的活性),因此提供了高可靠性的PCR。用于构建HGV基因组的三个产物包括(i)使用引物GV75-36FE(SEQIDNO228)和GV75-7064RLE(SEQIDNO229)扩增的内在6.7kbp产物(SEQIDNO14的核苷酸2101-8834);(ii)使用28F(SEQIDNO230)和FV94-2864R(SEQIDNO231)扩增的2.8kb5’-末端产物(SEQIDNO14的核苷酸38-2899);和(iii)使用FV94-6439F(SEQIDNO232)和FV94-9331R(SEQIDNO233)扩增的2.9kb3’-末端产物(SEQIDNO14的核苷酸6449-9366)。首先,将6.7kb内在片段克隆至“TA-载体”pCRII中以产生克隆HGV7。接着,从HGV7中取出6.1kbKpnI/EcoRI片段,将其与用KpnI/X(baI酶解的2.8kb5’-末端产物混合(引物28F含有人工XbaI位点),并克隆至XbaI/EcoRI酶解的pGEM3Z中。该8.8kb克隆,缺乏HGV基因组的3’部分的约0.6kb,被称为HGV-KEX-2。为了构建几乎为全长的HGV基因组,将3’-末端HGV产物用NheI和EcoRI酶解(引物FV94-9331R含有人工EcoRI位点),并克隆至NheI/EcoRI酶解的HGV-KEX-2质粒中,产生一个为9329个核苷酸的克隆HGV-PNF2161序列(SEQIDNO14的核苷酸38-9366),该克隆被称为3Z-HGV94-6,3Z-HGV94-6的互补序列列为SEQIDNO234。克隆3Z-HGV94-6可被用于产生体外转录全长HGVRNA或它的一部分(例如使用SP6聚合酶)。该RNA分子可被用于转染人细胞系。这个方法可被用于对病毒基因组各区的酶谱分析,研究它的复制,了解人细胞HGV致病性的机理(Rice等,1989;Sumiyoshi,等,1992;Yoo,,增995)。B.克隆JC变异体在40,000rpm下将1mlJC血清离心2小时(Beckman,SpincoRotor70.1Ti)。用“TRI-REAGENT”(MRC,Cincinnati,OH)提取得到的沉淀物,产生3个相。上面的相仅含RNA。获取该相,通过乙醇沉淀回收RNA。通过两种方法从JC样品中产生HGVcDNA分子。第一种方法是通过特异性的巢居引物的JC核酸样品的扩增(RT-PCR)。引物序列以从PNF2161血清获得的HGV序列为基础。选择引物的标准为(i)具有高G/C含量的区,和(ii)没有重复序列。用于产生HGVcDNA分子的第二个方法是使用HGV(PNF2161)特异性引物扩增,接着用32P-标记的寡核苷酸探针对HGV特异性序列进行识别。基本上如Sambrook等,(1988)所描述进行DNA杂交。PCR产生的克隆被(i)克隆至“TA”载体上(Invitrogen,SanDiggo,CA),并用载体引物(TAP和TAF)测序,或(ii)PCR扩增后直接测序。探针和引物的序列以从PNF2161血清获得的HGV变异体为基础。这两种方法产生了来自于JC血清的多重叠HGV片段。每一片段均被克隆和测序。序列以获得列为SEQIDNO182(多肽序列,SEQIDNO183)的HGV(JC-变异体)的共有序列。HGV(JC-变异体)病毒的各区的序列以来自至少三个不同的重叠独立的克隆的共有序列为基础。C.其它HGV变异体除开HGVPNF2161-变异体和JC-变异体序列,通过类似上面所述的方法,已从血清BG34,T55806和EB20中获得三个独立的HGV分离株。这些分离株的部分序列被列为SEQIDNO176(BG34核酸),SEQIDNO177(BG34多肽),SEQIDNO178(T55806核酸),SEQIDNO179(T55806多肽),SEQIDNO180(EB20-2核酸)和SEQIDNO181(EB20-23多肽)。D.诊断性PCR用的选择性引物PCR引物和相应分析方法的设计可-般以对保守区的分析为基础从HGV组的区产生。根据HGV-JC变异体与HGV-PNF-2161变异体的比较,HGV的5’非转译区被选择作为这样的区,用于设计其它检测HGV分离株的基于PCR的诊断试验。两个典型的引物为FV-94-22F(SEQIDNO124)和FV94-724R(SEQIDNO125)。这些引物扩增HGV基因约为728bp的片段。对来自采用两个用于36个HGV分离株的引物的反应的扩增产物进行序列分析(包括PNF2161和JC,见表26)。约728个碱基对的扩增产物的约400个碱基对的区域(SEQIDNO14的核苷酸69-469)被用于多次序列校准(表26)以及保守区的进一步确定(见下表)。表26</tables>用于样品中HGV分离体的检测的基于扩增(例如PCR)或基于探针的方法/分析法包括适宜引物/探针序列的选择。这种分析法的两个标准为对HGV序列低的模板敏感性和特异性。序列的校准(例如刚才所述的)可有助于引物/探针的选择和设计。选择引物的一些标准如下(i)在序列中引物对的正向和反向引物不能显著地互补;以及(ii)引物不应具有显著的自身互补性或可能形成二级结构。这些预防措施减少了引物二聚体和寡聚体产生的可能性。引物可能最适宜于从在不同分离株中没有显示出变异的序列区来设计,但也可从较小同源性的区,通过在用于计算已知分离株趋异性的位置上掺入混合碱基或中性碱基例如肌苷的合成方法来设计。下面两组引物为可被用于设计检测HGV基因组的基于PCR的分析方法的引物的实例正向引物SEQIDNO222,SEQIDNO223和SEQIDNO244;和反向引物SEQIDNO225,SEQIDNO226和SEQIDNO227。在HGV诊断分析的设计中,可以采用引物的各种组合。引物的最佳的组合由实验确定,一般建议考虑分析方法的敏感性和特异性。这些考虑包括下面(I)为了有效扩增和易于产物检测的长度为100-300bp的PCR产物;(ii)能重复检测至少10个拷贝的靶HGV的能力;和(iii)能重复检测大多数HGV变异体的能力。另外,探针序列可用混合碱基和中性碱基合成法类似地设计和/或可以降低的严谨性被使用以检测大多数HGV变异体。虽然已参考具体方法和实施方案描述了本发明,但应该理解在不背离本发明的情况下,可以作各种修改和变化。序列表(1)一般的信息(i)申请人(A)名称GenelabsTechnologies,Inc.(B)街道505PenobscotDrive(C)城市RedwoodCity(D)州CA(E)国家USA(F)邮政编码94063(ii)发明名称庚型肝炎病毒和它的分子克隆(iii)序列数目277(iv)通信地址(A)地址Dehlinger&amp;Associates(B)街道350CambridgeAve.,Suite250(C)城市PaloAlto(D)州CA(E)国家USA(F)邮编94306(v)计算机可读形式(A)媒介类型软磁盘(B)计算机IBMPC兼容(C)操作系统PC-DOS/MS-DOS(D)软件PatentInRelease#1.0,Version#1.25(vi)本申请数据(A)申请号(B)申请日(C)分类(vii)优先申请数据(A)申请号US08/389,886(B)申请日15-FEB-1995(C)记录号4600-0201.35(vii)优先申请数据(A)申请号US08/357,509(B)申请日16-DEC-1994(C)记录号4600-0201.34(vii)优先申请数据(A)申请号US08/329,729(B)申请日26-OCT-1994(C)记录号4600-0201.33(vii)优先申请数据(A)申请号US08/344,271(B)申请日23-NOV-1994(C)记录号4600-0202(vii)优先申请数据(A)申请号US08/285,558(B)申请日03-AUG-1994(C)记录号4600-0201.30(vii)优先申请数据(A)申请号US08/285,543(B)申请日03-AUG-1994(C)记录号4600-0201.32(vii)优先申请数据(A)申请号US08/246,985(B)申请日20-MAY-1994(C)记录号4600-0201(viii)代理人的信息(A)姓名Fabian,GaryR.(B)登记号33,875(C)参考/记录号4600-0201.41/G100PCT(ix)通讯的信息(A)电话(415)324-0880(B)传真(415)324-0960(2)SEQIDNO1的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株SISPA引物,拓扑链接头AB(xi)序列描述SEQIDNO1GGAATTCGCGGCCGCTCG18(2)SEQIDNO2的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株接头AB,底链(xi)序列描述SEQIDNO2CGAGCGGCCGCGAATTCCTT20(2)SEQIDNO3的信息(i)序列特征(A)长度237个碱基对(B)类型核酸(C)链型双链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株PNF2161克隆470-20-1(ix)特性(A)名称/关键词(B)位置1..237(xi)序列描述SEQIDNO3GAATTCGCGGCCGCTCGGGCTGTCTCGGACTCTTGGATGACCTCGAAT48GluPheAlaAlaAlaArgAlaValSerAspSerTrpMetThrSerAsn151015GAGTCAGAGGACGGGGTATCCTCCTGCGAGGAGGACACCGGCGGGGTC96GluSerGluAspGlyValSerSerCysGluGluAspThrGlyGlyVal202530TTCTCATCTGAGCTGCTCTCAGTAACCGAGATAAGTGCTGGCGATGGA144PheSerSerGluLeuLeuSerValThrGluIleSerAlaGlyAspGly354045GTACGGGGGATGTCTTCTCCCCATACAGGCATCTCTCGGCTACTACCA192ValArgGlyMetSerSerProHisThrGlyIleSerArgLeuLeuPro505560CAAAGAGAGGGTGTACTGCAGTCCTCCACGAGCGGCCGCGAATTC237GlnArgGluGlyValLeuGlnSerSerThrSerGlyArgGluPhe657075(2)SEQIDNO4的信息(i)序列特征(A)长度79个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO4GluPheAlaAlaAlaArgAlaValSerAspSerTrpMetThrSerAsn151015GluSerGluAspGlyValSerSerCysGluGluAspThrGlyGlyVal202530PheSerSerGluLeuLeuSerValThrGluIleSerAlaGlyAspGly354045ValArgGlyMetSerSerProHisThrGlyIleSerArgLeuLeuPro505560GlnArgGluGlyValLeuGlnSerSerThrSerGlyArgGluPhe657075(2)SEQIDNO5的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株HNV-R1(xi)序列描述SEQIDNO5GTTGACCAACTGAGTCTGAAGC22(2)SEQIDNO6的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株HAV-F1(xi)序列描述SEQIDNO6GATTGGAAATCTGATCCGTCCC22(2)SEQIDNO7的信息(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株HCV-LANR个体(xi)序列描述SEQIDNO7TCGCGACCCAACACTACTC19(2)SEQIDNO8的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株HCV1532个体(xi)序列描述SEQIDNO8GGGGGCGACACTCCACCA18(2)SEQIDNO9的信息(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470-20-1-77F(xi)序列描述SEQIDNO9CTCTTTGTGGTAGTAGCCGAGAGAT25(2)SEQIDNO10的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470-20-1-211R(xi)序列描述SEQIDNO10CGAATGAGTCAGAGGACGGGGTAT24(2)SEQIDNO11的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物KL-1(xi)序列描述SEQIDNO11GCAGGATCCGAATTCGCATCTAGAGAT27(2)SEQIDNO12的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物KL-2(xi)序列描述SEQIDNO12ATCTCTAGATGCGAATTCGGATCCTGCGA29(2)SEQIDNO13的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株λgt11,反向引物(xi)序列描述SEQIDNO13GGCAGACATGGCCTGCCCGG20(2)SEQIDNO14的信息(i)序列特征(A)长度9392个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-PNF2161变异体(ix)特性(A)名称/关键词CDS(B)位置459..9077(xi)序列描述SEQIDNO14ACGTGGGGGAGTTGATCCCCCCCCCCCGGCACTGGGTGCAAGCCCCAGAAACCGACGCCT60ATCTAAGTAGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGG120GTGATGACAGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGT180CTTAAGAGAAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGT240GTTGGCCCTACCGGTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGT300TACCCACCTGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTG360ACCAATAGGCGTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGAGAGGG420ACTCCAAGTCCCGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACCCAGC473MetGlyProProSer15TCCGCGGCGGCCTGCAGCCGGGGTAGCCCAAGAATCCTTCGGGTGAGG521SerAlaAlaAlaCysSerArgGlySerProArgIleLeuArgValArg101520GCGGGTGGCATTTCCTTTTTCTATACCATCATGGCAGTCCTTCTGCTC569AlaGlyGlyIleSerPhePheTyrThrIleMetAlaValLeuLeuLeu253035CTTCTCGTGGTTGAGGCCGGGGCCATTCTGGCCCCGGCCACCCACGCT617LeuLeuValValGluAlaGlyAlaIleLeuAlaProAlaThrHisAla404550TGTCGAGCGAATGGGCAATATTTCCTCACAAATTGTTGTGCCCCGGAG665CysArgGlaAsnGlyGlnTyrPheLeuThrAsnCysCysAlaProGlu556065GACATCGGGTTCTGCCTGGAGGGTGGATGCCTGGTGGCCCTGGGGTGC713AspIleGlyPheCysLeuGluGlyGlyCysLeuValAlaLeuGlyCys70758085ACGATTTGCACTGACCAATGCTGGCCACTGTATCAGGCGGGTTTGGCT761ThrIleCysThrAspGlnCysTrpProLeuTyrGlnAlaGlyLeuAla9095100GTGCGGCCTGGCAAGTCCGCGGCCCAACTGGTGGGGGAGCTGGGTAGC809ValArgProGlyLysSerAlaAtaGlnLeuValGlyGluLeuGlySer105110115CTATACGGGCCCCTGTCGGTCTCGGCCTATGTGGCTGGGATCCTGGGC857LeuTyrGlyProLeuSerValSerAlaTyrValAlaGlyIleLeuGly120125130CTGGGTGAGGTGTACTCGGGTGTCCTAACGGTGGGAGTCGCGTTGACG905LeuGlyGluValTyrSerGlyValLeuThrValGlyValAlaLeuThr135140145CGCCGGGTCTACCCGGTGCCTAACCTGACGTGTGCAGTCGCGTGTGAG953ArgArgValTyrProValProAsnLeuThrCysAlaValAlaCysGlu150155160165CTAAAGTGGGAAAGTGAGTTTTGGAGATGGACTGAACAGCTGGCCTCC1001LeuLysTrpGluSerGluPheTrpArgTrpThrGluGlnLeuAlaSer170175180AACTACTGGATTCTGGAATACCTCTGGAAGGTCCCATTTGATTTCTGG1049AsnTyrTrpIleLeuGluTyrLeuTrpLysValProPheAspPheTrp185190195AGAGGCGTGATAAGCCTGACCCCCTTGTTGGTTTGCGTGGCCGCATTG1097ArgGlyValIleSerLeuThrProLeuLeuValCysValAlaAlaLeu200205210CTGCTGCTTGAGCAACGGATTGTCATGGTCTTCCTGTTGGTGACGATG1145LeuLeuLeuGluGlnArgIleValMetValPheLeuLeuValThrMet215220225GCCGGGATGTCGCAAGGCGCCCCTGCCTCCGTTTTGGGGTCACGCCCC1193AlaGlyMetSerGlnGlyAlaProAlaSerValLeuGlySerArgPro230235240245TTTGACTACGGGTTGACTTGGCAGACCTGCTCTTGCAGGGCCAACGGT1241PheAspTyrGlyLeuThrTrpGlnThrCysSerCysArgAlaAsnGly250255260TCGCGTTTTTCGACTGGGGAGAAGGTGTGGGACCGTGGGAACGTTACG1289SerArgPheSerThrGlyGluLysValTrpAspArgGlyAsnValThr265270275CTTCAGTGTGACTGCCCTAACGGCCCCTGGGTGTGGTTGCCAGCCTTT1337LeuGlnCysAspCysProAsnGlyProTrpValTrpLeuProAlaPhe280285290TGCCAAGCAATCGGCTGGGGTGACCCCATCACTTATTGGAGCCACGGG1385CysGlnAlaIleGlyTrpGlyAspProIleThrTyrTrpSerHisGly295300305CAAAATCAGTGGCCCCTTTCATGCCCCCAGTATGTCTATGGGTCTGCT1433GlnAsnGlnTrpProLeuSerCysProGlnTyrValTyrGlySerAla310315320325ACAGTCACTTGCGTGTGGGGTTCCGCTTCTTGGTTTGCCTCCACCAGT1481ThrValThrCysValTrpGlySerAlaSerTrpPheAlaSerThrSer330335340GGTCGCGACTCGAAGATAGATGTGTGGAGTTTAGTGCCAGTTGGCTCT1529GlyArgAspSerLysIleAspValTrpSerLeuValProValGlySer345350355GCCACCTGCACCATAGCCGCACTTGGATCATCGGATCGCGACACGGTG1577AlaThrCysThrIleAlaAlaLeuGlySerSerAspArgAspThrVal360365370CCTGGGCTCTCCGAGTGGGGAATCCCGTGCGTGACGTGTGTTCTGGAC1625ProGlyLeuSerGluTrpGlyIleProCysValThrCysValLeuAsp375380385CGTCGGCCTGCCTCCTGCGGCACCTGTGTGAGGGACTGCTGGCCCGAG1673ArgArgProAlaSerCysGlyThrCysValArgAspCysTrpProGlu390395400405ACCGGGTCGGTTAGGTTCCCATTCCATCGGTGCGGCGTGGGGCCTCGG1721ThrGlySerValArgPheProPheHisArgCysGlyValGlyProArg410415420CTGACAAAGGACTTGGAAGCTGTGCCCTTCGTCAACAGGACAACTCCC1769LeuThrLysAspLeuGluAlaValProPheValAsnArgThrThrPro425430435TTCACCATTAGGGGGCCCCTGGGCAACCAGGGCCGAGGCAACCCGGTG1817PheThrIleArgGlyProLeuGlyAsnGlnGlyArgGlyAsnProVal440445450CGGTCGCCCTTGGGTTTTGGGTCCTACGCCATGACCAGGATCCGAGAT1865ArgSerProLeuGlyPheGlySerTyrAlaMetThrArgIleArgAsp455460465ACCCTACATCTGGTGGAGTGTCCCACACCAGCCATTGAGCCTCCCACC1913ThrLeuHisLeuValGluCysProThrProAlaIleGluProProThr470475480485GGGACGTTTGGGTTCTTCCCCGGGACGCCGCCTCTCAACAACTGCATG1961GlyThrPheGlyPhePheProGlyThrProProLeuAsnAsnCysMet490495500CTCTTGGGCACGGAAGTGTCCGAGGCACTTGGGGGGGCTGGCCTCACG2009LeuLeuGlyThrGluValSerGluAlaLeuGlyGlyAlaGlyLeuThr505510515GGGGGGTTCTATGAACCCCTGGTGCGCAGGTGTTCGAAGCTGATGGGA2057GlyGlyPheTyrGluProLeuValArgArgCysSerLysLeuMetGly520525530AGCCGAAATCCGGTTTGTCCGGGGTTTGCATGGCTCTCTTCGGGCAGG2105SerArgAsnProValCysProGlyPheAlaTrpLeuSerSerGlyArg535540545CCTGATGGGTTTATACATGTCCAGGGTCACTTGCAGGAGGTGGATGCA2153ProAspGlyPheIleHisValGlnGlyHisLeuGlnGluValAspAla550555560565GGCAACTTCATCCCGCCCCCGCGCTGGTTGCTCTTGGACTTTGTATTT2201GlyAsnPheIleProProProArgTrpLeuLeuLeuAspPheValPhe570575580GTCCTGTTATACCTGATGAAGCTGGCTGAGGCACGGTTGGTCCCGCTG2249ValLeuLeuTyrLeuMetLysLeuAlaGluAlaArgLeuValProLeu585590595ATCTTGCTGCTGCTATGGTGGTGGGTGAACCAGCTGGCAGTCCTAGGG2297IleLeuLeuLeuLeuTrpTrpTrpValAsnGlnLeuAlaValLeuGly600605610CTGCCGGCTGTGGAAGCCGCCGTGGCAGGTGAGGTCTTCGCGGGCCCT2345LeuProAlaValGluAlaAlaValAlaGlyGluValPheAlaGlyPro615620625GCCCTGTCCTGGTGTCTGGGACTCCCGGTCGTCAGTATGATATTGGGT2393AlaLeuSerTrpCysLeuGlyLeuProValValSerMetIleLeuGly630635640645TTGGCAAACCTGGTGCTGTACTTTAGATGGTTGGGACCCCAACGCCTG2441LeuAlaAsnLeuValLeuTyrPheArgTrpLeuGlyProGlnArgLeu650655660ATGTTCCTCGTGTTGTGGAAGCTTGCTCGGGGAGCTTTCCCGCTGGCC2489MetPheLeuValLeuTrpLysLeuAlaArgGlyAlaPheProLeuAla665670675CTCTTGATGGGGATTTCGGCGACCCGCGGGCGCACCTCAGTGCTCGGG2537LeuLeuMetGlyIleSerAlaThrArgGlyArgThrSerValLeuGly680685690GCCGAGTTCTGCTTCGATGCTACATTCGAGGTGGACACTTCGGTGTTG2585AlaGluPheCysPheAspAlaThrPheGluValAspThrSerValLeu695700705GGCTGGGTGGTGGCCAGTGTGGTAGCTTGGGCCATTGCGCTCCTGAGC2633GlyTrpValValAlaSerValValAlaTrpAlaIleAlaLeuLeuSer710715720725TCGATGAGCGCAGGGGGGTGGAGGCACAAAGCCGTGATCTATAGGACG2681SerMetSerAlaGlyGlyTrpArgHisLysAlaValIleTyrArgThr730735740TGGTGTAAGGGGTACCAGGCAATCCGTCAAAGGGTGGTGAGGAGCCCC1729TrpCysLysGlyTyrGlnAlaIleArgGlnArgValValArgSerPro745750755CTCGGGGAGGGGCGGCCTGCCAAACCCCTGACCTTTGCCTGGTGCTTG2777LeuGlyGluGlyArgProAlaLysProLeuThrPheAlaTrpCysLeu760765770GCCTCGTACATCTGGCCAGATGCTGTGATGATGGTGGTGGTTGCCTTG2825AlaSerTyrIleTrpProAspAlaValMetMetValValValAlaLeu775780785GTCCTTCTCTTTGGCCTGTTCGACGCGTTGGATTGGGCCTTGGAGGAG2873ValLeuLeuPheGlyLeuPheAspAlaLeuAspTrpAlaLeuGluGlu790795800805ATCTTGGTGTCCCGGCCCTCGTTGCGGCGTTTGGCTCGGGTGGTTGAG2921IleLeuValSerArgProSerLeuArgArgLeuAlaArgValValGlu810815820TGCTGTGTGATGGCGGGTGAGAAGGCCACAACCGTCCGGCTGGTCTCC2969CysCysValMetAlaGlyGluLysAlaThrThrValArgLeuValSer325830835AAGATGTGTGCGAGAGGAGCTTATTTGTTCGATCATATGGGCTCTTTT3017LysMetCysAlaArgGlyAlaTyrLeuPheAspHisMetGlySerPhe840845850TCGCGTGCTGTCAAGGAGCGCCTGTTGGAATGGGACGCAGCTCTTGAA3065SerArgAlaValLysGluArgLeuLeuGluTrpAspAlaAlaLeuGlu855860865CCTCTGTCATTCACTAGGACGGACTGTCGCATCATACGGGATGCCGCG3113ProLeuSerPheThrArgThrAspCysArgIleIleArgAspAlaAla870875880885AGGACTTTGTCCTGCGGGCAGTGCGTCATGGGTTTACCCGTGGTTGCG3161ArgThrLeuSerCysGlyGlnCysValMetGlyLeuProValValAla890895900CGCCGTGGTGATGAGGTTCTCATCGGCGTCTTCCAGGATGTGAATCAT3209ArgArgGlyAspGluValLeuIleGlyValPheGlnAspValAsnHis905910915TTGCCTCCCGGGTTTGTTCCGACCGCGCCTGTTGTCATCCGACGGTGC3257LeuProProGlyPheValProThrAlaProValValIleArgArgCys920925930GGAAAGGGCTTCTTGGGGGTCACAAAGGCTGCCTTGACAGGTCGGGAT3305GlyLysGlyPheLeuGlyValThrLyeAlaAlaLeuThrGlyArgAsp935940945CCTGACTTACATCCAGGGAACGTCATGGTGTTGGGGACGGCTACGTCG3353ProAspLeuHisProGlyAsnValMetValLeuGlyThrAlaThrSer950955960965CGAAGCATGGGAACATGCTTGAACGGCCTGCTGTTCACGACCTTCCAT3401ArgSerMetGlyThrCysLeuAsnGlyLeuLeuPheThrThrPheHis970975980GGGGCTTCATCCCGAACCATCGCCACACCCGTGGGGGCCCTTAATCCC3449GlyAlaSerSerArgThrIleAlaThrProValGlyAlaLeuAsnPro985990995AGATGGTGGTCAGCCAGTGATGATGTCACGGTGTATCCACTCCCGGAT3497ArgTrpTrpSerAlaSerAspAspValThrValTyrProLeuProAsp100010051010GGGGCTACTTCGTTAACACCTTGTACTTGCCAGGCTGAGTCCTGTTGG3545GlyAlaThrSerLeuThrProCysThrCysGlnAlaGluSerCysTrp101510201025GTCATCAGATCCGACGGGGCCCTATGCCATGGCTTGAGCAAGGGGGAC3593ValIleArgSerAspGlyAlaLeuCysHisGlyLeuSerLysGlyAsp1030103510401045AAGGTGGAGCTGGATGTGGCCATGGAGGTCTCTGACTTCCGTGGCTCG3641LysValGluLeuAspValAlaMetGluValSerAspPheArgGlySer105010551060TCTGGCTCACCGGTCCTATGTGACGAAGGGCACGCAGTAGGAATGCTC3689SerGlySerProValLeuCysAspGluGlyHisAlaValGlyMetLeu106510701075GTGTCTGTGCTTCACTCCGGTGGTAGGGTCACCGCGGCACGGTTCACT3737ValSerValLeuHisSerGlyGlyArgValThrAlaAlaArgPheThr108010851090AGGCCGTGGACCCAAGTGCCAACAGATGCCAAAACCACTACTGAACCC3785ArgProTrpThrGlnValProThrAspAlaLysThrThrThrGluPro109511001105CCTCCGGTGCCGGCCAAAGGAGTTTTCAAAGAGGCCCCGTTGTTTATG3833ProProValProAlaLysGlyValPheLysGluAlaProLeuPheMet1110111511201125CCTACGGGAGCGGGAAAGAGCACTCGCGTCCCGTTGGAGTACGATAAC3881ProThrGlyAlaGlyLysSerThrArgValProLeuGluTyrAspAsn113011351140ATGGGGCACAAGGTCTTAATCTTGAACCCCTCAGTGGCCACTGTGCGG3929MetGlyHisLysValLeuIleLeuAsnProSerValAlaThrValArg114511501155GCCATGGGCCCGTACATGGAGCGGCTGGCGGGTAAACATCCAAGTATA3977AlaMetGlyProTyrMetGluArgLeuAlaGlyLysHisProSerIle116011651170TACTGTGGGCATGATACAACTGCTTTCACAAGGATCACTGACTCCCCC4025TyrCysGlyHisAspThrThrAlaPheThrArgIleThrAspSerPro117511801185CTGACGTATTCAACCTATGGGAGGTTTTTGGCCAACCCTAGGCAGATG4073LeuThrTyrSerThrTyrGlyArgPheLeuAlaAsnProArgGlnMet1190119512001205CTACGGGGCGTTTCGGTGGTCATTTGTGATGAGTGCCACAGTCATGAC4121LeuArgGlyValSerValValIleCysAspGluCysHisSerHisAsp121012151220TCAACCGTGCTGTTAGGCATTGGGAGAGTCCGGGAGCTGGCGCGTGGG4169SerThrValLeuLeuGlyIleGlyArgValArgGluLeuAlaArgGly122512301235TGCGGGGTGCAACTAGTGCTCTACGCCACCGCTACACCTCCCGGATCC4217CysGlyValGlnLeuValLeuTyrAlaThrAlaThrProProGlySer124012451250CCTATGACGCAGCACCCTTCCATAATTGAGACAAAATTGGACGTGGGC4265ProMetThrGlnHisProSerIleIleGluThrLysLeuAspValGly125512601265GAGATTCCCTTTTATGGGCATGGAATACCCCTCGAGCGGATGCGAACC4313GluIleProPheTyrGlyHisGlyIleProLeuGluArgMetArgThr1270127512801285GGAAGGCACCTCGTGTTCTGCCATTCTAAGGCTGAGTGCGAGCGCCTT4361GlyArgHisLeuValPheCysHisSerLysAlaGluCysGluArgLeu129012951300GCTGGCCAGTTCTCCGCTAGGGGGGTCAATGCCATTGCCTATTATAGG4409AlaGlyGlnPheSerAlaArgGlyValAsnAlaIleAlaTyrTyrArg130513101315GGTAAAGACAGTTCTATCATCAAGGATGGGGACCTGGTGGTCTGTGCT4457GlyLysAspSerSerIleIleLysAspGlyAspLeuValValCysAla132013251330ACAGACGCGCTTTCCACTGGGTACACTGGAAATTTCGACTCCGTCACC4505ThrAspAlaLeuSerThrGlyTyrThrGlyAsnPheAspSerValThr133513401345GACTGTGGATTAGTGGTGGAGGAGGTCGTTGAGGTGACCCTTGATCCC4553AspCysGlyLeuValValGluGluValValGluValThrLeuAspPro1350135513601365ACCATTACCATCTCCCTGCGGACAGTGCCTGCGTCGGCTGAACTGTCG4601ThrIleThrIleSerLeuArgThrValProAlaSerAlaGluLeuSer137013751380ATGCAAAGACGAGGACGCACGGGTAGGGGCAGGTCTGGACGCTACTAC4649MetGlnArgArgGlyArgThrGlyArgGlyArgSerGlyArgTyrTyr138513901395TACGCGGGGGTGGGCAAAGCCCCTGCGGGTGTGGTGCGCTCAGGTCCT4697TyrAlaGlyValGlyLysAlaProAlaGlyValValArgSerGlyPro140014051410GTCTGGTCGGCGGTGGAAGCTGGAGTGACCTGGTACGGAATGGAACCT4745ValTrpSerAlaValGluAlaGlyValThrTrpTyrGlyMetGluPro141514201425GACTTGACAGCTAACCTACTGAGACTTTACGACGACTGCCCTTACACC4793AspLeuThrAlaAsnLeuLeuArgLeuTyrAspAspCysProTyrThr1430143514401445GCAGCCGTCGCGGCTGATATCGGAGAAGCCGCGGTGTTCTTCTCTGGG4841AlaAlaValAlaAlaAspIleGlyGluAlaAlaValPhePheSerGly145014551460CTCGCCCCATTGAGGATGCACCCTGATGTCAGCTGGGCAAAAGTTCGC4889LeuAlaProLeuArgMetHisProAspValSerTrpAlaLysValArg146514701475GGCGTCAACTGGCCCCTCTTGGTGGGTGTTCAGCGGACCATGTGTCGG4937GlyValAsnTrpProLeuLeuValGlyValGlnArgThrMetCysArg148014851490GAAACACTGTCTCCCGGCCCATCGGATGACCCCCAATGGGCAGGTCTG4985GluThrLeuSerProGlyProSerAspAspProGlnTrpAlaGlyLeu149515001505AAGGGCCCAAATCCTGTCCCACTCCTGCTGAGGTGGGGCAATGATTTA5033LysGlyProAsnProValProLeuLeuLeuArgTrpGlyAsnAspLeu1510151515201525CCATCTAAAGTGGCCGGCCACCACATAGTGGACGACCTGGTCCGGAGA5081ProSerLysValAlaGlyHisHisIleValAspAspLeuValArgArg153015351540CTCGGTGTGGCGGAGGGTTACGTCCGCTGCGACGCTGGGCCGATCTTG5129LeuGlyValAlaGluGlyTyrValArgCysAspAlaGlyProIleLeu154515501555ATGATCGGTCTAGCTATCGCGGGGGGAATGATCTACGCGTCATACACC5177MetIleGlyLeuAlaIleAlaGlyGlyMetIleTyrAlaSerTyrThr156015651570GGGTCGCTAGTGGTGGTGACAGACTGGGATGTGAAGGGGGGTGGCGCC5225GlySerLeuValValValThrAspTrpAspValLysGlyGlyGlyAla157515801585CCCCTTTATCGGCATGGAGACCAGGCCACGCCTCAGCCGGTGGTGCAG5273ProLeuTyrArgHisGlyAspGlnAlaThrProGlnProValValGln1590159516001605GTTCCTCCGGTAGACCATCGGCCGGGGGGTGAATCAGCACCATCGGAT5321ValProProValAspHisArgProGlyGlyGluSerAlaProSerAsp161016151620GCCAAGACAGTGACAGATGCGGTGGCAGCCATCCAGGTGGACTGCGAT5369AlaLysThrValThrAspAlaValAlaAlaIleGlnValAspCysAsp162516301635TGGACTATCATGACTCTGTCGATCGGAGAAGTGTTGTCCTTGGCTCAG5417TrpThrIleMetThrLeuSerIleGlyGluValLeuSerLeuAlaGln164016451650GCTAAGACGGCCGAGGCCTACACAGCAACCGCCAAGTGGCTCGCTGGC5465AlaLysThrAlaGluAlaTyrThrAlaThrAlaLysTrpLeuAlaGly165516601665TGCTATACGGGGACGCGGGCCGTTCCCACTGTATCCATTGTTGACAAG5513CysTyrThrGlyThrArgAlaValProThrValSerIleValAspLys1670167516801685CTCTTCGCCGGAGGGTGGGCGGCTGTGGTGGGCCATTGCCACAGCGTG5561LeuPheAlaGlyGlyTrpAlaAlaValValGlyHisCysHisSerVal169016951700ATTGCTGCGGCGGTGGCGGCCTACGGGGCTTCAAGGAGCCCGCCGTTG5609IleAlaAlaAlaValAlaAlaTyrGlyAlaSerArgSerProProLeu170517101715GCAGCCGCGGCTTCCTACCTGATGGGGTTGGGCGTTGGAGGCAACGCT5657AlaAlaAlaAlaSerTyrLeuMetGlyLeuGlyValGlyGlyAsnAla172017251730CAGACGCGCCTGGCGTCTGCCCTCCTATTGGGGGCTGCTGGAACCGCC5705GlnThrArgLeuAlaSerAlaLeuLeuLeuGlyAlaAlaGlyThrAla173517401745TTGGGCACTCCTGTCGTGGGCTTGACCATGGCAGGTGCGTTCATGGGG5753LeuGlyThrProValValGlyLeuThrMetAlaGlyAlaPheMetGly1750175517601765GGGGCCAGTGTCTCCCCCTCCTTGGTCACCATTTTATTGGGGGCCGTC580lGlyAlaSerValSerProSerLeuValThrIleLeuLeuGlyAlaVal177017751780GGAGGTTGGGAGGGTGTTGTCAACGCGGCGAGCCTAGTCTTTGACTTC5849GlyGlyTrpGluGlyValValAsnAlaAlaSerLeuValPheAspPhe178517901795ATGGCGGGGAAACTTTCATCAGAAGATCTGTGGTATGCCATCCCGGTA5897MetAlaGlyLysLeuSerSerGluAspLeuTrpTyrAlaIleProVal180018051810CTGACCAGCCCGGGGGCGGGCCTTGCGGGGATCGCTCTCGGGTTGGTT5945LeuThrSerProGlyAlaGlyLeuAlaGlyIleAlaLeuGlyLeuVal181518201825TTGTATTCAGCTAACAACTCTGGCACTACCACTTGGTTGAACCGTCTG5993LeuTyrSerAlaAsnAsnSerGlyTnrThrThrTrpLeuAsnArgLeu1830183518401845CTGACTACGTTACCAAGGTCTTCATGTATCCCGGACAGTTACTTTCAG6041LeuThrThrLeuProArgSerSerCysIleProAspSerTyrPheGln185018551860CAAGTTGACTATTGCGACAAGGTCTCAGCCGTGCTCCGGCGCCTGAGC6089GlnValAspTyrCysAspLysValSerAlaValLeuArgArgLeuSer186518701875CTCACCCGCACAGTGGTTGCCCTGGTCAACAGGGAGCCTAAGGTGGAT6137LeuThrArgThrValValAlaLeuValAsnArgGluProLysValAsp188018851890GAGGTACAGGTGGGGTATGTCTGGGACCTGTGGGAGTGGATCATGCGC6185GluValGlnValGlyTyrValTrpAspLeuTrpGluTrpIleMetArg189519001905CAAGTGCGCGTGGTCATGGCCAGACTCAGGGCCCTCTGCCCCGTGGTG6233GlnValArgValValMetAlaArgLeuArgAlaLeuCysProValVal1910191519201925TCACTACCCTTGTGGCATTGCGGGGAGGGGTGGTCCGGGGAATGGTTG6281SerLeuProLeuTrpHisCysGlyGluGlyTrpSerGlyGluTrpLeu193019351940CTTGACGGTCATGTTGAGAGTCGCTGCCTCTGTGGCTGCGTGATCACT6329LeuAspGlyHisValGluSerArgCysLeuCysGlyCysValIleThr194519501955GGTGACGTTCTGAATGGGCAACTCAAAGAACCAGTTTACTCTACCAAG6377GlyAspValLeuAsnGlyGlnLeuLysGluProValTyrSerThrLys196019651970CTGTGCCGGCACTATTGGATGGGGACTGTCCCTGTGAACATGCTGGGT6425LeuCysArgHisTyrTrpMetGlyThrValProValAsnMetLeuGly197519801985TACGGTGAAACGTCGCCTCTCCTGGCCTCCGACACCCCGAAGGTTGTG6473TyrGlyGluThrSerProLeuLeuAlaSerAspThrProLysValVal1990199520002005CCCTTCGGGACGTCTGGCTGGGCTGAGGTGGTGGTGACCACTACCCAC6521ProPheGlyThrSerGlyTrpAlaGluValValValThrThrThrHis201020152020GTGGTAATCAGGAGGACCTCCGCCTATAAGCTGCTGCGCCAGCAAATC6569ValValIleArgArgThrSerAlaTyrLysLeuLeuArgGlnGlnIle202520302035CTATCGGCTGCTGTAGCTGAGCCCTACTACGTCGACGGCATTCCGGTC6617LeuSerAlaAlaValAlaGluProTyrTyrValAspGlyIleProVal204020452050TCATGGGACGCGGACGCTCGTGCGCCCGCCATGGTCTATGGCCCTGGG6665SerTrpAspAlaAspAlaArgAlaProAlaMetValTyrGlyProGly205520602065CAAAGTGTTACCATTGACGGGGAGCGCTACACCTTGCCTCATCAACTG6713GlnSerValThrIleAspGlyGluArgTyrThrLeuProHisGlnLeu2070207520802085AGGCTCAGGAATGTGGCACCCTCTGAGGTTTCATCCGAGGTGTCCATT6761ArgLeuArgAsnValAlaProSerGluValSerSerGluValSerIle209020952100GACATTGGGACGGAGACTGAAGACTCAGAACTGACTGAGGCCGATCTG6809AspIleGlyThrGluThrGluAspSerGluLeuThrGluAlaAspLeu210521102115CCGCCGGCGGCTGCTGCTCTCCAAGCGATCGAGAATGCTGCGAGGATT6857ProProAlaAlaAlaAlaLeuGlnAlaIleGluAsnAlaAlaArgIle212021252130CTTGAACCGCACATTGATGTCATCATGGAGGACTGCAGTACACCCTCT6905LeuGluProHisIleAspValIleMetGluAspCysSerThrProSer213521402145CTTTGTGGTAGTAGCCGAGAGATGCCTGTATGGGGAGAAGACATCCCC6953LeuCysGlySerSerArgGluMetProValTrpGlyGluAspIlePro2150215521602165CGTACTCCATCGCCAGCACTTATCTCGGTTACTGAGAGCAGCTCAGAT7001ArgThrProSerProAlaLeuIleSerValThrGluSerSerSerAsp217021752180GAGAAGACCCCGTCGGTGTCCTCCTCGCAGGAGGATACCCCGTCCTCT7049GluLysThrProSerValSerSerSerGlnGluAspThrProSerSer218521902195GACTCATTCGAGGTCATCCAAGAGTCCGAGACAGCCGAAGGGGAGGAA7097AspSerPheGluValIleGlnGluSerGluThrAlaGluGlyGluGlu220022052210AGTGTCTTCAACGTGGCTCTTTCCGTATTAAAAGCCTTATTTCCACAG7145SerValPheAsnValAlaLeuSerValLeuLysAlaLeuPheProGln221522202225AGCGACGCGACCAGGAAGCTTACCGTCAAGATGTCGTGCTGCGTTGAA7193SerAspAlaThrArgLysLeuThrValLysMetSerCysCysValGlu2230223522402245AAGAGCGTCACGCGCTTTTTCTCATTGGGGTTGACGGTGGCTGATGTT7241LysSerValThrArgPhePheSerLeuGlyLeuThrValAlaAspVal225022552260GCTAGCCTGTGTGAGATGGAAATCCAGAACCATACAGCCTATTGTGAC7289AlaSerLeuCysGluMetGluIleGlnAsnHisThrAlaTyrCysAsp226522702275CAGGTGCGCACTCCGCTTGAATTGCAGGTTGGGTGCTTGGTGGGCAAT7337GlnValArgThrProLeuGluLeuGlnValGlyCysLeuValGlyAsn228022852290GAACTTACCTTTGAATGTGACAAGTGTGAGGCTAGGCAAGAAACCTTG7385GluLeuThrPheGluCysAspLysCysGluAlaArgGlnGluThrLeu229523002305GCCTCCTTCTCTTACATTTGGTCTGGAGTGCCGCTGACTAGGGCCACG7433AlaSerPheSerTyrIleTrpSerGlyValProLeuThrArgAlaThr2310231523202325CCGGCCAAGCCTCCCGTGGTGAGGCCGGTTGGCTCTTTGTTAGTGGCC7481ProAlaLysProProValValArgProValGlySerLeuLeuValAla233023352340GACACTACTAAGGTGTATGTTACCAATCCAGACAATGTGGGACGGAGG7529AspThrThrLysValTyrValThrAsnProAspAsnValGlyArgArg234523502358GTGGACAAGGTGACCTTCTGGCGTGCTCCTAGGGTTCATGATAAGTAC7577ValAspLysValThrPheTrpArgAlaProArgValHisAspLysTyr236023652370CTCGTGGACTCTATTGAGCGCGCTAAGAGGGCCGCTCAAGCCTGCCTA7625LeuValAspSerIleGluArgAlaLysArgAlaAlaGlnAlaCysLeu237523802385AGCATGGGTTACACTTATGAGGAAGCAATAAGGACTGTAAGGCCACAT7673SerMetGlyTyrThrTyrGluGluAlaIleArgThrValArgProHis2390239524002405GCTGCCATGGGCTGGGGATCTAAGGTGTCGGTTAAGGACTTAGCCACC7721AlaAlaMetGlyTrpGlySerLysValSerValLysAspLeuAlaThr241024152420CCCGCGGGGAAGATGGCCGTCCATGACCGGCTTCAGGAGATACTTGAA7769ProAlaGlyLysMetAlaValHisAspArgLeuGlnGluIleLeuGlu242524302435GGGACTCCGGTCCCCTTTACTCTTACTGTGAAAAAGGAGGTGTTCTTC7817GlyThrProValProPheThrLeuThrValLysLysGluValPhePhe244024452450AAAGACCGGAAGGAGGAGAAGGCCCCCCGCCTCATTGTGTTCCCCCCC7865LysAspArgLysGluGluLysAlaProArgLeuIleValPheProPro245524602465CTGGACTTCCGGATAGCTGAAAAGCTCATCTTGGGAGACCCAGGCCGG7913LeuAspPheArgIleAlaGluLysLeuIleLeuGlyAspProGlyArg2470247524802485GTAGCCAAGGCGGTGTTGGGGGGGGCCTACGCCTTCCAGTACACCCCA7961ValAlaLysAlaValLeuGlyGlyAlaTyrAlaPheGlnTyrThrPro249024952500AATCAGCGAGTTAAGGAGATGCTCAAGCTATGGGAGTCTAAGAAGACC8009AsnGlnArgValLysGluMetLeuLysLeuTrpGluSerLysLysThr250525102515CCTTGCGCCATCTGTGTGGACGCCACCTGCTTCGACAGTAGCATAACT8057ProCysAlaIleCysValAspAlaThrCysPheAspSerSerIleThr252025252530GAAGAGGACGTGGCTTTGGAGACAGAGCTATACGCTCTGGCCTCTGAC8105GluGluAspValAlaLeuGluThrGluLeuTyrAlaLeuAlaSerAsp253525402545CATCCAGAATGGGTGCGGGCACTTGGGAAATACTATGCCTCAGGCACC8153HisProGluTrpValArgAlaLeuGlyLysTyrTyrAlaSerGlyThr2550255525602565ATGGTCACCCCGGAAGGGGTGCCCGTCGGTGAGAGGTATTGCAGATCC8201MetValThrProGluGlyValProValGlyGluArgTyrCysArgSer257025752580TCGGGTGTCCTAACAACTAGCGCGAGCAACTGCTTGACCTGCTACATC8249SerGlyValLeuThrThrSerAlaSerAsnCysLeuThrCysTyrIle258525902595AAGGTGAAAGCTGCCTGTGAGAGAGTGGGGCTGAAAAATGTCTCTCTT8297LysValLysAlaAlaCysGluArgValGlyLeuLysAsnValSerLeu260026052610CTCATAGCCGGCGATGACTGCTTGATCATATGTGAGCGGCCAGTGTGC8345LeuIleAlaGlyAspAspCysLeuIleIleCysGluArgProValCys261526202625GACCCAAGCGACGCTTTGGGCAGAGCCCTAGCGAGCTATGGGTACGCG8393AspProSerAspAlaLeuGlyArgAlaLeuAlaSerTyrGlyTyrAla2630263526402645TGCGAGCCCTCATATCATGCATCATTGGACACGGCCCCCTTCTGCTCC8441CysGluProSerTyrHisAlaSerLeuAspThrAlaProPheCysSer265026552660ACTTGGCTTGCTGAGTGCAATGCAGATGGGAAGCGCCATTTCTTCCTG8489ThrTrpLeuAlaGluCysAsnAlaAspGlyLysArgHisPhePheLeu266526702675ACCACGGACTTCCGGAGGCCGCTCGCTCGCATGTCGAGTGAGTATAGT8537ThrThrAspPheArgArgProLeuAlaArgMetSerSerGluTyrSer268026852690GACCCGATGGCTTCGGCGATCGGTTACATCCTCCTTTATCCTTGGCAC8585AspProMetAlaSerAlaIleGlyTyrIleLeuLeuTyrProTrpHis269527002705CCCATCACACGGTGGGTCATCATCCCTCATGTGCTAACGTGCGCATTC8633ProIleThrArgTrpValIleIleProHisValLeuThrCysAlaPhe2710271527202725AGGGGTGGAGGCACACCGTCTGATCCGGTTTGGTGCCAGGTGCATGGT8681ArgGlyGlyGlyThrProSerAspProValTrpCysGlnValHisGly273027352740AACTACTACAAGTTTCCACTGGACAAACTGCCTAACATCATCGTGGCC8729AsnTyrTyrLysPheProLeuAspLysLeuProAsnIleIleValAla274527502755CTCCACGGACCAGCAGCGTTGAGGGTTACCGCAGACACAACTAAAACA8777LeuHisGlyProAlaAlaLeuArgValThrAlaAspThrThrLysThr276027652770AAGATGGAGGCTGGTAAGGTTCTGAGCGACCTCAAGCTCCCTGGCTTA8825LysMetGluAlaGlyLysValLeuSerAspLeuLysLeuProGlyLeu277527802785GCAGTCCACCGAAAGAAGGCCGGGGCGTTGCGAACACGCATGCTCCGC8873AlaValHisArgLysLysAlaGlyAlaLeuArgThrArgMetLeuArg2790279528002805TCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCATCCAGGC8921SerArgGlyTrpAlaGluLeuAlaArgGlyLeuLeuTrpHisProGly281028152820CTACGGCTTCCTCCCCCTGAGATTGCTGGTATCCCGGGGGGTTTCCCT8969LeuArgLeuProProProGluIleAlaGlyIleProGlyGlyPhePro282528302835CTCTCCCCCCCCTATATGGGGGTGGTACATCAATTGGATTTCACAAGC9017LeuSerProProTyrMetGlyValValHisGlnLeuAspPheThrSer284028452850CAGAGGAGTCGCTGGCGGTGGTTGGGGTTCTTAGCCCTGCTCATCGTA9065GlnArgSerArgTrpArgTrpLeuGlyPheLeuAlaLeuLeuIleVal285528602865GCCCTCTTCGGGTGAACTAAATTCATCTGTTGCGGCAAGGTCTGGTGACTGA9117AlaLeuPheGly2870TCATCACCGGAGGAGGTTCCCGCCCTCCCCGCCCCAGGGGTCTCCCCGCTGGGTAAAAAG9177GGCCCGGCCTTGGGAGGCATGGTGGTTACTAACCCCCTGGCAGGGTCAAAGCCTGATGGT9237GCTAATGCACTGCCACTTCGGTGGCGGGTCGCTACCTTATAGCGTAATCCGTGACTACGG9297GCTGCTCGCAGAGCCCTCCCCGGATGGGGCACAGTGCACTGTGATCTGAAGGGGTGCACC9357CCGGGAAGAGCTCGGCCCGAAGGCCGGSTTCTACT9392(2)SEQIDNO15的信息(i)序列特征(A)长度2873个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO15MetGlyProProSerSerAlaAlaAlaCysSerArgGlySerProArg151015IleLeuArgValArgAlaGlyGlyIleSerPhePheTyrThrIleMet202530AlaValLeuLeuLeuLeuLeuValValGluAlaGlyAlaIleLeuAla354045ProAlaThrHisAlaCysArgAlaAsnGlyGlnTyrPheLeuThrAsn505560CysCysAlaProGluAspIleGlyPheCysLeuGluGlyGlyCysLeu65707580ValAlaLeuGlyCysThrIleCysThrAspGlnCysTrpProLeuTyr859095GlnAlaGlyLeuAlaValArgProGlyLysSerAlaAlaGlnLeuVal100105110GlyGluLeuGlySerLeuTyrGlyProLeuSerValSerAlaTyrVal115120125AlaGlyIleLeuGlyLeuGlyGluValTyrSerGlyValLeuThrVal130135140GlyValAlaLeuThrArgArgValTyrProValProAsnLeuThrCys145150155160AlaValAlaCysGluLeuLysTrpGluSerGluPheTrpArgTrpThr165170175GluGlnLeuAlaSerAsnTyrTrpIleLeuGluTyrLeuTrpLysVal180185190ProPheAspPheTrpArgGlyValIleSerLeuThrProLeuLeuVal195200205CysValAlaAlaLeuLeuLeuLeuGluGlnArgIleValMetValPhe210215220LeuLeuValThrMetAlaGlyMetSerGlnGlyAlaProAlaSerVal225230235240LeuGlySerArgProPheAspTyrGlyLeuThrTrpGlnThrCysSer245250255CysArgAlaAsnGlySerArgPheSerThrGlyGluLysValTrpAsp260265270ArgGlyAsnValThrLeuGlnCysAspCysProAsnGlyProTrpVal275280285TrpLeuProAlaPheCysGlnAlaIleGlyTrpGlyAspProIleThr290295300TyrTrpSerHisGlyGlnAsnGlnTrpProLeuSerCysProGlnTyr305310315320ValTyrGlySerAlaThrValThrCysValTrpGlySerAlaSerTrp325330335PheAlaSerThrSerGlyArgAspSerLysIleAspValTrpSerLeu340345350ValProValGlySerAlaThrCysThrIleAlaAlaLeuGlySerSer355360365AspArgAspThrValProGlyLeuSerGluTrpGlyIleProCysVal370375380ThrCysValLeuAspArgArgProAlaSerCysGlyThrCysValArg385390395400AspCysTrpProGluThrGlySerValArgPheProPheHisArgCys405410415GlyValGlyProArgLeuThrLysAspLeuGluAlaValProPheVal420425430AsnArgThrThrProPheThrIleArgGlyProLeuGlyAsnGlnGly435440445ArgGlyAsnProValArgSerProLeuGlyPheGlySerTyrAlaMet450455460ThrArgIleArgAspThrLeuHisLeuValGluCysProThrProAla465470475480IleGluProProThrGlyThrPheGlyPhePheProGlyThrProPro485490495LeuAsnAsnCysMetLeuLeuGlyThrGluValSerGluAlaLeuGly500505510GlyAlaGlyLeuThrGlyGlyPheTyrGluProLeuValArgArgCys515520525SerLysLeuMetGlySerArgAsnProValCysProGlyPheAlaTrp530535540LeuSerSerGlyArgProAspGlyPheIleHisValGlnGlyHisLeu545550555560GlnGluValAspAlaGlyAsnPheIleProProProArgTrpLeuLeu565570575LeuAspPheValPheValLeuLeuTyrLeuMetLysLeuAlaGluAla580585590ArgLeuValProLeuIleLeuLeuLeuLeuTrpTrpTrpValAsnGln595600605LeuAlaValLeuGlyLeuProAlaValGluAlaAlaValAlaGlyGlu610615620ValPheAlaGlyProAlaLeuSerTrpCysLeuGlyLeuProValVal625630635640SerMetIleLeuGlyLeuAlaAsnLeuValLeuTyrPheArgTrpLeu645650655GlyProGlnArgLeuMetPheLeuValLeuTrpLysLeuAlaArgGly660665670AlaPheProLeuAlaLeuLeuMetGlyIleSerAlaThrArgGlyArg675680685ThrSerValLeuGlyAlaGluPheCysPheAspAlaThrPheGluVal690695700AspThrSerValLeuGlyTrpValValAlaSerValValAlaTrpAla705710715720IleAlaLeuLeuSerSerMetSerAlaGlyGlyTrpArgHisLysAla725730735ValIleTyrArgThrTrpCysLysGlyTyrGlnAlaIleArgGlnArg740745750ValValArgSerProLeuGlyGluGlyArgProAlaLysProLeuThr755760765PheAlaTrpCysLeuAlaSerTyrIleTrpProAspAlaValMetMet770775780ValValValAlaLeuValLeuLeuPheGlyLeuPheAspAlaLeuAsp785790795800TrpAlaLeuGluGluIleLeuValSerArgProSerLeuArgArgLeu805810815AlaArgValValGluCysCysValMetAlaGlyGluLysAlaThrThr820825830ValArgLeuValSerLysMetCysAlaArgGlyAlaTyrLeuPheAsp835840845HisMetGlySerPheSerArgAlaValLysGluArgLeuLeuGluTrp850855860AspAlaAlaLeuGluProLeuSerPheThrArgThrAspCysArgIle865870875880IleArgAspAlaAlaArgThrLeuSerCysGlyGlnCysValMetGly885890895LeuProValValAlaArgArgGlyAspGluValLeulleGlyValPhe900905910GlnAspValAsnHisLeuProProGlyPheValProThrAlaProVal915920925ValIleArgArgCysGlyLysGlyPheLeuGlyValThrLysAlaAla930935940LeuThrGlyArgAspProAspLeuHisProGlyAsnValMetValLeu945950955960GlyThrAlaThrSerArgSerMetGlyThrCysLeuAsnGlyLeuLeu965970975PheThrThrPheHisGlyAlaSerSerArgThrIleAlaThrProVal980985990GlyAlaLeuAsnProArgTrpTrpSerAlaSerAspAspValThrVal99510001005TyrProLeuProAspGlyAlaThrSerLeuThrProCysThrCysGln101010151020AlaGluSerCysTrpValIleArgSerAspGlyAlaLeuCysHisGly1025103010351040LeuSerLysGlyAspLysValGluLeuAspValAlaMetGluValSer104510501055AspPheArgGlySerSerGlySerProValLeuCysAspGluGlyHis106010651070AlaValGlyMetLeuValSerValLeuHisSerGlyGlyArgValThr107510801085AlaAlaArgPheThrArgProTrpThrGlnValProThrAspAlaLys109010951100ThrThrThrGluProProProValProAlaLysGlyValPheLysGlu1105111011151120AlaProLeuPheMetProThrGlyAlaGlyLysSerThrArgValPro112511301135LeuGluTyrAspAsnMetGlyHisLysValLeuIleLeuAsnProSer114011451150ValAlaThrValArgAlaMetGlyProTyrMetGluArgLeuAlaGly115511601165LysHisProSerIleTyrCysGlyHisAspThrThrAlaPheThrArg117011751180IleThrAspSerProLeuThrTyrSerThrTyrGlyArgPheLeuAla1185119011951200AsnProArgGlnMetLeuArgGlyValSerValValIleCysAspGlu120512101215CysHisSerHisAspSerThrValLeuLeuGlyIleGlyArgValArg122012251230GluLeuAlaArgGlyCysGlyValGlnLeuValLeuTyrAlaThrAla123512401245ThrProProGlySerProMetThrGlnHisProSerIleIleGluThr125012551260LysLeuAspValGlyGluIleProPheTyrGlyHisGlyIleProLeu1265127012751280GluArgMetArgThrGlyArgHisLeuValPheCysHisSerLysAla128512901295GluCysGluArgLeuAlaGlyGlnPheSerAlaArgGlyValAsnAla130013051310IleAlaTyrTyrArgGlyLysAspSerSerlleIleLysAspGlyAsp131513201325LeuValValCysAlaThrAspAlaLeuSerThrGlyTyrThrGlyAsn133013351340PheAspSerValThrAspCysGlyLeuValValGluGluValValGlu1345135013551360ValThrLeuAspProThrIleThrIleSerLeuArgThrValProAla136513701375SerAlaGluLeuSerMetGlnArgArgGlyArgThrGlyArgGlyArg138013851390SerGlyArgTyrTyrTyrAlaGlyValGlyLysAlaProAlaGlyVal139514001405ValArgSerGlyProValTrpSerAlaValGluAlaGlyValThrTrp141014151420TyrGlyMetGluProAspLeuThrAlaAshLeuLeuArgLeuTyrAsp1425143014351440AspCysProTyrThrAlaAlaValAlaAlaAspIleGlyGluAlaAla144514501455ValPhePheSerGlyLeuAlaProLeuArgMetHisProAspValSer146014651470TrpAlaLysValArgGlyValAsnTrpProLeuLeuValGlyValGln147514801485ArgThrMetCysArgGluThrLeuSerProGlyProSerAspAspPro149014951500GlnTrpAlaGlyLeuLysGlyProAsnProValProLeuLeuLeuArg1505151015151520TrpGlyAsnAspLeuProSerLysValAlaGlyHisHisIleValAsp152515301535AspLeuValArgArgLeuGlyValAlaGluGlyTyrValArgCysAsp154015451550AlaGlyProIleLeuMetIleGlyLeuAlaIleAlaGlyGlyMetIle155515601565TyrAlaSerTyrThrGlySerLeuValValValThrAspTrpAspVal157015751580LysGlyGlyGlyAlaProLeuTyrArgHisGlyAspGlnAlaThrPro1585159015951600GlnProValValGlnValProProValAspHisArgProGlyGlyGlu160516101615SerAlaProSerAspAlaLysThrValThrAspAlaValAlaAlaIle162016251630GlnValAspCysAspTrpThrIleMetThrLeuSerIleGlyGluVal163516401645LeuSerLeuAlaGlnAlaLyeThrAlaGluAlaTyrThrAlaThrAla165016551660LysTrpLeuAlaGlyCysTyrThrGlyThrArgAlaValProThrVal1665167016751680SerIleValAspLysLeuPheAlaGlyGlyTrpAlaAlaValValGly168516901695HisCysHisSerValIleAlaAlaAlaValAlaAlaTyrGlyAlaSer170017051710ArgSerProProLeuAlaAlaAlaAlaSerTyrLeuMetGlyLeuGly171517201725ValGlyGlyAsnAlaGlnThrArgLeuAlaSerAlaLeuLeuLeuGly173017351740AlaAlaGlyThrAlaLeuGlyThrProValValGlyLeuThrMetAla1745175017551760GlyAlaPheMetGlyGlyAlaSerValSerProSerLeuValThrIle176517701775LeuLeuGlyAlaValGlyGlyTrpGluGlyValValAsnAlaAlaSer178017851790LeuValPheAspPheMetAlaGlyLysLeuSerSerGluAspLeuTrp179518001805TyrAlaIleProValLeuThrSerProGlyAlaGlyLeuAlaGlyIle181018151820AlaLeuGlyLeuValLeuTyrSerAlaAsnAsnSerGlyThrThrThr1825183018351840TrpLeuAsnArgLeuLeuThrThrLeuProArgSerSerCysIlePro184518501855AspSerTyrPheGlnGlnValAspTyrCysAspLysValSerAlaVal186018651870LeuArgArgLeuSerLeuThrArgThrValValAlaLeuValAsnArg187518801885GluProLysValAspGluValGlnValGlyTyrValTrpAspLeuTrp189018951900GluTrplleMetArgGlnValArgValValMetAlaArgLeuArgAla1905191019151920LeuCysProValValSerLeuProLeuTrpHisCysGlyGluGlyTrp192519301935SerGlyGluTrpLeuLeuAspGlyHisValGluSerArgCysLeuCys194019451950GlyCysValIleThrGlyAspValLeuAsnGlyGlnLeuLysGluPro195519601965ValTyrSerThrLysLeuCysArgHisTyrTrpMetGlyThrValPro197019751980ValAsnMetLeuGlyTyrGlyGluThrSerProLeuLeuAlaSerAsp1985199019952000ThrProLysValValProPheGlyThrSerGlyTrpAlaGluValVal200520102015ValThrThrThrHisValValIleArgArgThrSerAlaTyrLysLeu202020252030LeuArgGlnGlnIleLeuSerAlaAlaValAlaGluProTyrTyrVal203520402045AspGlyIleProValSerTrpAspAlaAspAlaArgAlaProAlaMet205020552060ValTyrGlyProGlyGlnSerValThrIleAspGlyGluArgTyrThr2065207020752080LeuProHisGlnLeuArgLeuArgAsnValAlaProSerGluValSer208520902095SerGluValSerIleAspIleGlyThrGluThrGluAspSerGluLeu210021052110ThrGluAlaAspLeuProProAlaAlaAlaAlaLeuGlnAlaIleGlu211521202125AsnAlaAlaArgIleLeuGluProHisIleAspValIleMetGluAsp213021352140CysSerThrProSerLeuCysGlySerSerArgGluMetProValTrp2145215021552160GlyGluAspIleProArgThrProSerProAlaLeuIleSerValThr216521702175GluSerSerSerAspGluLysThrProSerValSerSerSerGlnGlu218021852190AspThrProSerSerAspSerPheGluValIleGlnGluSerGluThr219522002205AlaGluGlyGluGluSerValPheAsnValAlaLeuSerValLeuLys221022152220AlaLeuPheProGlnSerAspAlaThrArgLysLeuThrValLysMet2225223022352240SerCysCysValGluLysSerValThrArgPhePheSerLeuGlyLeu224522502255ThrValAlaAspValAlaSerLeuCysGluMetGluIleGlnAsnHis226022652270ThrAlaTyrCysAspGlnValArgThrProLeuGluLeuGlnValGly227522802285CysLeuValGlyAsnGluLeuThrPheGluCysAspLysCysGluAla229022952300ArgGlnGluThrLeuAlaSerPheSerTyrIleTrpSerGlyValPro2305231023152320LeuThrArgAlaThrProAlaLysProProValValArgProValGly232523302335SerLeuLeuValAlaAspThrThrLysValTyrValThrAsnProAsp234023452350AsnValGlyArgArgValAspLysValThrPheTrpArgAlaProArg235523602365ValHisAspLysTyrLeuValAspSerIleGluArgAlaLysArgAla237023752380AlaGlnAlaCysLeuSerMetGlyTyrThrTyrGluGluAlaIleArg2385239023952400ThrValArgProHisAlaAlaMetGlyTrpGlySerLysValSerVal240524102415LysAspLeuAlaThrProAlaGlyLysMetAlaValHisAspArgLeu242024252430GlnGluIleLeuGluGlyThrProValProPheThrLeuThrValLys243524402445LysGluValPnePheLysAspArgLysGluGluLysAlaProArgLeu245024552460IleValPheProProLeuAspPheArgIleAlaGluLysLeuIleLeu2465247024752480GlyAspProGlyArgValAlaLysAlaValLeuGlyGlyAlaTyrAla248524902495PheGlnTyrThrProAsnGlnArgValLysGluMetLeuLysLeuTrp250025052510GluSerLysLysThrProCysAlaIleCysValAspAlaThrCysPhe251525202525AspSerSerIleThrGluGluAspValAlaLeuGluThrGluLeuTyr253025352540AlaLeuAlaSerAspHisProGluTrpValArgAlaLeuGlyLysTyr2545255025552560TyrAlaSerGlyThrMetValThrProGluGlyValProValGlyGlu256525702575ArgTyrCysArgSerSerGlyValLeuThrThrSerAlaSerAsnCys258025852590LeuThrCysTyrIleLysValLysAlaAlaCysGluArgValGlyLeu259526002605LysAsnValSerLeuLeuIleAlaGlyAspAspCysLeuIleIleCys261026152620GluArgProValCysAspProSerAspAlaLeuGlyArgAlaLeuAla2625263026352640SerTyrGlyTyrAlaCysGluProSerTyrHisAlaSerLeuAspThr264526502655AlaProPheCysSerThrTrpLeuAlaGluCysAsnAlaAspGlyLys266026652670ArgHisPhePheLeuThrThrAspPheArgArgProLeuAlaArgMet267526802685SerSerGluTyrSerAspProMetAlaSerAlaIleGlyTyrIleLeu269026952700LeuTyrPrcTrpHisProIleThrArgTrpValIleIleProHisVal2705271027152720LeuThrCysAlaPheArgGlyGlyGlyThrProSerAspProValTrp272527302735CysGlnValHisGlyAsnTyrTyrLysPheProLeuAspLysLeuPro274027452750AsnIleIleValAlaLeuHisGlyProAlaAlaLeuArgValThrAla275527602765AspThrThrLysThrLysMetGluAlaGlyLysValLeuSerAspLeu277027752780LysLeuProGlyLeuAlaValHisArgLysLysAlaGlyAlaLeuArg2785279027952800ThrArgMetLeuArgSerArgGlyTrpAlaGluLeuAlaArgGlyLeu280528102815LeuTrpHisProGlyLeuArgLeuProProProGluIleAlaGlyIle282028252830ProGlyGlyPheProLeuSerProProTyrMetGlyValValHisGln283528402845LeuAspPheThrSerGlnArgSerArgTrpArgTrpLeuGlyPheLeu285028552860AlaLeuLeuIleValAlaLeuPheGly28652870(2)SEQIDNO16的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株探针470-20-1-152F(xi)序列描述SEQIDNO16TCGGTTACTGAGAGCAGCTCAGATGAG27(2)SEQIDNO17的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株JML-A,引物(xi)序列描述SEQIDNO17AGGAATTCAGCGGCCGCGAG20(2)SEQIDNO18的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(vi)原始来源(C)各分离株JML-B,引物(xi)序列描述SEQIDNO18CTCGCGGCCGCTGAATTCCTTT22(2)SEQIDNO19的信息(i)序列特征(A)长度203个碱基对(B)类型核酸(C)链型双链(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(vi)原始来源(C)各分离株470-20-1克隆,WITHOUTSISPA接头(ix)特性(A)名称/关键词CDS(B)位置2..203(xi)序列描述SEQIDNO19GGCTGTCTCGGACTCTTGGATGACCTCGAATGAGTCAGAGGACGGG46AlaValSerAspSerTrpMetThrSerAsnGluSerGluAspGly151015GTATCCTCCTGCGAGGAGGACACCGGCGGGGTCTTCTCATCTGAGCTG94ValSerSerCysGluGluAspThrGlyGlyValPheSerSerGluLeu202530CTCTCAGTAACCGAGATAAGTGCTGGCGATGGAGTACGGGGGATGTCT142LeuSerValThrGluIleSerAlaGlyAspGlyValArgGlyMetSer354045TCTCCCCATACAGGCATCTCTCGGCTACTACCACAAAGAGAGGGTGTA190SerProHisThrGlyIleSerArgLeuLeuProGlnArgGluGlyVal505560CTGCAGTCCTCCA203LeuGlnSerSer65(2)SEQIDNO20的信息(i)序列特征(A)长度67个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO20AlaValSerAspSerTrpMetThrSerAsnGluSerGluAspGlyVal151015SerSerCysGluGluAspThrGlyGlyValPheSerSerGluLeuLeu202530SerValThrGluIleSerAlaGlyAspGlyValArgGlyMetSerSer354045ProHisThrGlyIleSerArgLeuLeuProGlnArgGluGlyValLeu505560GlnSerSer65(2)SEQIDNO21的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470-20-1-152R(xi)序列描述SEQIDNO21CTCATCTGAGCTGCTCTCAGTAACCGA27(2)SEQIDNO22的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株寡核苷酸B(xi)序列描述SEQIDNO22CTGTCTCGGACTCTTGGATGACCT24(2)SEQIDNO23的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株同源寡核苷酸211R’(xi)序列描述SEQIDNO23ATACCCCGTCCTCTGACTCATTCG24(2)SEQIDNO24的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株同源寡核苷酸B’(xi)序列描述SEQIDNO24AGGTCATCCAAGAGTCCGAGACAG24(2)SEQIDNO25的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株λGT11正向引物,20mer(xi)序列描述SEQIDNO25CACATGGCTGAATATCGACG20(2)SEQIDNO26的信息(i)序列特征(A)长度180个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列4E3(xi)序列描述SEQIDNO26GCGAGCCTAGTCTTTGACTTCATGGCGGGGAAACTTTCATCAGAAGATCTGTGGTATGCC60ATCCCGGTACTGACCAGCCCGGGGGCGGGCCTTGCGGGGATCGCTCTCGGGTTGGTTTTG120TATTCAGCTAACAACTCTGGCACTACCACTTGGTTGAACCGTCTGCTGACTACGTTACCA180(2)SEQIDNO27的信息(i)序列特征(A)长度430个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列3E3(xi)序列描述SEQIDNO27GGCACTACCACTTGGTTGAACCGTCTGCTGACTACGTTACCAAGGTCTTCATGTATCCCG60GACAGTTACTTTCAGCAAGTTGACTATTGCGACAAGGTCTCAGCCGTGCTCCGGCGCCTG120AGCCTCACCCGCACAGTGGTTGCCCTGGTCAACAGGGAGCCTAAGGTGGATGAGGTACAG180GTGGGGTATGTCTGGGACCTGTGGGAGTGGATCATGCGCCAAGTGCGCGTGGTCATGGCC240AGACTCAGGGCCCTCTGCCCCGTGGTGTCACTACCCTTGTGGCATTGCGGGGAGGGGTGG300TCCGGGGAATGGTTGCTTGACGGTCATGTTGAGAGTCGCTGCCTCTGTGGCTGCGTGATC360ACTGGTGACGTTCTGAATGGGCAACTCAAAGAACCAGTTTACTCTACCAAGCTGTGCCGG420CACTATTGGA430(2)SEQIDNO28的信息(i)序列特征(A)长度180个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列2E5(xi)序列描述SEQIDNO28CTTACCGTCAAGATGTCGTGCTGCGTTGAAAAGAGCGTCACGCGCTTTTTCTCATTGGGG60TTGACGGTGGCTGATGTTGCTAGCCTGTGTGAGATGGAAATCCAGAACCATACAGCCTAT120TGTGACCAGGTGCGCACTCCGCTTGAATTGCAGGTTGGGTGCTTGGTGGGCAATGAACTT180(2)SEQIDNO29的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列1E5(xi)序列描述SEQIDNO29CTTCTCTTTGTGGTAGTAGCCGAGAGATGCCTGTATGGGGAGAAGACATCCCCCGTACTC60CATCGCCAGCACTTATCTCGGTTACTGAGAGCAGCTCAGATGAGAAGACCCCGTCGGTGT120CCTCCTCGCAGGAGGATACCCCGTCCTCTGACTCATTCGAGGTCATCCAAGAGTCCGAGA180CAGCCGAAGGGGAGGAAAGTGTCTTCAACGTGGCTCTTTCCGTATTAAAAGCCTTATTTC240CACAGAGCGACGCGACCAGGAAGCTTACCGTCAAGATGTCGTGCTGCGTTGAAAAGAGCG300TCACGCGCTTTTTCTCATTGGGGTTGACGGTGGCTGATGTTGCT344(2)SEQIDNO30的信息(i)序列特征(A)长度423个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列4E5(xi)序列描述SEQIDNO30GTAAGGCCACATGCTGCCATGGGCTGGGGATCTAAGGTGTCGGTTAAGGACTTAGCCACC60CCCGCGGGGAAGATGGCCGTCCATGACCGGCTTCAGGAGATACTTGAAGGGACTCCGGTC120CCCTTTACTCTTACTGTGAAAAAGGAGGTGTTCTTCAAAGACCGGAAGGAGGAGAAGGCC180CCCCGCCTCATTGTGTTCCCCCCCCTGGACTTCCGGATAGCTGAAAAGCTCATCTTGGGA240GACCCAGGCCGGGTAGCCAAGGCGGTGTTGGGGGGGGCCTACGCCTTCCAGTACACCCCA300AATCAGCGAGTTAAGGAGATGCTCAAGCTATGGGAGTCTAAGAAGACCCCTTGCGCCATC360TGTGTGGACGCCACCTGCTTCGACAGTAGCATAACTGAAGAGGACGTGGCTTTGGAGACA420GAG423(2)SEQIDNO31的信息(i)序列特征(A)长度516个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列3E5(xi)序列描述SEQIDNO31TACAGCCTATTGTGACCAGGTGCGCACTCCGCTTGAATTGCAGGTTGGGTGCTTGGTGGG60CAATGAACTTACCTTTGAATGTGACAAGTGTGAGGCTAGGCAAGAAACCTTGGCCTCCTT120CTCTTACATTTGGTCTGGAGTGCCGCTGACTAGGGCCACGCCGGCCAAGCCTCCCGTGGT180GAGGCCGGTTGGCTCTTTGTTAGTGGCCGACACTACTAAGGTGTATGTTACCAATCCAGA240CAATGTGGGACGGAGGGTGGACAAGGTGACCTTCTGGCGTGCTCCTAGGGTTCATGATAA300GTACCTCGTGGACTCTATTGAGCGCGCTAAGAGGGCCGCTCAAGCCTGCCTAAGCATGGG360TTACACTTATGAGGAAGCAATAAGGACTGTAAGGCCACATGCTGCCATGGGCTGGGGATC420TAAGGTGTCGGTTAAGGACTTAGCCACCCCCGCGGGGAAGATGGCCGTCCATGACCGGCT480TCAGGAGATACTTGAAGGGACTCCGGTCCCCTTTAC516(2)SEQIDNO32的信息(i)序列特征(A)长度518个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列2E3(xi)序列描述SEQIDNO32GAATGGGCAACTCAAAGAACCAGTTTACTCTACCAAGCTGTGCCGGCACTATTGGATGGG60GACTGTCCCTGTGAACATGCTGGGTTACGGTGAAACGTCGCCTCTCCTGGCCTCCGACAC120CCCGAAGGTTGTGCCCTTCGGGACGTCTGGCTGGGCTGAGGTGGTGGTGACCACTACCCA180CGTGGTAATCAGGAGGACCTCCGCCTATAAGCTGCTGCGCCAGCAAATCCTATCGGCTGC240TGTAGCTGAGCCCTACTACGTCGACGGCATTCCGGTCTCATGGGACGCGGACGCTCGTGC300GCCCGCCATGGTCTATGGCCCTGGGCAAAGTGTTACCATTGACGGGGAGCGCTACACCTT360GCCTCATCAACTGAGGCTCAGGAATGTGGCACCCTCTGAGGTTTCATCCGAGGTGTCCAT420TGACATTGGGACGGAGACTGAAGACTCAGAACTGACTGAGGCCGATCTGCCGCCGGCGGC480TGCTGCTCTCCAAGCGATCGAGAATGCTGCGAGGATTC518(2)SEQIDNO33的信息(i)序列特征(A)长度268个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列1E3(xi)序列描述SEQIDNO33CTTACTGAGGCCGATCTGCCGCCGGCGGCTGCTGCTCTCCAAGCGATCGAGAATGCTGCG60AGGATTCTTGAACCGCACATTGATGTCATCATGGAGGACTGCAGTACACCCTCTCTTTGT120GGTAGTAGCCGAGAGATGCCTGTATGGGGAGAAGACATCCCCCGTACTCCATCGCCAGCA180CTTATCTCGGTTACTGAGAGCAGCTCAGATGAGAAGACCCCGTCGGTGTCCTCCTCGCAG240GAGGATACCCCGTCCTCTGACTCATTCG268(2)SEQIDNO34的信息(i)序列特征(A)长度781个碱基对(B)类型核苷酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株单个克隆4E5-20(xi)序列描述SEQIDNO34GTAAGGCCACATGCTGCCATGGGCTGGGGATCTAAGGTGTCGGTTAAGGACTTAGCCACC60CCCGCGGGGAAGATGGCCGTCCATGACCGGCTTCAGGAGATACTTGAAGGGACTCCGGTC120CCCTTTACTCTTACTGTGAAAAAGGAGGTGTTCTTCAAAGACCGGAAGGAGGAGAAGGCC180CCCCGCCTCATTGTGTTCCCCCCCCTGGACTTCCGGATAGCTGAAAAGCTCATCTTGGGA240GACCCAGGCCGGGTAGCCAAGGCGGTGTTGGGGGGGGCCTACGCCTTCCAGTACACCCCA300AATCAGCGAGTTAAGGAGATGCTCAAGCTATGGGAGTCTAAGAAGACCCCTTGCGCCATC360TGTGTGGACGCCACCTGCTTCGACAGTAGCATAACTGAAGAGGACGTGGCTTTGGAGACA420GAGTTATACGCTCTGGCCTCTGACCATCCAGAATGGGTGCGGGCACCTGGGAAATACTAT480GCCTCAGGCACCATGGTCACCCCGGAAGGGGTGCCCGTCGGTGAGAGGTATTGCAGATCC540TCGGGTGTCCTAACAACTAGCGCGAGCAACTGCCTGACCTGCTACATCAAGGTGAAAGCT600GCCTGTGAGAGAGTGGGGCTGAAAAATGTCTCTCTTCTCATAGCCGGCGATGACTGCTTG660ATCATATGTGAGCGGCCAGTGTGCGACCCAAGCGACGCTTTGGGCAGAGCCCTAGCGAGC720TATGGGTACGCGTGCGAGCCCTCATATCATGCATCATTGGACACGGCCCCCTTCTGCTCC780A781(2)SEQIDNO35的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株探针470-201-1-142R(xi)序列描述SEQIDNO35TCGGTTACTGAGAGCAGCTCAGATGAG27(2)SEQIDNO36的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株探针470-20-1-152F(xi)序列描述SEQIDNO36TCGGTTACTGAGAGCAGCTCAGATGAG27(2)SEQIDNO37的信息(i)序列特征(A)长度570个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆470EXPl(ix)特性(A)名称/关键词CDS(B)位置1..570(xi)序列描述SEQIDNO37GCTGTATGGTTCTGGATTTCCATCTCACACAGGCTAGCAACATCAGCC48AlaValTrpPheTrpIleSerIleSerHisArgLeuAlaThrSerAla151015ACCGTCAACCCCAATGAGAAAAAGCGCGTGACGCTCTTTTCAACGCAG96ThrValAsnProAsnGluLysLysArgValThrLeuPheSerThrGln202530CACGACATCTTGACGGTAAGCTTCCTGGTCGCGTCGCTCTGTGGAAAT144HisAspIleLeuThrValSerPheLeuValAlaSerLeuCysGlyAsn354045AAGGCTTTTAATACGGAAAGAGCCACGTTGAAGACACTTTCCTCCCCT192LysAlaPheAsnThrGluArgAlaThrLeuLysThrLeuSerSerPro505560TCGGCTGTCTCGGACTCTTGGATGACCTCGAATGAGTCAGAGGACGGG240SerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAspGly65707580GTATCCTCCTGCGAGGAGGACACCGACGGGGTCTTCTCATCTGAGCTG288ValSerSerCysGluGluAspThrAspGlyValPheSerSerGluLeu859095CTCTCAGTAACCGAGATAAGTGCTGGCGATGGAGTACGGGGGATGTCT336LeuSerValThrGluIleSerAlaGlyAspGlyValArgGlyMetSer100105110TCTCCCCATACAGGCATCTCTCGGCTACTACCACAAAGAGAGGGTGTA384SerProHisThrGlyIleSerArgLeuLeuProGlnArgGluGlyVal115120125CTGCAGTCCTCCATGATGACATCAATGTGCGGTTCAAGAATCCTCGCA432LeuGlnSerSerMetMetThrSerMetCysGlySerArgIleLeuAla130135140GCATTCTCGATCGCTTGGAGAGCAGCAGCCGCCGGCGGCAGATCGGCC480AlaPheSerIleAlaTrpArgAlaAlaAlaAlaGlyGlyArgSerAla145150155160TCAGTCAGTTCTGAGTCTTCAGTCTCCGTCCCAATGTCAATGGACACC528SerValSerSerGluSerSerValSerValProMetSerMetAspThr165170175TCGGATGAAACCTCAGAGGGTGCCACATTCCTGAGCCTCAGT570SerAspGluThrSerGluGlyAlaThrPheLeuSerLeuSer180185190(2)SEQIDNO38的信息(i)序列特征(A)长度190个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO38AlaValTrpPheTrpIleSerIleSerHisArgLeuAlaThrSerAla151015ThrValAsnProAsnGluLysLysArgValThrLeuPheSerThrGln202530HisAspIleLeuThrValSerPheLeuValAlaSerLeuCysGlyAsn354045LysAlaPheAsnThrGluArgAlaThrLeuLysThrLeuSerSerPro505560SerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAspGly65707580ValSerSerCysGluGluAspThrAspGlyValPheSerSerGluLeu859095LeuSerValThrGluIleSerAlaGlyAspGlyValArgGlyMetSer100105110SerProHisThrGlyIleSerArgLeuLeuProGlnArgGluGlyVal115120125LeuGlnSerSerMetMetThrSerMetCysGlySerArgIleLeuAla130135140AlaPheSerIleAlaTrpArgAlaAlaAlaAlaGlyGlyArgSerAla145150155160SerValSerSerGluSerSerValSerValProMetSerMetAspThr165170175SerAspGluThrSerGluGlyAlaThrPheLeuSerLeuSer180185190(2)SEQIDNO39的信息(i)序列特征(A)长度1288个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列5E3(xi)序列描述SEQIDNO39ACGGGTAGGGGCAGGTCTGGACGCTACTACTACGCGGGGGTGGGCAAAGCCCCTGCGGGT60GTGGTGCGCTCAGGTCCTGTCTGGTCGGCGGTGGAAGCTGGAGTGACCTGGTACGGAATG120GAACCTGACTTGACAGCTAACCTACTGAGACTTTACGACGACTGCCCTTACACCGCAGCC180GTCGCGGCTGATATCGGAGAAGCCGCGGTGTTCTTCTCTGGGCTCGCCCCATTGAGGATG240CACCCTGATGTCAGCTGGGCAAAAGTTCGCGGCGTCAACTGGCCCCTCTTGGTGGGTGTT300CAGCGGACCATGTGTCGGGAAACACTGTCTCCCGGCCCATCGGATGACCCCCAATGGGCA360GGTCTGAAGGGCCCAAATCCTGTCCCACTCCTGCTGAGGTGGGGCAATGATTTACCATCT420AAAGTGGCCGGCCACCACATAGTGGACGACCTGGTCCGGAGACTCGGTGTGGCGGAGGGT480TACGTCCGCTGCGACGCTGGGCCGATCTTGATGATCGGTCTAGCTATCGCGGGGGGAATG540ATCTACGCGTCATACACCGGGTCGCTAGTGGTGGTGACAGACTGGGATGTGAAGGGGGGT600GGCGCCCCCCTTTATCGGCATGGAGACCAGGCCACGCCTCAGCCGGTGGTGCAGGTTCCT660CCGGTAGACCATCGGCCGGGGGGTGAATCAGCACCATCGGATGCCAAGACAGTGACAGAT720GCGGTGGCAGCCATCCAGGTGGACTGCGATTGGACTATCATGACTCTGTCGATCGGAGAA780GTGTTGTCCTTGGCTCAGGCTAAGACGGCCGAGGCCTACACAGCAACCGCCAAGTGGCTC840GCTGGCTGCTATACGGGGACGCGGGCCGTTCCCACTGTATCCATTGTTGACAAGCTCTTC900GCCGGAGGGTGGGCGGCTGTGGTGGGCCATTGCCACAGCGTGATTGCTGCGGCGGTGGCG960GCCTACGGGGCTTCAAGGAGCCCGCCGTTGGCAGCCGCGGCTTCCTACCTGATGGGGTTG1020GGCGTTGGAGGCAACGCTCAGACGCGCCTGGCGTCTGCCCTCCTATTGGGGGCTGCTGGA1080ACCGCCTTGGGCACTCCTGTCGTGGGCTTGACCATGGCAGGTGCGTTCATGGGGGGGGCC1140AGTGTCTCCCCCTCCTTGGTCACCATTTTATTGGGGGCCGTCGGAGGTTGGGAGGGTGTT1200GTCAACGCGGCGAGCCTAGTCTTTGACTTCATGGCGGGGAAACTTTCATCAGAAGATCTG1260TGGTATGCCATCCCGGTACTGACCAGCC1288(2)SEQIDNO40的信息(i)序列特征(A)长度862个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列6E3(xi)序列描述SEQIDNO40ACGGCAACATGGGGCACAAGGTCTTAATCTTGAACCCCTCAGTGGCCACTGTGCGGGCCA60TGGGCCCGTACATGGAGCGGCTGGCGGGTAAACATCCAAGTATATACTGTGGGCATGATA120CAACTGCTTTCACAAGGATCACTGACTCCCCCCTGACGTATTCAACCTATGGGAGGTTTT180TGGCCAACCCTAGGCAGATGCTACGGGGCGTTTCGGTGGTCATTTGTGATGAGTGCCACA240GTCATGACTCAACCGTGCTGTTAGGCATTGGGAGAGTTCGGGAGCTGGCGCGTGGGTGCG300GAGTGCAACTAGTGCTCTACGCCACCGCTACACCTCCCGGATCCCCTATGACGCAGCACC360CTTCCATAATTGAGACAAAATTGGACGTGGGCGAGATTCCCTTTTATGGGCATGGAATAC420CCCTCGAGCGGATGCGAACCGGAAGGCACCTCGTGTTCTGCCATTCTAAGGCTGAGTGCG480AGCGCCTTGCTGGCCAGTTCTCCGCTAGGGGGGTCAATGCCATTGCCTATTATAGGGGTA540AAGACAGTTCTATCATCAAGGATGGGGACCTGGTGGTCTGTGCTACAGACGCGCTTTCCA600CTGGGTACACTGGAAATTTCGACTCCGTCACCGACTGTGGATTAGTGGTGGAGGAGGTCG660TTGAGGTGACCCTTGATCCCACCATTACCATCTCCCTGCGGACAGTGCCTGCGTCGGCTG720AACTGTCGATGCAAAGACGAGGACGCACGGGTAGGGGCAGGTCTGGACGCTACTACTACG780CGGGGGTGGGCAAAGCCCCTGCGGGTGTGGTGCGCTCAGGTCCTGTCTGGTCGGCGGTGG840AAGCTGGAGTGACCTCGTACGG862(2)SEQIDNO41的信息(i)序列特征(A)长度865个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株单个克隆GE3L-11(xi)序列描述SEQIDNO41AGTACGGCAACATGGGGCACAAGGTCTTAATCTTGAACCCCTCAGTGGCCACTGTGCGGG60CCATGGGCCCGTACATGGAGCGGCTGGCGGGTAAACATCCAAGTATATACTGTGGGCATG120ATACAACTGCTTTCACAAGGATCACTGACTCCCCCCTGACGTATTCAACCTATGGGAGGT180TTTTGGCCAACCCTAGGCAGATGCTACGGGGCGTTTCGGTGGTCATTTGTGATGAGTGCC240ACAGTCATGACTCAACCGTGCTGTTAGGCATTGGGAGAGTCCGGGAGCTGGCGCGTGGGT300GCGGGGTGCAACTAGTGCTCTACGCCACCGCTACACCTCCCGGATCCCCTATGACGCAGC360ACCCTTCCATAATTGAGACAAAATTGGACGTGGGCGAGATTCCCTTTTATGGACATGGAA420TACCCCTCGAGCGGATGCGAACCGGAAGGCACCTCGTGTTCTGCCATTCTAAGGCTGAGT480GCGAGCGCCTTGCTGGCCAGTTCTCCGCTAGGGGGGTCAATGCCATTGCCTATTATAGGG540GTAAAGACAGTTCTATCATCAAGGATGGGGACCTGGTGGTCTGTGCTACAGACGCGCTTT600CCACTGGGTACACTGGAAATTTCGACTCCGTCACCGACTGTGGATTAGTGGTGGAGGAGG660TCGTTGAGGTGACCCTTGATCCCACCATTACCATCTCCCTGCGGACAGTGCCTGCGTCGG720CTGAACTGTCGATGCAAAGACGAGGACGCACGGGTAGGGGCAGGTCTGGACGCTACTACT780ACGCGGGGGTGGGCAAAGCCCCTGCGGGTGTGGTGCGCTCAGGTCCTGTCTGGTCGGCGG840TGGAAGCTGGAGTGACCTCGTACGG865(2)SEQIDNO42的信息(i)序列特征(A)长度596个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列7E3(xi)序列描述SEQIDNO42AGCATGGGAACATGCTTGAACGGCCTGCTGTTCACGACCTTCCATGGGGCTTCATCCCGA60ACCATCGCCACACCCGTGGGGGCCCTTAATCCCAGATGGTGGTCAGCCAGTGATGATGTC120ACGGTGTATCCACTCCCGGATGGGGCTACTTCGTTAACACCTTGTACTTGCCAGGCTGAG180TCCTGTTGGGTCATCAGATCCGACGGGGCCCTATGCCATGGCTTGAGCAAGGGGGACAAG240GTGGAGCTGGATGTGGCCATGGAGGTCTCTGACTTCCGTGGCTCGTCTGGCTCACCGGTC300CTATGTGACGAAGGGCACGCAGTAGGAATGCTCGTGTCTGTGCTTCACTCCGGTGGTAGG360GTCACCGCGGCACGGTTCACTAGGCCGTGGACCCAAGTGCCAACAGATGCCAAAACCACT420ACTGAACCCCCTCCGGTGCCGGCCAAAGGAGTTTTCAAAGAGGCCCCGTTGTTTATGCCT480ACGGGAGCGGGAAAGAGCACTCGCGTCCCGTTGGAGTACGATAACATGGGGCACAAGGTC540TTAATCTTGAACCCCTCAGTGGCCACTGTGCGGGCCATGGGCCCGTACATGGAGCG596(2)SEQIDNO43的信息(i)序列特征(A)长度586个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列5E5(xi)序列描述SEQIDNO43GAGCTATGGGTACGCGTGCGAGCCCTCATATCATGCATCATTGGACACGGCCCCCTTCTG60CTCCACTTGGCTTGCTGAGTGCAATGCAGATGGGAAGCGCCATTTCTTCCTGACCACGGA120CTTCCGGAGGCCGCTCGCTCGCATGTCGAGTGAGTATAGTGACCCGATGGCTTCGGCGAT180CGGTTACATCCTCCTTTATCCTTGGCACCCCATCACACGGTGGGTCATCATCCCTCATGT240GCTAACGTGCGCATTCAGGGGTGGAGGCACACCGTCTGATCCGGTTTGGTGCCAGGTGCA300TGGTAACTACTACAAGTTTCCACTGGACAAACTGCCTAACATCATCGTGGCCCTCCACGG360ACCAGCAGCGTTGAGGGTTACCGCAGACACAACTAAAACAAAGATGGAGGCTGGTAAGGT420TCTGAGCGACCTCAAGCTCCCTGGCTTAGCAGTCCACCGAAAGAAGGCCGGGGCGTTGCG480AACACGCATGCTCCGCTCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCATCC540AGGCCTACGGCTTCCTCCCCCTGAGATTGCTGGTATCCCGGGGGGT586(2)SEQIDNO44的信息(i)序列特征(A)长度242个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列6E5(44F)(xi)序列描述SEQIDNO44CGAACGCGCATGCTCCGCTCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCAT60CCAGGCCTACGGCTTCCTCCCCCTGAGATTGCTGGTATCCCGGGGGGTTTCCCTCTCTCC120CCCCCCTATATGGGGGTGGTACACCAATTGGATTTCACAAGCCAGAGGAGTCGCTGGCGG180TGGTTGGGGTTCTTAGCCCTGCTCATCGTAGCCCTCTTCGGGTGAACTAAATTCATCTGT240TG242(2)SEQIDNO45的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物gt11反-JL(xi)序列描述SEQIDNO45TGGTAATGGTAGCGACCGGCGCTCAGC27(2)SEQIDNO46的信息(i)序列特征(A)长度45个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE-3F(xi)序列描述SEQIDNO46GCCGCCATGGTCTCATGGGACGCGGACGCTCGTGCGCCCGCGATG45(2)SEQIDNO47的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE-3R(xi)序列描述SEQIDNO47GCGCGGATCCGATAAGTGCTGGCGATGGAGTACG34(2)SEQIDNO48的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE-9F(xi)序列描述SEQIDNO48GGCACCATGGTCACCCCGGAAG22(2)SEQIDNO49的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE-9R(xi)序列描述SEQIDNO49GCTCGGATCCGGAGCAGAAGGGGGCCGT28(2)SEQIDNO50的信息(i)序列特征(A)长度364个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株GE3-2(ix)特性(A)名称/关键词CDS(B)位置2..364(xi)序列描述SEQIDNO50GGTCTCATGGGACGCGGACGCTCGTGCGCCCGCGATGGTCTATGGC46ValSerTrpAspAlaAspAlaArgAlaProAlaMetValTyrGly151015CCTGGGCAAAGTGTTACCATTGACGGGGAGCGCTACACCTTGCCTCAT94ProGlyGlnSerValThrIleAspGlyGluArgTyrThrLeuProHis202530CAACTGAGGCTCAGGAATGTGGCACCCTCTGAGGTTTCATCCGAGGTG142GlnLeuArgLeuArgAsnValAlaProSerGluValSerSerGluVal354045TCCATTGACATTGGGACGGAGACTGAAGACTCAGAACTGACTGAGGCC190SerIleAspIleGlyThrGluThrGluAspSerGluLeuThrGluAla505560GATCTGCCGCCGGCGGCTGCTGCTCTCCAAGCGATCGAGAATGCTGCG238AspLeuProProAlaAlaAlaAlaLeuGlnAlaIleGluAsnAlaAla657075AGGATTCTTGAACCGCACATTGATGTCATCATGGAGGACTGCAGTACA286ArgIleLeuGluProHisIleAspValIleMetGluAspCysSerThr80859095CCCTCTCTTTGTGGTAGTAGCCGAGAGATGCCTGTATGGGGAGAAGAC334ProSerLeuCysGlySerSerArgGluMetProValTrpGlyGluAsp100105110ATCCCCCGTACTCCATCGCCAGCACTTATC364IleProArgThrProSerProAlaLeuIle115120(2)SEQIDNO51的信息(i)序列特征(A)长度121个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO51ValSerTrpAspAlaAspAlaArgAlaProAlaMetValTyrGlyPro151015GlyGlnSerValThrIleAspGlyGluArgTyrThrLeuProHisGln202530LeuArgLeuArgAsnValAlaProSerGluValSerSerGluValSer354045IleAspIleGlyThrGluThrGluAspSerGluLeuThrGluAlaAsp505560LeuProProAlaAlaAlaAlaLeuGlnAlaIleGluAsnAlaAlaArg65707580IleLeuGluProHisIleAspValIleMetGluAspCysSerThrPro859095SerLeuCysGlySerSerArgGluMetProValTrpGlyGluAspIle100105110ProArgThrProSerProAlaLeuIle115120(2)SEQIDNO52的信息(i)序列特征(A)长度290个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆GE9-2(ix)特性(A)名称/关键词CDS(B)位置3..290(xi)序列描述SEQIDNO52CCATGGTCACCCCGGAAGGGGTGCCCGTTGGTGAGAGGTATTGCAGA47MetValThrProGluGlyValProValGlyGluArgTyrCysArg151015TCCTCGGGTGTCCTAACAACTAGCGCGAGCAACTGCTTGACCTGCTAC95SerSerGlyValLeuThrThrSerAlaSerAsnCysLeuThrCysTyr202530ATCAAGGTGAAAGCCGCCTGTGAGAGGGTGGGGCTGAAAAATGTCTCT143IleLysValLysAlaAlaCysGluArgValGlyLeuLysAsnValSer354045CTTCTCATAGCCGGCGATGACTGCTTGATCATATGTGAGCGGCCAGTG191LeuLeuIleAlaGlyAspAspCysLeuIleIleCysGluArgProVal505560TGCGACCCAAGCGACGCTTTGGGCAGAGCCCTAGCGAGCTATGGGTAC239CysAspProSerAspAlaLeuGlyArgAlaLeuAlaSerTyrGlyTyr657075GCGTGCGAGCCCTCATATTATGCATGCTCGGACACGGCCCCCTTCTGC287AlaCysGluProSerTyrTyrAlaCysSerAspThrAlaProPheCys80859095TCC290Ser(2)SEQIDNO53的信息(i)序列特征(A)长度96个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO53MetValThrProGluGlyValProValGlyGluArgTyrCysArgSer151015SerGlyValLeuThrThrSerAlaSerAsnCysLeuThrCysTyrIle202530LysValLysAlaAlaCysGluArgValGlyLeuLysAsnValSerLeu354045LeuIleAlaGlyAspAspCysLeuIleIleCysGluArgProValCys505560AspProSerAspAlaLeuGlyArgAlaLeuAlaSerTyrGlyTyrAla65707580CysGluProSerTyrTyrAlaCysSerAspThrAlaProPheCysSer859095(2)SEQIDNO54的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株JML-ASISPA引物(xi)序列描述SEQIDNO54AGGAATTCAGCGGCCGCGAG20(2)SEQIDNO55的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株JML-BSISPA引物(xi)序列描述SEQIDNO55CTCGCGGCCGCTGAATTCCTTT22(2)SEQIDNO56的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470ep-F1引物(xi)序列描述SEQIDNO56GCGAATTCGCCATGGCGGGGAGACTTTCATCA32(2)SEQIDNO57的信息(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470ep-R1引物(xi)序列描述SEQIDNO57GCGAATTCGGATCCAGGGCCATAGACCATCGCGGG35(2)SEQIDNO58的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470ep-f2引物(xi)序列描述SEQIDNO58GCGAATTCCGTGCGCCCGCCATGGTC26(2)SEQIDNO59的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470ep-R3引物(xi)序列描述SEQIDNO59GCGAATTCGGATCCCAAGGTTTCTTGCCTAGC32(2)SEQIDNO60的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470ep-f4引物(xi)序列描述SEQIDNO60GCGAATTCAAGTGTGAGGCTAGGCAA26(2)SEQIDNO61的信息(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株470ep-R4引物(xi)序列描述SEQIDNO61GCGAATTCGGATCCCCACACAGATGGCGCAAGGGG35(2)SEQIDNO62的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株KL-1SISPA引物(xi)序列描述SEQIDNO62GCAGGATCCGAATTCGCATCTAGAGAT27(2)SEQIDNO63的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株KL-2SISPA引物(xi)序列描述SEQIDNO63ATCTCTAGATGCGAATTCGGATCCTGCGA29(2)SEQIDNO64的信息(i)序列特征(A)长度186个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-10(ix)特性(A)名称/关键词CDS(B)位置1..186(xi)序列描述SEQIDNO64CGTGCGCCCGCCATGGTCTATGGCCCTGGGCAAAGTGTTGCCATTGAC48ArgAlaProAlaMetValTyrGlyProGlyGlnSerValAlaIleAsp151015GGGGAGCGCTACACCTTGCCTCATCAACTGAGGCTCAGGAATGTGGCA96GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla202530CCCTCTGAGGTTTCATCCGAGGTGTCCATTGACATTGGGACGGAGGCT144ProSerGluValSerSerGluValSerIleAspIleGlyThrGluAla354045GAAAACTCAGAACTGACTGAGGCCGATCTGCCGCCGGCGGCT186GluAsnSerGluLeuThrGluAlaAspLeuProProAlaAla505560(2)SEQIDNO65的信息(i)序列特征(A)长度62个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO65ArgAlaProAlaMetValTyrGlyProGlyGlnSerValAlaIleAsp151015GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla202530ProSerGluValSerSerGluValSerIleAspIleGlyThrGluAla354045GluAsnSerGluLeuThrGluAlaAspLeuProProAlaAla505560(2)SEQIDNO66的信息(i)序列特征(A)长度282个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-12(ix)特性(A)名称/关键词CDS(B)位置1..282(xi)序列描述SEQIDNO66CGTGCGCCCGCCATGGTCTATGGCCCTGGGCAAAGTGTTACCATTGAC48ArgAlaProAlaMetValTyrGlyProGlyGlnSerValThrIleAsp151015GGGGAGCGCTACACCTTGCCTCATCAACTGAGGCTCAGGAATGTGGCA96GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla202530CCCTCTGAGGTTTCATCCGAGGTGTCCATTGACATTGGGACGGAGACT144ProSerGluValSerSerGluValSerIleAspIleGlyThrGluThr354045GAAGACTCAGAACTGACTGAGGCCGATCTGCCGCCGGCGGCTGCTGCT192GluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAlaAla505560CTCCAAGCGATCGAGAATGCTGCGAGGATTCTTGAACCGCACATTGAT240LeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIleAsp65707580GTCATCATGGAGGACTGCAGTACACCCTCTCTTTGTGGTAGT282ValIleMetGluAspCysSerThrProSerLeuCysGlySer8590(2)SEQIDNO67的信息(i)序列特征(A)长度94个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO67ArgAlaProAlaMetValTyrGlyProGlyGlnSerValThrIleAsp151015GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla202530ProSerGluValSerSerGluValSerIleAspIleGlyThrGluThr354045GluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAlaAla505560LeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIleAsp65707580ValIleMetGluAspCysSerThrProSerLeuCysGlySer8590(2)SEQIDNO68的信息(i)序列特征(A)长度279个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-26(ix)特性(A)名称/关键词CDS(B)位置1..279(xi)序列描述SEQIDNO68CGTGCGCCCGCCATGGTCTATGGCCCTGGGCAAAGTGTTTCCATTGAC48ArgAlaProAlaMetValTyrGlyProGlyGlnSerValSerIleAsp151015GGGGAGCGCTACACCTTGCCTCATCAACTGAGGCTCAGGAATGTGGCA96GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla202530CCCTCTGAGGTTTCATCCGAGGTGTCCATTGACATTGGGACGGAGACT144ProSerGluValSerSerGluValSerIleAspIleGlyThrGluThr354045GAAGACTCAGAACTGACTGAGGCCGACCTGCCGCCGGCGGCTGCTGCT192GluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAlaAla505560CTCCAAGCGATCGAGAATGCTGCGAGGATTCTTGAACCGCACATCGAT240LeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIleAsp65707580GTCATCATGGAGGACTGCAGTACACCCTCTCTTTGTGGT279ValIleMetGluAspCysSerThrProSerLeuCysGly8590(2)SEQIDNO69的信息(i)序列特征(A)长度93个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO69ArgAlaProAlaMetValTyrGlyProGlyGlnSerValSerIleAsp151015GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla202530ProSerGluValSerSerGluValSerIleAspIleGlyThrGluThr354045GluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAlaAla505560LeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIleAsp65707580ValIleMetGluAspCysSerThrProSerLeuCysGly8590(2)SEQIDNO70的信息(i)序列特征(A)长度108个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-5(ix)特性(A)名称/关键词CDS(B)位置1..108(xi)序列描述SEQIDNO70GCCTATTGTGACAAGGTGCGCACTCCGCTTGAATTGCAGGTTGGGTGC48AlaTyrCysAspLysValArgThrProLeuGluLeuGlnValGlyCys151015TTGGTGGGCAATGAACTTACCTTTGAATGTGACAAGTGTGAGGCTAGG96LeuValGlyAsnGluLeuThrPheGluCysAspLysCysGluAlaArg202530CAAGAAACCTTG108GlnGluThrLeu35(2)SEQIDNO71的信息(i)序列特征(A)长度36个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO71AlaTyrCysAspLysValArgThrProLeuGluLeuGlnValGlyCys151015LeuValGlyAsnGluLeuThrPheGluCysAspLysCysGluAlaArg202530GlnGluThrLeu35(2)SEQIDNO72的信息(i)序列特征(A)长度132个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-3(ix)特性(A)名称/关键词CDS(B)位置1..132(xi)序列描述SEQIDNO72GAGATGGAAATCCAGAACCATACAGCCTATTGTGACAAGGTGCGCACT48GluMetGluIleGlnAsnHisThrAlaTyrCysAspLysValArgThr151015CCGCTTGAATTGCAGGTTGGGTGCTTGGTGGGCAATGAACTTACCTTT96ProLeuGluLeuGlnValGlyCysLeuValGlyAsnGluLeuThrPhe202530GAATGTGACAAGTGTGAGGCTAGGCAAGAAACCTTG132GluCysAspLysCysGluAlaArgGlnGluThrLeu3540(2)SEQIDNO73的信息(i)序列特征(A)长度44个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO73GluMetGluIleGlnAsnHisThrAlaTyrCysAspLysValArgThr151015ProLeuGluLeuGlnValGlyCysLeuValGlyAsnGluLeuThrPhe202530GluCysAspLysCysGluAlaArgGlnGluThrLeu3540(2)SEQIDNO74的信息(i)序列特征(A)长度258个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-27(ix)特性(A)名称/关键词CDS(B)位置1..258(xi)序列描述SEQIDNO74AAAGCCTTATTTCCACAGAGCGACGCGACCAGGAAGCTTACCGTCAAG48LysAlaLeuPheProGlnSerAspAlaThrArgLysLeuThrValLys151015ATGTCATGCTGCGTTGAAAAGAGCGTCACGCGCTTTTTCTCATTGGGG96MetSerCysCysValGluLysSerValThrArgPhePheSerLeuGly202530TTGACGGTGGCTGATGTTGCTAGCCTGTGTGAGATGGAAATCCAGAAC144LeuThrValAlaAspValAlaSerLeuCysGluMetGluIleGlnAsn354045CATATAGCCTATTGTGACAAGGTGCGCACTCCGCTTGAATTGCAGGTT192HisIleAlaTyrCysAspLysValArgThrProLeuGluLeuGlnVal505560GGGTGCTTGGTGGGCAATGAACTCACCTTTGAATGTGACAAGTGTGAG240GlyCysLeuValGlyAsnGluLeuThrPheGluCysAspLysCysGlu65707580GCTAGGCAAGAAACCTTG258AlaArgGlnGluThrLeu85(2)SEQIDNO75的信息(i)序列特征(A)长度86个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO75LysAlaLeuPheProGlnSerAspAlaThrArgLysLeuThrValLys151015MetSerCysCysValGluLysSerValThrArgPhePheSerLeuGly202530LeuThrValAlaAspValAlaSerLeuCysGluMetGluIleGlnAsn354045HisIleAlaTyrCysAspLysValArgThrProLeuGluLeuGlnVal505560GlyCysLeuValGlyAsnGluLeuThrPheGluCysAspLysCysGlu65707580AlaArgGlnGluThrLeu85(2)SEQIDNO76的信息(i)序列特征(A)长度108个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-25(ix)特性(A)名称/关键词CDS(B)位置1..108(xi)序列描述SEQIDNO76ACCTATTGTGACAAGGTGCGCACTCCGCTTGAATTGCAGGTTGGGTGC48ThrTyrCysAspLysValArgThrProLeuGluLeuGlnValGlyCys151015TTGGTGGGCAATGAACTTACCTTTGAATGTGACAAGTGTGAGGCTAGG96LeuValGlyAsnGluLeuThrPheGluCysAspLysCysGluAlaArg202530CAAGAAACCTTG108GlnGluThrLeu35(2)SEQIDNO77的信息(i)序列特征(A)长度36个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO77ThrTyrCysAspLysValArgThrProLeuGluLeuGlnValGlyCys151015LeuValGlyAsnGluLeuThrPheGluCysAspLysCysGluAlaArg202530GlnGluThrLeu35(2)SEQIDNO78的信息(i)序列特征(A)长度108个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-20(ix)特性(A)名称/关键词CDS(B)位置52..108(xi)序列描述SEQIDNO78GCCGACACTACTAAGGTGTATGTTACCAATCCAGACAATGTGGGACGAAGGGTGGGC57ValGly1AATGAACTTACCTTTGAATGTGACAAGTGTGAGGCTAGGCAAGAAACC105AsnGluLeuThrPheGluCysAspLysCysGluAlaArgGlnGluThr51015TTG108Leu(2)SEQIDNO79的信息(i)序列特征(A)长度19个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO79ValGlyAsnGluLeuThrPheGluCysAspLysCysGluAlaArgGln151015GluThrLeu(2)SEQIDNO80的信息(i)序列特征(A)长度168个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-16(ix)特性(A)名称/关键词CDS(B)位置1..168(xi)序列描述SEQIDNO80TTGGGGTTGACGGTGGCTGATGTTGCTAGCCTGTGTGAGATGGAAATC48LeuGlyLeuThrValAlaAspValAlaSerLeuCysGluMetGluIle151015CAGAACCATACAGCCTATTGTGACAAGGTGCGCACTCCGCTTGAATTG96GlnAsnHisThrAlaTyrCysAspLysValArgThrProLeuGluLeu202530CAGGTTGGGTGCTTGGTGGGCAATGAACTTACCTTTGAATGTGACAAG144GlnValGlyCysLeuValGlyAsnGluLeuThrPheGluCysAspLys354045TGTGAGGCTAGGCAAGAAACCTTG168CysGluAlaArgGlnGluThrLeu5055(2)SEQIDNO81的信息(i)序列特征(A)长度56个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO81LeuGlyLeuThrValAlaAspValAlaSerLeuCysGluMetGluIle151015GlnAsnHisThrAlaTyrCysAspLysValArgThrProLeuGluLeu202530GlnValGlyCysLeuValGlyAsnGluLeuThrPheGluCysAspLys354045CysGluAlaArgGlnGluThrLeu5055(2)SEQIDNO82的信息(i)序列特征(A)长度313个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Y5-50(ix)特性(A)名称/关键词CDS(B)位置1..313(xi)序列描述SEQIDNO82ATCACCGTCAACCCCAATGAGAAAAAGCGCGTGACGCTCTTTTCAACG48IleThrValAsnProAsnGluLysLysArgValThrLeuPheSerThr151015CAGCACGACATCTTGACGGTAAGCTTCCTGGTCGCGTCGCTCTGTGGA96GlnHisAspIleLeuThrValSerPheLeuValAlaSerLeuCysGly202530AATAAGGCTTTTAATACGGAAAGAGCCACGTTGAAGACACTTTCCTCC144AsnLysAlaPheAsnThrGluArgAlaThrLeuLysThrLeuSerSer354045CCTTCGGCTGTCTCGGACTCTTGGATGACCTCGAATGAGTCAGAGGAC192ProSerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAsp505560GGGGTATCCTCCTGCGAGGAGGACACCGACGGGGTCTTCTCATCTGAG240GlyValSerSerCysGluGluAspThrAspGlyValPheSerSerGlu65707580CTGCTCTCAGTAACCGAGATAAGTGCTGGCGATGGAGTACGGGGGATG288LeuLeuSerValThrGluIleSerAlaGlyAspGlyValArgGlyMet859095TCTTCTCCCCATACAGGCATCTCTC313SerSerProHisThrGlyIleSer100(2)SEQIDNO83的信息(i)序列特征(A)长度104个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO83IleThrValAsnProAsnGluLysLysArgValThrLeuPheSerThr151015GlnHisAspIleLeuThrValSerPheLeuValAlaSerLeuCysGly202530AsnLysAlaPheAsnThrGluArgAlaThrLeuLysThrLeuSerSer354045ProSerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAsp505560GlyValSerSerCysGluGluAspThrAspGlyValPheSerSerGlu65707580LeuLeuSerValThrGluIleSerAlaGlyAspGlyValArgGlyMet859095SerSerProHisThrGlyIleSer100(2)SEQIDNO84的信息(i)序列特征(A)长度89个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-52(ix)特性(A)名称/关键词CDS(B)位置28..87(xi)序列描述SEQIDNO84ACTGAGAGCAGCTCAGATGAGAAGACCCCTTCGGCTGTCTCGGACTCTTGG51ProSerAlaValSerAspSerTrp15ATGACCTCGAATGAGTCAGAGGACGGGGTATCCTCGCA89MetThrSerAsnGluSerGluAspGlyValSerSer101520(2)SEQIDNO85的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO85ProSerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAsp151015GlyValSerSer20(2)SEQIDNO86的信息(i)序列特征(A)长度214个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-53(ix)特性(A)名称/关键词CDS(B)位置1..100(xi)序列描述SEQIDNO86AATAAGGCTTTTAATACGGAAAGAGCCACGTTGAAGACACTTTCCTCC48AsnLysAlaPheAsnThrGluArgAlaThrLeuLysThrLeuSerSer151015CCTTCGGCTGTCTCGGACTCTTGGATGACCTCGAATGAGTCAGAGGAC96ProSerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAsp202530GGGGATCTCTAGATGCGAATTCAAGTGTGAGGCTAGGCAAGAAACCTTGGCCTC150GlyCTTCTCTTACATTTGGTCTGGAGTGCCGCTGACTAGGGCCACGCCGGCCAAGCCTCCCGT210GGTG214(2)SEQIDNO87的信息(i)序列特征(A)长度33个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO87AsnLysAlaPheAsnThrGluArgAlaThrLeuLysThrLeuSerSer151015ProSerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAsp202530Gly(2)SEQIDNO88的信息(i)序列特征(A)长度113个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-55(ix)特性(A)名称/关键词CDS(B)位置52..113(xi)序列描述SEQIDNO88CCATCGCCAGCACTTATCTCGGTTACTGAGAGCAGCTCAGATCAGAAGACCCCTTCG57ProSer1GCTGTCTCGGACTCTTGGATGACCTCGAATGAGTCAGAGGACGGGGTA105AlaValSerAspSerTrpHetThrSerAsnGluSerGluAspGlyVal51015TCCTCGCA113SerSer20(2)SEQIDNO89的信息(i)序列特征(A)长度20个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO89ProSerAlaValSerAspSerTrpMetThrSerAsnGluSerGluAsp151015GlyValSerSer20(2)SEQIDNO90的信息(i)序列特征(A)长度330个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-56(ix)特性(A)名称/关键词CDS(B)位置1..330(xi)序列描述SEQIDNO90ACGTTGAAGACACTTTCCTCCCCTTCGGCTGTCTCGGACTCTTGGATG48ThrLeuLysThrLeuSerSerProSerAlaValSerAspSerTrpMet151015ACCTCGAATGAGTCAGAGGACGGGGTATCCTCCTGCGAGGAGGACACC96ThrSerAsnGluSerGluAspGlyValSerSerCysGluGluAspThr202530GACGGGGTCTTCTCATCTGAGCTGCTCTCAGTAACCGAGATAAGTGCT144AspGlyValPheSerSerGluLeuLeuSerValThrGluIleSerAla354045GGCGATGGAGTACGGGGGATGTCTTCTCCCCATACAGGCATCTCTCGG192GlyAspGlyValArgGlyMetSerSerProHisThrGlyIleSerArg505560CTACTACCACAAAGAGAGGGTGTACTGCAGTCCTCCATGATGACATCA240LeuLeuProGlnArgGluGlyValLeuGlnSerSerMetMetThrSer65707580ATGTGCGGTTCAAGAATCCTCGCAGCATTCTCGATCGCTTGGAGAGCA288MetCysGlySerArgIleLeuAlaAlaPheSerIleAlaTrpArgAla859095GCAGCCGCCGGCGGCAGATCGGCCTCAGTCAGTTCTGAGTCT330AlaAlaAlaGlyGlyArgSerAlaSerValSerSerGluSer100105110(2)SEQIDNO91的信息(i)序列特征(A)长度110个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO91ThrLeuLysThrLeuSerSerProSerAlaValSerAspSerTrpMet151015ThrSerAsnGluSerGluAspGlyValSerSerCysGluGluAspThr202530AspGlyValPheSerSerGluLeuLeuSerValThrGluIleSerAla354045GlyAspGlyValArgGlyMetSerSerProHisThrGlyIleSerArg505560LeuLeuProGlnArgGluGlyValLeuGlnSerSerMetMetThrSer65707580MetCysGlySerArgIleLeuAlaAlaPheSerIleAlaTrpArgAla859095AlaAlaAlaGlyGlyArgSerAlaSerValSerSerGluSer100105110(2)SEQIDNO92的信息(i)序列特征(A)长度195个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-57(ix)特性(A)名称/关键词CDS(B)位置1..195(xi)序列描述SEQIDNO92ACGGAAAGAGCCACGTTGAAGACACTTTCCTCCCCTTCGGCTGCCTCG48ThrGluArgAlaThrLeuLysThrLeuSerSerProSerAlaAlaSer151015GACTCTTGGATGACCTCGAATGAGTCGGAGGACGGGGTATCCTCCTGC96AspSerTrpMetThrSerAsnGluSerGluAspGlyValSerSerCys202530GAAGAGGACACCGACGGGGTCTTCTCATCTGAGCTGCTCTCAGTAACC144GluGluAspThrAspGlyValPheSerSerGluLeuLeuSerValThr354045GAGATAAGTGCTGGCGGTGGAGTACGGGGGATGTCTTCTCCCCATACG192GluIleSerAlaGlyGlyGlyValArgGlyMetSerSerProHisThr505560GGC195Gly65(2)SEQIDNO93的信息(i)序列特征(A)长度65个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO93ThrGluArgAlaThrLeuLysThrLeuSerSerProSerAlaAlaSer151015AspSerTrpMetThrSerAsnGluSerGluAspGlyValSerSerCys202530GluGluAspThrAspGlyValPheSerSerGluLeuLeuSerValThr354045GluIleSerAlaGlyGlyGlyValArgGlyMetSerSerProHisThr505560Gly65(2)SEQIDNO94的信息(i)序列特征(A)长度115个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-60(ix)特性(A)名称/关键词CDS(B)位置1..115(xi)序列描述SEQIDNO94AAGACACTTTCCTCCCCTTCGGCTGTCTCGGACTCTTGGATGACCTCG48LysThrLeuSerSerProSerAlaValSerAspSerTrpMetThrSer151015AATGAGTCAGAGGACGGGGTATCCTCCTGCGAGGAGGACACCGACTGG96AsnGluSerGluAspGlyValSerSerCysGluGluAspThrAspTrp202530GTCTTCTCATCTGAGCTGC115ValPheSerSerGluLeu35(2)SEQIDNO95的信息(i)序列特征(A)长度38个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO95LysThrLeuSerSerProSerAlaValSerAspSerTrpMetThrSer151015AsnGluSerGluAspGlyValSerSerCysGluGluAspThrAspTrp202530ValPheSerSerGluLeu35(2)SEQIDNO96的信息(i)序列特征(A)长度93个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆Y5-63(ix)特性(A)名称/关键词CDS(B)位置19..93(xi)序列描述SEQIDNO96GAGAGCAGCTCAGATGAGAAGACACTTTCCTCCCCTTCGGCTGTCTCGGAC51LysThrLeuSerSerProSerAlaValSerAsp1510TCTTGGATGACCTCGAATGAGTCAGAGGACGGGGTATCCTCG93SerTrpMetThrSerAsnGluSerGluAspGlyValSerSer152025(2)SEQIDNO97的信息(i)序列特征(A)长度25个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO97LysThrLeuSerSerProSerAlaValSerAspSerTrpMetThrSer151015AsnGluSerGluAspGlyValSerSer2025(2)SEQIDNO98的信息(i)序列特征(A)长度1181个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列8E3(xi)序列描述SEQIDNO98GCTGGCTGAGGCACGGTTGGTCCCGCTGATCTTGCTGCTGCTATGGTGGTGGGTGAACCA60GCTGGCAGTCCTAGGGCTGCCGGCTGTGGAAGCCGCCGTGGCAGGTGAGGTCTTCGCGGG120CCCTGCCCTGTCCTGGTGTCTGGGACTCCCGGTCGTCAGTATGATATTGGGTTTGGCAAA180CCTGGTGCTGTACTTTAGATGGTTGGGACCCCAACGCCTGATGTTCCTCGTGTTGTGGAA240GCTTGCTCGGGGAGCTTTCCCGCTGGCCCTCTTGATGGGGATTTCGGCGACCCGCGGGCG300CACCTCAGTGCTCGGGGCCGAGTTCTGCTTCGATGCTACATTCGAGGTGGACACTTCGGT360GTTGGGCTGGGTGGTGGCCAGTGTGGTAGCTTGGGCCATTGCGCTCCTGAGCTCGATGAG420CGCAGGGGGGTGGAGGCACAAAGCCGTGATCTATAGGACGTGGTGTAAGGGGTACCAGGC480AATCCGTCAAAGGGTGGTGAGGAGCCCCCTCGGGGAGGGGCGGCCTGCCAAACCCCTGAC540CTTTGCCTGGTGCTTGGCCTCGTACATCTGGCCAGATGCTGTGATGATGGTGGTGGTTGC600CTTGGTCCTTCTCTTTGGCCTGTTCGACGCGTTGGATTGGGCCTTGGAGGAGATCTTGGT660GTCCCGGCCCTCGTTGCGGCGTTTGGCTCGGGTGGTTGAGTGCTGTGTGATGGCGGGTGA720GAAGGCCACAACCGTCCGGCTGGTCTCCAAGATGTGTGCGAGAGGAGCTTATTTGTTCGA780TCATATGGGCTCTTTTTCGCGTGCTGTCAAGGAGCGCCTGTTGGAATGGGACGCAGCTCT840TGAACCTCTGTCATTCACTAGGACGGACTGTCGCATCATACGGGATGCCGCGAGGACTTT900GTCCTGCGGGCAGTGCGTCATGGGTTTACCCGTGGTTGCGCGCCGTGGTGATGAGGTTCT960CATCGGCGTCTTCCAGGATGTGAATCATTTGCCTCCCGGGTTTGTTCCGACCGCGCCTGT1020TGTCATCCGACGGTGCGGAAAGGGCTTCTTGGGGGTCACAAAGGCTGCCTTGACAGGTCG1080GGATCCTGACTTACATCCAGGGAACGTCATGGTGTTGGGGACGGCTACGTCGCGAAGCAT1140GGGAACATGCTTGAACGGCCTGCTGTTCACGACCTTCCATG1181(2)SEQIDNO99的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物Y5-10-F1(xi)序列描述SEQIDNO99TCAGCCATGGCTCGTGCGCCCGCGATGGTC30(2)SEQIDNO100的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物Y5-10-R1(xi)序列描述SEQIDNO100CGAGGATCCAGCCGCCGGCGGCAGATC27(2)SEQIDNO101的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物Y5-16F1(xi)序列描述SEQIDNO101GATTCCATGGGTTTGGGGTTGACGGTGGCTGA32(2)SEQIDNO102的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470EP-R3(xi)序列描述SEQIDNO102GCGAATTCGGATCCCAAGGTTTCTTGCCTAGC32(2)SEQIDNO103的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物Y5-5-F1(xi)序列描述SEQIDNO103GAGGCCATGGCCTATTGTGACAAGGTG27(2)SEQIDNO104的信息(i)序列特征(A)长度17个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物PGEX-R(xi)序列描述SEQIDNO104GACCGTCTCCGGGAGCT17(2)SEQIDNO105的信息(i)序列特征(A)长度326个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆GE15(ix)特性(A)名称/关键词CDS(B)位置3..326(xi)序列描述SEQIDNO105CCATGGAGGTCTCTGACTTCCGTGGCTCGTCTGGCTCACCGGTCCTA47MetGluValSerAspPheArgGlySerSerGlySerProValLeu151015TGTGACGAAGGGCACGCAGTAGGAATGCTCGTGTCTGTGCTTCACTCC95CysAspGluGlyHisAlaValGlyMetLeuValSerValLeuHisSer202530GGTGGTAGGGTCACCGCGGCACGGTTCACTAGGCCGTGGACCCAAGTG143GlyGlyArgValThrAlaAlaArgPheThrArgProTrpThrGlnVal354045CCAACAGATGCCAAAACCACCACTGAACCCCCTCCGGTGCCGGCCAAA191ProThrAspAlaLysThrThrThrGluProProProValProAlaLys505560GGAGTTTTCAAAGAGGCCCCGTTGTTTATGCCTACGGGAGCGGGAAAG239GlyValPheLysGluAlaProLeuPheMetProThrGlyAlaGlyLys657075AGCACTCGCGTCCCGTTGGAGTACGGCAACATGGGGCACAAGGTCTTA287SerThrArgValProLeuGluTyrGlyAsnMetGlyHisLysValLeu80859095ATCTTGAACCCCTCAGTGGCCACTGTGCGGGCGATGGGC326IleLeuAsnProSerValAlaThrValArgAlaMetGly100105(2)SEQIDNO106的信息(i)序列特征(A)长度108个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO106MetGluValSerAspPheArgGlySerSerGlySerProValLeuCys151015AspGluGlyHisAlaValGlyMetLeuValSerValLeuHisSerGly202530GlyArgValThrAlaAlaArgPheThrArgProTrpThrGlnValPro354045ThrAspAlaLysThrThrThrGluProProProValProAlaLysGly505560ValPheLysGluAlaProLeuPheMetProThrGlyAlaGlyLysSer65707580ThrArgValProLeuGluTyrGlyAsnMetGlyHisLysValLeuIle859095LeuAsnProSerValAlaThrValArgAlaMetGly100105(2)SEQIDNO107的信息(i)序列特征(A)长度138个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株克隆GE17(ix)特性(A)名称/关键词CDS(B)位置1..138(xi)序列描述SEQIDNO107GGTGATGAGGTTCTCATCGGCGTCTTCCAGGATGTGAATCATTTGCCT48GlyAspGluValLeuIleGlyValPheGlnAspValAsnHisLeuPro151015CCCGGGTTTGTTCCGACCGCGCCTGTTGTCATCCGACGGTGCGGAAAG96ProGlyPheValProThrAlaProValValIleArgArgCysGlyLys202530GGCTTCTTGGGGGTCACAAAGGCTGCCTTGACAGGTCGGGAT138GlyPheLeuGlyValThrLysAlaAlaLeuThrGlyArgAsp354045(2)SEQIDNO108的信息(i)序列特征(A)长度46个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO108GlyAspGluValLeuIleGlyValPheGlnAspValAsnHisLeuPro151015ProGlyPheValProThrAlaProValValIleArgArgCysGlyLys202530GlyPheLeuGlyValThrLysAlaAlaLeuThrGlyArgAsp354045(2)SEQIDNO109的信息(i)序列特征(A)长度395个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列9E3(xi)序列描述SEQIDNO109TGTATTTGTCCTGTTATACCTGATGAAGCTGGCTGAGGCACGGTTGGTCCCGCTGATCTT60GCTGCTGCTATGGTGGTGGGTGAACCAGCTGGCAGTCCTAGGGCTGCCGGCTGTGGAAGC120CGCCGTGGCAGGTGAGGTCTTCGCGGGCCCTGCCCTGTCCTGGTGTCTGGGACTCCCGGT180CGTCAGTATGATATTGGGTTTGGCAAACCTAGTGCTGTACTTTAGATGGTTGGGACCCCA240ACGCCTGATGTTCCTCGTGTTGTGGAAGCTTGCTCGGGGAGCTTTCCCGCTGGCCCTCTT300GATGGGGATTTCGGCGACCCGCGGGCGCACCTCAGTGCTCGGGGCCGAGTTCTGCTTCGA360TGCTACATTCGAGGTGGACACTTCGGTGTTGGGCT395(2)SEQIDNO110的信息(i)序列特征(A)长度460个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列10E3(xi)序列描述SEQIDNO110GCCCCTGGGCAACCAGGGCCGAGGCAACCCGGTGCGGTCGCCCTTGGGTTTTGGGTCCTA60CGCCATGACCAGGATCCGAGATACCCTACATCTGGTGGAGTGTCCCACACCAGCCATTGA120GCCTCCCACCGGGACGTTTGGGTTCTTCCCCGGGACGCCGCCTCTCAACAACTGCATGCT180CTTGGGCACGGAAGTGTCCGAGGCACTTGGGGGGGCTGGCCTCACGGGGGGGTTCTATGA240ACCCCTGGTGCGCAGGTGTTCGAAGCTGATGGGAAGCCGAAATCCGGTTTGTCCGGGGTT300TGCATGGCTCTCTTCGGGCAGGCCTGATGGGTTTATACATGTCCAGGGTCACTTGCAGGA360GGTGGATGCAGGCAACTTCATCCCGCCCCCGCGCTGGTTGCTCTTGGACTTTGTATTTGT420CCTGTTATACCTGATGAAGCTGGCTGAGGCACGGTTGGTC460(2)SEQIDNO111的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE15F(xi)序列描述SEQIDNO111GCCGCCATGGAGGTCTCTGACTTCCGTG28(2)SEQIDNO112的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE15R(xi)序列描述SEQIDNO112GCGCGGATCCGCCCATCGCCCGCACAGTGGC31(2)SEQIDNO113的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE17F(xi)序列描述SEQIDNO113CGCTCCATGGGTGATGAGGTTCTCATCGGCG31(2)SEQIDNO114的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE17R(xi)序列描述SEQIDNO114GTAAGTCAGGATCCCGACCTGTCAAGGC28(2)SEQIDNO115的信息(i)序列特征(A)长度452个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株pGEX-HISb-GE3-sHGV质粒的含含有NcoI/EcoRI的片段(xi)序列描述SEQIDNO115CAAAATCGGATCTGGTTCCGCGTGGTTCCATGGTCTCATGGGACGCGGACGCTCGTGCGC60CCGCGATGGTCTATGGCCCTGGGCAAAGTGTTACCATTGACGGGGAGCGCTACACCTTGC120CTCATCAACTGAGGCTCAGGAATGTGGCACCCTCTGAGGTTTCATCCGAGGTGTCCATTG180ACATTGGGACGGAGACTGAAGACTCAGAACTGACTGAGGCCGATCTGCCGCCGGCGGCTG240CTGCTCTCCAAGCGATCGAGAATGCTGCGAGGATTCTTGAACCGCACATTGATGTCATCA300TGGAGGACTGCAGTACACCCTCTCTTTGTGGTAGTAGCCGAGAGATGCCTGTATGGGGAG360AAGACATCCCCCGTACTCCATCGCCAGCACTTATCGGATCCCACCATCACCATCACCATT420AGAATTCATCGTGACTGACTGACGATCTACCT452(2)SEQIDNO116的信息(i)序列特征(A)长度590个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列11E3(xi)序列描述SEQIDNO116AGCAATCGGCTGGGGTGACCCCATCACTTATTGGAGCCACGGGCAAAATCAGTGGCCCCT60TTCATGCCCCCAGTATGTCTATGGGTCTGCTACAGTCACTTGCGTGTGGGGTTCCGCTTC120TTGGTTTGCCTCCACCAGTGGTCGCGACTCGAAGATAGATGTGTGGAGTTTAGTGCCAGT180TGGCTCTGCCACCTGCACCATAGCCGCACTTGGATCATCGGATCGCGACACGGTGCCTGG240GCTCTCCGAGTGGGGAATCCCGTGCGTGACGTGTGTTCTGGACCGTCGGCCTGCCTCCTG300CGGCACCTGTGTGAGGGACTGCTGGCCCGAGACCGGGTCGGTTAGGTTCCCATTCCATCG360GTGCGGCGTGGGGCCTCGGCTGACAAAGGACTTGGAAGCTGTGCCCTTCGTCAACAGGAC420AACTCCCTTCACCATTAGGGGGCCCCTGGGCAACCAGGGCCGAGGCAACCCGGTGCGGTC480GCCCTTGGGTTTTGGGTCCTACGCCATGACCAGGATCCGAGATACCCTACATCTGGTGGA540GTGTCCCACACCAGCCATCGAGCCTCCCACCGGGACGTTTGGGTTCTTCC590(2)SEQIDNO117的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株探针E3-111PROB(xi)序列描述SEQIDNO117TGGTGAAGGGAGTTGTCCTATTGACGAAG29(2)SEQIDNO118的信息(i)序列特征(A)长度735个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列12E3(xi)序列描述SEQIDNO118ATTGTTGTGCCCCGGAGGACATCGGGTTCTGCCTGGAGGGTGGATGCCTGGTGGCCCTGG60GGTGCACGATTTGCACTGACCAATGCTGGCCACTGTATCAGGCGGGTTTGGCTGTGCGGC120CTGGCAAGTCCGCGGCCCAACTGGTGGGGGAGCTGGGTAGCCTATACGGGCCCCTGTCGG180TCTCGGCCTATGTGGCTGGGATCCTGGGCCTGGGTGAGGTGTACTCGGGTGTCCTAACGG240TGGGAGTCGCGTTGACGCGCCGGGTCTACCCGGTGCCTAACCTGACGTGTGCAGTCGCGT300GTGAGCTAAAGTGGGAAAGTGAGTTTTGGAGATGGACTGAACAGCTGGCCTCCAACTACT360GGATTCTGGAATACCTCTGGAAGGTCCCATTTGATTTCTGGAGAGGCGTGATAAGCCTGA420CCCCCTTGTTGGTTTGCGTGGCCGCATTGCTGCTGCTTGAGCAACGGATTGTCATGGTCT480TCCTGTTGGTGACGATGGCCGGGATGTCGCAAGGCGCCCCTGCCTCCGTTTTGGGGTCAC540GCCCCTTTGACTACGGGTTGACTTGGCAGACCTGCTCTTGCAGGGCCAACGGTTCGCGTT600TTTCGACTGGGGAGAAGGTGTGGGACCGTGGGAACGTTACGCTTCAGTGTGACTGCCCTA660ACGGCCCCTGGGTGTGGTTGCCAGCCTTTTGCCAAGCAATCGGCTGGGGTGACCCCATCA720CTTATTGGAGCCACG735(2)SEQIDNO119的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470EXT4-2189R(xi)序列描述SEQIDNO119ATCTGTGGTATGCCATCCCGGT22(2)SEQIDNO120的信息(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470EXT4-29F(xi)序列描述SEQIDNO120GTTATGCTACTGTCGAAGCAGGT23(2)SEQIDNO121的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV57-4512MF(xi)序列描述SEQIDNO121GGACTTCCGGATAGCTGARAAGCT24(2)SEQIDNO122的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV57-4657MR(xi)序列描述SEQIDNO122GCRTCCACACAGATGGCGCA20(2)SEQIDNO123的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株探针GV22dc-89MF(xi)序列描述SEQIDNO123CYCGCTGRTTTGGGGTGTACTGGAAGGC28(2)SEQIDNO124的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株5’UTR引物FV94-22F(xi)序列描述SEQIDNO124GAAAGCCCCAGAAACCGACGCCTATCTAAGT31(2)SEQIDNO125的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株5’UTR引物FV94-724R(xi)序列描述SEQIDNO125GCACAGCCAAACCCGCCTGATACAGT26(2)SEQIDNO126的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株5’-UTR引物FV94-94F(xi)序列描述SEQIDNO126GTGGTGGATGGGTGATGACAGGGTTGGT28(2)SEQIDNO127的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株5’-UTR引物FV94-912R(xi)序列描述SEQIDNO127TAACTCACACGCGACTGCACACGTCAGGT29(2)SEQIDNO128的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株ENV文库引物GEP-F15(xi)序列描述SEQIDNO128GCGGCCATGGTGCCCTTCGTCAATAGGACA30(2)SEQIDNO129的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株ENV文库引物GEP-R15(xi)序列描述SEQIDNO129CTTGCCATGGCCAGCTGGTTCACCCACCA29(2)SEQIDNO130的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-F17(xi)序列描述SEQIDNO130GCAGGATCCCCTCTGGAAGGTCCCATTTGA30(2)SEQIDNO131的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-R16(xi)序列描述SEQIDNO131TGCGAATCCTCGGCCCTGGTTGCCCAG27(2)SEQIDNO132的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470ep-F9(xi)序列描述SEQIDNO132GCTAGATCTGGCAACATGGGGCACAAGGTC30(2)SEQIDNO133的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470ep-R9(xi)序列描述SEQIDNO133CACAGATCTCGCGTAGTAGTAGCGTCCAGA30(2)SEQIDNO134的信息(i)序列特征(A)长度38个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株种族(Race)PCR的AP引物(xi)序列描述SEQIDNO134CTGGTTCGGCCCACCTCTGAAGGTTCCAGAATCGATAG38(2)SEQIDNO135的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-F10(xi)序列描述SEQIDNO135GCTGGATCCAGCATGGGAACATGCTTGAAC30(2)SEQIDNO136的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-R10(xi)序列描述SEQIDNO136CGCGGATCCCACAGTGGCCACTGAGGGGTT30(2)SEQIDNO137的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物EXY10-F1(xi)序列描述SEQIDNO137GCCCATATGGTGATCACTGGTGACGTT27(2)SEQIDNO138的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物EXY10-F2(xi)序列描述SEQIDNO138GCCCATATGCTGGGTTACGGTGAA24(2)SEQIDNO139的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物EXY10-F3(xi)序列描述SEQIDNO139GCCCATATGACCTCCGCCTATAAGCTG27(2)SEQIDNO140的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物EXY10-R1(xi)序列描述SEQIDNO140GCCCATATGAGCCGCCGGCGGCAGATC27(2)SEQIDNO141的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物EXY5-R1(xi)序列描述SEQIDNO141TGCGGATCCCACATTGTCTGGATT24(2)SEQIDNO142的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物Y5-5-F1(xi)序列描述SEQIDNO142TCGGCCATGGCCTATTGTGACAAGGTG27(2)SEQIDNO143的信息(i)序列特征(A)长度219个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆Q7-12-1(ix)特性(A)名称/关键词CDS(B)位置1..219(xi)序列描述SEQIDNO143GTGCCCTTCGTCAATAGGACAACTCTCTTCACCATTAGGGGGCCCCTG48ValProPheValAsnArgThrThrLeuPheThrIleArgGlyProLeu151015GGCAACCAGGGCCGAGGCAACCCGGTGCGGTCGCCCTTGGGTTTTGGG96GlyAsnGlnGlyArgGlyAsnProValArgSerProLeuGlyPheGly202530TCCTACGCCATGACCAGGATCCGAGATACCCTACATCTGGTGGAGTGT144SerTyrAlaMetThrArgIleArgAspThrLeuHisLeuValGluCys354045CCCACACCAGCCATCGAGCCTCCCACCGGGACGTCTGGGTTCTTCCCC192ProThrProAlaIleGluProProThrGlyThrSerGlyPhePhePro505560GGGACGCCGCCTCTCAACAGCTGCATG219GlyThrProProLeuAsnSerCysMet6570(2)SEQIDNO144的信息(i)序列特征(A)长度73个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO144ValProPheValAsnArgThrThrLeuPheThrIleArgGlyProLeu151015GlyAsnGlnGlyArgGlyAsnProValArgSerProLeuGlyPheGly202530SerTyrAlaMetThrArgIleArgAspThrLeuHisLeuValGluCys354045ProThrProAlaIleGluProProThrGlyThrSerGlyPhePhePro505560GlyThrProProLeuAsnSerCysMet6570(2)SEQIDNO145的信息(i)序列特征(A)长度264个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆Y12-10-3(ix)特性(A)名称/关键词CDS(B)位置1..264(xi)序列描述SEQIDNO145CCCCTCGAGCGGATGCGAACCGGAAGGCACCTCGTGTTCTGCCATTCT48ProLeuGluArgMetArgThrGlyArgHisLeuValPheCysHisSer151015AAGGCTGAGTGCGAGCGCCTTGCTGGCCAGTTCTCCGCTAGGGGGGTC96LysAlaGluCysGluArgLeuAlaGlyGlnPheSerAlaArgGlyVal202530AATGCCATTGCCTATTATAGGGGTAAAGACAGCTCTATCATCAAGGAT144AsnAlaIleAlaTyrTyrArgGlyLysAspSerSerIleIleLysAsp354045GGGGACCTGGTGGTCTGTGCTACAGACGCGCTTTCCACTGGGTACACT192GlyAspLeuValValCysAlaThrAspAlaLeuSerThrGlyTyrThr505560GGAAATTTCGACTCCGTCACCGACTGTGGATTAGTGGTGGAGGAGGTC240GlyAsnPheAspSerValThrAspCysGlyLeuValValGluGluVal65707580GTTGAGGTGACCCTTGATCCCACC264ValGluValThrLeuAspProThr85(2)SEQIDNO146的信息(i)序列特征(A)长度88个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO146ProLeuGluArgMetArgThrGlyArgHisLeuValPheCysHisSer151015LysAlaGluCysGluArgLeuAlaGlyGlnPheSerAlaArgGlyVal202530AsnAlaIleAlaTyrTyrArgGlyLysAspSerSerIleIleLysAsp354045GlyAspLeuValValCysAlaThrAspAlaLeuSerThrGlyTyrThr505560GlyAsnPheAspSerValThrAspCysGlyLeuValValGluGluVal65707580ValGluValThrLeuAspProThr85(2)SEQIDNO147的信息(i)序列特征(A)长度205个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆Y12-15-1(ix)特性(A)名称/关键词CDS(B)位置1..205(xi)序列描述SEQIDNO147GCTAGATCTGGCAACATGGGGCACAAGGTCTTAATCTTGAACCCCTCA48AlaArgSerGlyAsnMetGlyHisLysValLeuIleLeuAsnProSer151015GTGGCCACTGTGCGGGCCATGGGCCCGTACATGGAGCGGCTGGCGGGT96ValAlaThrValArgAlaMetGlyProTyrMetGluArgLeuAlaGly202530AAACATCCAAGTATATACTGTGGGCATGATACAACTGCTTTCACAAGG144LysHisProSerIleTyrCysGlyHisAspThrThrAlaPheThrArg354045ATCACTGACTCCCCCCTGACGTATTCAACCTATGGGAGGTTTTTGGCC192IleThrAspSerProLeuThrTyrSerThrTyrGlyArgPheLeuAla505560AACCCTAGGCAGA205AsnProArgGln65(2)SEQIDNO148的信息(i)序列特征(A)长度68个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO148AlaArgSerGlyAsnMetGlyHisLysValLeuIleLeuAsnProSer151015ValAlaThrValArgAlaMetGlyProTyrMetGluArgLeuAlaGly202530LysHisProSerIleTyrCysGlyHisAspThrThrAlaPheThrArg354045IleThrAspSerProLeuThrTyrSerThrTyrGlyArgPheLeuAla505560AsnProArgGln65(2)SEQIDNO149的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE4F(xi)序列描述SEQIDNO149GCCGCCATGGCTCTCCAAGCGATCGAGAATGC32(2)SEQIDNO150的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE4R(xi)序列描述SEQIDNO150GCGCGGATCCCAACCCCAATGAGAAAAAGCG31(2)SEQIDNO151的信息(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470EXP3F(xi)序列描述SEQIDNO151CCGCCATGGGACGCGGACGCTCG23(2)SEQIDNO152的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470EXP3R(xi)序列描述SEQIDNO152CGCGGATCCTTACTGTCTTATTGCTTCC28(2)SEQIDNO153的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-2888F(xi)序列描述SEQIDNO153GCGGAATTCTTGGCTCGGGTGGTTGAGTGCTGTG34(2)SEQIDNO154的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-3216R(xi)序列描述SEQIDNO154GCGAAGCTTCCGTCGGATGACAACAGGCGCGG32(2)SEQIDNO155的信息(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-6521F(xi)序列描述SEQIDNO155GCGGAATTCACCTCCGCCTATAAGCTGCTGCGCCAG36(2)SEQIDNO156的信息(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-7483R(xi)序列描述SEQIDNO156GCTGCGGCCGCCCTCCGTCCCACATTGTCTGGATTGGTAACA42(2)SEQIDNO157的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物T7F(xi)序列描述SEQIDNO157ATTAATACGACTCACTATAGGG22(2)SEQIDNO158的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物T7R(xi)序列描述SEQIDNO158CAAGGGGTTATGCTAGTTATTG22(2)SEQIDNO159的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆GE4-8(ix)特性(A)名称/关键词CDS(B)位置1..402(xi)序列描述SEQIDNO159GCTCTCCAAGCGATCGAGAATGCTGCGAGGATTCTTGAACCGCACATT48AlaLeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIle151015GATGTCATCATGGAGGACTGCAGTACACCCTCTCTTTGTGGTAGTAGC96AspValIleMetGluAspCysSerThrProSerLeuCysGlySerSer202530CGAGAGATGCCTGTATGGGGAGAAGACATCCCCCGTACTCCATCGCCA144ArgGluMetProValTrpGlyGluAspIleProArgThrProSerPro354045GCACTTATCTCGGTTACTGAGAGCAGCTCAGATGAGAAGACCCCGTCG192AlaLeuIleSerValThrGluSerSerSerAspGluLysThrProSer505560GTGTCCTCCTCGCAGGAGGATACCCCGTCCTCTGACTCATTCGAGGTC240ValSerSerSerGlnGluAspThrproSerSerAspSerPheGluVal65707580ATCCAAGAGTCCGAGACAGCCGAAGGGGAGGAAAGTGTCTTCAACGTG288IleGlnGluSerGluThrAlaGluGlyGluGluSerValPheAsnVal859095GCTCTTTCCGTATTAAAAGCCTTATTTCCACAGAGCGACGCGACCAGG336AlaLeuSerValLeuLysAlaLeuPheProGlnSerAspAlaThrArg100105110AAGCTTACCGTCAAGATGTCGTGCTGCGTTGAAAAGAGCGTCACGCGC384LysLeuThrValLysMetSerCysCysValGluLysSerValThrArg115120125TTTTTCTCATTGGGGTTG402PhePheSerLeuGlyLeu130(2)SEQIDNO160的信息(i)序列特征(A)长度134个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO160AlaLeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIle151015AspValIleMetGluAspCysSerThrProSerLeuCysGlySerSer202530ArgGluMetProValTrpGlyGluAspIleProArgThrProSerPro354045AlaLeuIleSerValThrGluSerSerSerAspGluLysThrProSer505560ValSerSerSerGlnGluAspThrProSerSerAspSerPheGluVal65707580IleGlnGluSerGluThrAlaGluGlyGluGluSerValPheAsnVal859095AlaLeuSerValLeuLysAlaLeuPheProGlnSerAspAlaThrArg100105110LysLeuThrValLysMetSerCysCysValGluLysSerValThrArg115120125PhePheSerLeuGlyLeu130(2)SEQIDNO161的信息(i)序列特征(A)长度1011个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆EXP3-7(ix)特性(A)名称/关键词CDS(B)位置1..1011(xi)序列描述SEQIDNO161ATGGTCTATGGCCCTGGGCAAAGTGTTACCATTGACGGGGAGCGCTAC48MetValTyrGlyProGlyGlnSerValThrIleAspGlyGluArgTyr151015ACCTTGCCTCATCAACTGAGGCTCAGGAATGTGGCACCCTCTGAGGTT96ThrLeuProHisGlnLeuArgLeuArgAsnValAlaProSerGluVal202530TCATCCGAGGTGTCCATTGACATTGGGACGGAGACTGAAGACTCAGAA144SerSerGluValSerIleAspIleGlyThrGluThrGluAspSerGlu354045CTGACTGAGGCCGATCTGCCGCCGGCGGCTGCTGCTCTCCAAGCGATC192LeuThrGluAlaAspLeuProProAlaAlaAlaAlaLeuGlnAlaIle505560GAGAATGCTGCGAGGATTCTTGAACCGCACATTGATGTCATCATGGAG240GluAsnAlaAlaArgIleLeuGluProHisIleAspValIleMetGlu65707580GACTGCAGTACACCCTCTCTTTGTGGTAGTAGCCGAGAGATGCCTGTA288AspCysSerThrProSerLeuCysGlySerSerArgGluMetProVal859095TGGGGAGAAGACATCCCCCGTACTCCATCGCCAGCACTTATCTCGGTT336TrpGlyGluAspIleProArgThrProSerProAlaLeuIleSerVal100105110ACTGAGAGCAGCTCAGATGAGAAGACCCCGTCGGTGTCCTCCTCGCAG384ThrGluSerSerSerAspGluLysThrProSerValSerSerSerGln115120125GAGGATACCCCGTCCTCTGACTCATTCGAGGTCATCCAAGAGTCCGAG432GluAspThrProSerSerAspSerPheGluValIleGlnGluSerGlu130135140ACAGCCGAAGGGGAGGAAAGTGTCTTCAACGTGGCTCTTTCCGTATTA480ThrAlaGluGlyGluGluSerValPheAsnValAlaLeuSerValLeu145150155160AAAGCCTTATTTCCACAGAGCGACGCGACCAGGAAGCTTACCGTCAAG528LysAlaLeuPheProGlnSerAspAlaThrArgLysLeuThrValLys165170175ATGTCGTGCTGCGTTGAAAAGAGCGTCACGCGCTTTTTCTCATTGGGG576MetSerCysCysValGluLysSerValThrArgPhePheSerLeuGly180185190TTGACGGTGGCTGATGTTGCTAGCCTGTGTGAGATGGAAATCCAGAAC624LeuThrValAlaAspValAlaSerLeuCysGluMetGluIleGlnAsn195200205CATACAGCCTATTGTGACCAGGTGCGCACTCCGCTTGAATTGCAGGTT672HisThrAlaTyrCysAspGlnValArgThrProLeuGluLeuGlnVal210215220GGGTGCTTGGTGGGCAATGAACTTACCTTTGAATGTGACAAGTGTGAG720GlyCysLeuValGlyAsnGluLeuThrPheGluCysAspLysCysGlu225230235240GCTAGGCAAGAAACCTTGGCCTCCTTCTCTTACATTTGGTCTGGAGTG768AlaArgGlnGluThrLeuAlaSerPheSerTyrIleTrpSerGlyVal245250255CCGCTGACTAGGGCCACGCCGGCCAAGCCTCCCGTGGTGAGGCCGGTT816ProLeuThrArgAlaThrProAlaLysProProValValArgProVal260265270GGCTCTTTGTTAGTGGCCGACACTACTAAGGTGTATGTTACCAATCCA864GlySerLeuLeuValAlaAspThrThrLysValTyrValThrAsnPro275280285GACAATGTGGGACGGAGGGTGGACAAGGTGACCTTCTGGCGTGCTCCT912AspAsnValGlyArgArgValAspLysValThrPheTrpArgAlaPro290295300AGGGTTCATGATAAGTACCTCGTGGACTCTATTGAGCGCGCTAAGAGG960ArgValHisAspLysTyrLeuValAspSerIleGluArgAlaLysArg305310315320GCCGCTCAAGCCTGCCTAAGCATGGGTTACACTTATGAGGAAGCAATA1008AlaAlaGlnAlaCysLeuSerMetGlyTyrThrTyrGluGluAlaIle325330335AGG1011Arg(2)SEQIDNO162的信息(i)序列特征(A)长度337个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO162MetValTyrGlyProGlyGlnSerValThrIleAspGlyGluArgTyr151015ThrLeuProHisGlnLeuArgLeuArgAsnValAlaProSerGluVal202530SerSerGluValSerIleAspIleGlyThrGluThrGluAspSerGlu354045LeuThrGluAlaAspLeuProProAlaAlaAlaAlaLeuGlnAlaIle505560GluAsnAlaAlaArgIleLeuGluProHisIleAspValIleMetGlu65707580AspCysSerThrProSerLeuCysGlySerSerArgGluMetProVal859095TrpGlyGluAspIleProArgThrProSerProAlaLeuIleSerVal100105110ThrGluSerSerSerAspGluLysThrProSerValSerSerSerGln115120125GluAspThrProSerSerAspSerPheGluValIleGlnGluSerGlu130135140ThrAlaGluGlyGluGluSerValPheAsnValAlaLeuSerValLeu145150155160LysAlaLeuPheProGlnSerAspAlaThrArgLysLeuThrValLys165170175MetSerCysCysValGluLysSerValThrArgPhePheSerLeuGly180185190LeuThrValAlaAspValAlaSerLeuCysGluMetGluIleGlnAsn195200205HisThrAlaTyrCysAspGlnValArgThrProLeuGluLeuGlnVal210215220GlyCysLeuValGlyAsnGluLeuThrPheGluCysAspLysCysGlu225230235240AlaArgGlnGluThrLeuAlaSerPheSerTyrIleTrpSerGlyVal245250255ProLeuThrArgAlaThrProAlaLysProProValValArgProVal260265270GlySerLeuLeuValAlaAspThrThrLysValTyrValThrAsnPro275280285AspAsnValGlyArgArgValAspLysValThrPheTrpArgAlaPro290295300ArgValHisAspLysTyrLeuValAspSerIleGluArgAlaLysArg305310315320AlaAlaGlnAlaCysLeuSerMetGlyTyrThrTyrGluGluAlaIle325330335Arg(2)SEQIDNO163的信息(i)序列特征(A)长度351个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆GENS2b-1(ix)特性(A)名称/关键词CDS(B)位置1..351(xi)序列描述SEQIDNO163TTGGCTCGGGTGGTTGAGTGCTGTGTGATGGCGGGTGAGAAGGCCACA48LeuAlaArgValValGluCysCysValMetAlaGlyGluLysAlaThr151015ACCGTCCGGCTGGTCTCCAAGATGTGTGCGAGAGGAGCTTATTTGTTC96ThrValArgLeuValSerLysMetCysAlaArgGlyAlaTyrLeuPhe202530GATCATATGGGCTCTTTTTCGCGTGCTGTCAAGGAGCGCCTGTTGGAA144AspHisMetGlySerPheSerArgAlaValLysGluArgLeuLeuGlu354045TGGGACGCAGCTCTTGAACCTCTGTCATTCACTAGGACGGACTGTCGC192TrpAspAlaAlaLeuGluProLeuSerPheThrArgThrAspCysArg505560ATCATACGGGATGCCGCGAGGACTTTGTCCTGCGGGCAGTGCGTCATG240IleIleArgAspAlaAlaArgThrLeuSerCysGlyGlnCysValMet65707580GGTTTACCCGTGGTTGCGCGCCGTGGTGATGAGGTTCTCATCGGCGTC288GlyLeuProValValAlaArgArgGlyAspGluValLeuIleGlyVal859095TTCCAGGATGTGAATCATTTGCCTCCCGGGTTTGTTCCGACCGCGCCT336PheGlnAspValAsnHisLeuProProGlyPheValProThrAlaPro100105110GTTGTCATCCGACGG351ValValIleArgArg115(2)SEQIDNO164的信息(i)序列特征(A)长度117个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO164LeuAlaArgValValGluCysCysValMetAlaGlyGluLysAlaThr151015ThrValArgLeuValSerLysMetCysAlaArgGlyAlaTyrLeuPhe202530AspHisMetGlySerPheSerArgAlaValLysGluArgLeuLeuGlu354045TrpAspAlaAlaLeuGluProLeuSerPheThrArgThrAspCysArg505560IleIleArgAspAlaAlaArgThrLeuSerCysGlyGlnCysValMet65707580GlyLeuProValValAlaArgArgGlyAspGluValLeuIleGlyVal859095PheGlnAspValAsnHisLeuProProGlyPheValProThrAlaPro100105110ValValIleArgArg115(2)SEQIDNO165的信息(i)序列特征(A)长度993个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株抗原克隆GENS5a-3(ix)特性(A)名称/关键词CDS(B)位置1..993(xi)序列描述SEQIDNO165ACCTCCGCCTATAAGCTGCTGCGCCAGCAAATCCTATCGGCTGCTGTA48ThrSerAlaTyrLysLeuLeuArgGlnGlnIleLeuSerAlaAlaVal151015GCTGAGCCCTACTACGTCGACGGCATTCCGGTCTCATGGGACGCGGAC96AlaGluProTyrTyrValAspGlyIleProValSerTrpAspAlaAsp202530GCTCGTGCGCCCGCCATGGTCTATGGCCCTGGGCAAAGTGTTACCATT144AlaArgAlaProAlaMetValTyrGlyProGlyGlnSerValThrIle354045GACGGGGAGCGCTACACCTTGCCTCATCAACTGAGGCTCAGGAATGTG192AspGlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnVal505560GCACCCTCTGAGGTTTCATCCGAGGTGTCCATTGACATTGGGACGGAG240AlaProSerGluValSerSerGluValSerIleAspIleGlyThrGlu65707580ACTGAAGACTCAGAACTGACTGAGGCCGATCTGCCGCCGGCGGCTGCT288ThrGluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAla859095GCTCTCCAAGCGATCGAGAATGCTGCGAGGATTCTTGAACCGCACATT336AlaLeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIle100105110GATGTCATCATGGAGGACTGCAGTACACCCTCTCTTTGTGGTAGTAGC384AspValIleMetGluAspCysSerThrProSerLeuCysGlySerSer115120125CGAGAGATGCCTGTATGGGGAGAAGACATCCCCCGTACTCCATCGCCA432ArgGluMetProValTrpGlyGluAspIleProArgThrProSerPro130135140GCACTTATCTCGGTTACTGAGAGCAGCTCAGATGAGAAGACCCCGTCG480AlaLeuIleSerValThrGluSerSerSerAspGluLysThrProSer145150155160GTGTCCTCCTCGCAGGAGGATACCCCGTCCTCTGACTCATTCGAGGTC528ValSerSerSerGlnGluAspThrProSerSerAspSerPheGluVal165170175ATCCAAGAGTCCGAGACAGCCGAAGGGGAGGAAAGTGTCTTCAACGTG576IleGlnGluSerGluThrAlaGluGlyGluGluSerValPheAsnVal180185190GCTCTTTCCGTATTAAAAGCCTTATTTCCACAGAGCGACGCGACCAGG624AlaLeuSerValLeuLysAlaLeuPheProGlnSerAspAlaThrArg195200205AAGCTTACCGTCAAGATGTCGTGCTGCGTTGAAAAGAGCGTCACGCGC672LysLeuThrValLysMetSerCysCysValGluLysSerValThrArg210215220TTTTTCTCATTGGGGTTGACGGTGGCTGATGTTGCTAGCCTGTGTGAG720PhePheSerLeuGlyLeuThrValAlaAspValAlaSerLeuCysGlu225230235240ATGGAAATCCAGAACCATACAGCCTATTGTGACCAGGTGCGCACTCCG768MetGluIleGlnAsnHisThrAlaTyrCysAspGlnValArgThrPro245250255CTTGAATTGCAGGTTGGGTGCTTGGTGGGCAATGAACTTACCTTTGAA816LeuGluLeuGlnValGlyCysLeuValGlyAsnGluLeuThrPheGlu260265270TGTGACAAGTGTGAGGCTAGGCAAGAAACCTTGGCCTCCTTCTCTTAC864CysAspLysCysGluAlaArgGlnGluThrLeuAlaSerPheSerTyr275280285ATTTGGTCTGGAGTGCCGCTGACTAGGGCCACGCCGGCCAAGCCTCCC912IleTrpSerGlyValProLeuThrArgAlaThrProAlaLysProPro290295300GTGGTGAGGCCGGTTGGCTCTTTGTTAGTGGCCGACACTACTAAGGTG960ValValArgProValGlySerLeuLeuValAlaAspThrThrLysVal305310315320TATGTTACCAATCCAGACAATGTGGGACGGAGG993TyrValThrAsnProAspAsnValGlyArgArg325330(2)SEQIDNO166的信息(i)序列特征(A)长度331个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO166ThrSerAlaTyrLysLeuLeuArgGlnGlnIleLeuSerAlaAlaVal151015AlaGluProTyrTyrValAspGlyIleProValSerTrpAspAlaAsp202530AlaArgAlaProAlaMetValTyrGlyProGlyGlnSerValThrIle354045AspGlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnVal505560AlaProSerGluValSerSerGluValSerIleAspIleGlyThrGlu65707580ThrGluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAla859095AlaLeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIle100105110AspValIleMetGluAspCysSerThrProSerLeuCysGlySerSer115120125ArgGluMetProValTrpGlyG1uAspIleProArgThrProSerPro130135140AlaLeuIleSerValThrGluSerSerSerAspGluLysThrProSer145150155160ValSerSerSerGlnGluAspThrProSerSerAspSerPheGluVal165170175IleGlnGluSerGluThrAlaGluGlyGluGluSerValPheAsnVal180185190AlaLeuSerValLeuLysAlaLeuPheProGlnSerAspAlaThrArg195200205LysLeuThrValLysMetSerCysCysValGluLysSerValThrArg210215220PhePheSerLeuGlyLeuThrValAlaAspValAlaSerLeuCysGlu225230235240MetGluIleGlnAsnHisThrAlaTyrCysAspGlnValArgThrPro245250255LeuGluLeuGlnValGlyCysLeuValGlyAsnGluLeuThrPheGlu260265270CysAspLysCysGluAlaArgGlnGluThrLeuAlaSerPheSerTyr275280285IleTrpSerGlyValProLeuThrArgAlaThrProAlaLysProPro290295300ValValArgProValGlySerLeuLeuValAlaAspThrThrLysVal305310315320TyrValThrAsnProAspAsnValGlyArgArg325330(2)SEQIDNO167的信息(i)序列特征(A)长度536个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列3’-末端(xi)序列描述SEQIDNO167CTGAGCGACCTCAAGCTCCCTGGCTTAGCAGTCCACCGAAAGAAGGCCGGGGCGTTGCGA60ACACGCATGCTCCGCTCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCATCCA120GGCCTACGGCTTCCTCCCCCTGAGATTGCTGGTATCCCGGGGGGTTTCCCTCTCTCCCCC180CCCTATATGGGGGTGGTACATCAATTGGATTTCACAAGCCAGAGGAGTCGCTGGCGGTGG240TTGGGGTTCTTAGCCCTGCTCATCGTAGCCCTCTTCGGGTGAACTAAATTCATCTGTTGC300GGCAAGGTCTGGTGACTGATCATCACCGGAGGAGGTTCCCGCCCTCCCCGCCCCAGGGGT360CTCCCCGCTGGGTAAAAAGGGCCCGGCCTTGGGAGGCATGGTGGTTACTAACCCCCTGGC420AGGGTCAAAGCCTGATGGTGCTAATGCACTGCCACTTCGGTGGCGGGTCGCTACCTTATA480GCGTAATCCGTGACTACGGGCTGCTCGCAGAGCCCTCCCCGGATGGGGCACAGTGC536(2)SEQIDNO168的信息(i)序列特征(A)长度594个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株单个克隆MP3-3(xi)序列描述SEQIDNO168CTGAGCGACCTCAAGCTCCCTGGCTTAGCAGTCCACCGAAAGAAGGCCGGGGCGTTGCGA60ACACGCATGCTCCGCTCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCATCCA120GGCCTACGGCTTCCTCCCCCTGAGATTGCTGGTATCCCGGGGGGTTTCCCTCTCTCCCCC180CCCTATATGGGGGTGGTACACCAATTGGATTTCACAAGCCAGAGGAGTCGCTGGCGGTGG240TTGGGGTTCTTAGCCCTGCTCATCGTAGCCCTCTTCGGGTGAACTAAATTCATCTGTTGC300GGCAAGGTCTGGTGACTGATCATCACCGGAGGAGGTTCCCGCCCTCCCCGCCCCAGGGGT360CTCCCCGCTGGGTAAAAAGGGCCCGGCCTTGGGAGGCATGGTGGTTACTAACCCCCTGGC420AGGGTCAAAGCCTGATGGTGCTAATGCACTGCCACTTCGGTGGCGGGTCGCTACCTTATA480GCGTAATCCGTGACTACGGGCTGCTCGCAGAGCCCTCCCCGGATGGGGCACAGTGCACTG540TGATCTGAAGGGGTGCACCCCGGGAAGAGCTCGGCCCGAAGGCCGGCTTCTACT594(2)SEQIDNO169的信息(i)序列特征(A)长度594个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株单个克隆MP3-7(xi)序列描述SEQIDNO169CTGAGCGACCTCAAGCTCCCTGGCTTAGCAGTCCACCGAAAGAAGGCCGGGGCGTTGCGA60ACACGCATGCTCCGCTCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCATCCA120GGCCTACGGCTTCCTCCCCCTGAGATTGCTGGTGTCCCGGGGGGTTTCCCTCTCTCCCCC180CCCTATATGGGGGTGGTACACCAATTGGATTTCACAAGCCAGAGGAGTCGCTGGCGGTGG240TTGGGGTTCTTAGCCCTGCTCATCGTAGCCCTCTTCGGGTGAACTAAATTCATCTGTTGC300GGCAAGGTCTGGTGACTGATCATCACCGGAGGAGGTTCCCGCCCTCCCCGCCCCAGGGGT360CTCCCCGCTGGGTAAAAAGGGCCCGGCCTTGGGAGGCATGGTGGTTACTAACCCCCTGGC420AGGGTCAAAGCCTGATGGTGCTAATGCACTGCCACTTCGGTGGCGGGTCGCTACCTTATA480GCGTAATCCGTGACTACGGGCTGCTCGCAGAGCCCTCCCCGGATGGGGCACAGTGCACTG540TGATCTGAAGGGGTGCACCCCGGTAAGAGCTCGGCCCGAAGGCCGGGTTCTACT594(2)SEQIDNO170的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV5446IRT(xi)序列描述SEQIDNO170CGGTCCCTCGAACTCCAGCGAGTCTTTTTTTTTTTTTTT39(2)SEQIDNO171的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV59-5446F(xi)序列描述SEQIDNO171CTGAGCGACCTCAAGCTCCCTGGC24(2)SEQIDNO172的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV-5446IR(xi)序列描述SEQIDNO172CGGTCCCTCGAACTCCAGCGAGTC24(2)SEQIDNO173的信息(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株探针E5-7-PRB(xi)序列描述SEQIDNO173CGTAGCCCTCGGGTGAACTAAAT23(2)SEQIDNO174的信息(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株种族锚序列(xi)序列描述SEQIDNO174CACGAATTCACTATCGATTCTGGAACCTTCAGAGG35(2)SEQIDNO175的信息(i)序列特征(A)长度736个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株共有序列5’-末端(xi)序列描述SEQIDNO175ACGTGGGGGAGTTGATCCCCCCCCCCCGGCACTGGGTGCAAGCCCCAGAAACCGACGCCT60ATCTAAGTAGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGG120GTGATGACAGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGT180CTTAAGAGAAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGT240GTTGGCCCTACCGGTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGT300TACCCACCTGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTG360ACCAATAGGCGTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGAGAGGG420ACTCCAAGTCCCGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACCCAGCTCCGCGG480CGGCCTGCAGCCGGGGTAGCCCAAGAATCCTTCGGGTGAGGGCGGGTGGCATTTCCTTTT540TCTATACCATCATGGCAGTCCTTCTGCTCCTTCTCGTGGTTGAGGCCGGGGCCATTCTGG600CCCCGGCCACCCACGCTTGTCGAGCGAATGGGCAATATTTCCTCACAAATTGTTGTGCCC660CGGAGGACATCGGGTTCTGCCTGGAGGGTGGATGCCTGGTGGCCCTGGGGTGCACGATTT720GCACTGACCAATGCTG736(2)SEQIDNO176的信息(i)序列特征(A)长度688个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV变异体BG34(ix)特性(A)名称/关键词CDS(B)位置272..688(xi)序列描述SEQIDNO176GACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGACAGGGTTGGT60AGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAGAAGGTTAAG120ATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCCTACCGGTGT180GAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACCTGGGCAAAC240GACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAGG292MetProLeuLeuAlaAsnArg15AGTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGAGTCACGGGG340SerIleArgArgValAspLysAspGlnTrpGlyProGlyValThrGly101520ATGGACCCCGGGCTCTGCCCTTCCCGGTGGAACGGGAAACGCATGGGG388MetAspProGlyLeuCysProSerArgTrpAsnGlyLysArgMetGly253035CCACCCAGCTCCGCGGCGGCCTGCAGCCGGGGTAGCCCAAGAACCCTT436ProProSerSerAlaAlaAlaCysSerArgGlySerProArgThrLeu40455055CGGGTGAGGGCGGGTGGCATTTCTCTTTTCTGTATCATCATGGCAGTC484ArgValArgAlaGlyGlyIleSerLeuPheCysIleIleMetAlaVal606570CTCCTGCTCCTTCTCGTGGTTGAGGCCGGGGCCATTCTGGCCCCGGCC532LeuLeuLeuLeuLeuValValGluAlaGlyAlaIleLeuAlaProAla758085ACCCACGCTTGTCGAGCGAATGGACAATATTTCCTCACAAACTGTTGC580ThrHisAlaCysArgAlaAsnGlyGlnTyrPheLeuThrAsnCysCys9095100GCCCTCGAGGACATCGGGTTCTGCCTGGAAGGCGGGTGCCTGGTGGCC628AlaLeuGluAspIleGlyPheCysLeuGluGlyGlyCysLeuValAla105110115TTAGGGTGCACCATTTGCACTGACCGTTGCTGGCCACTGTATCAGGCG676LeuGlyCysThrIleCysThrAspArgCysTrpProLeuTyrGlnAla120125130135GGTTTGGCTGTG688GlyLeuAlaVal(2)SEQIDNO177的信息(i)序列特征(A)长度139个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO177MetProLeuLeuAlaAsnArgSerIleArgArgValAspLysAspGln151015TrpGlyProGlyValThrGlyMetAspProGlyLeuCysProSerArg202530TrpAsnGlyLysArgMetGlyProProSerSerAlaAlaAlaCysSer354045ArgGlySerProArgThrLeuArgValArgAlaGlyGlyIleSerLeu505560PheCysIleIleMetAlaValLeuLeuLeuLeuLeuValValGluAla65707580GlyAlaIleLeuAlaProAlaThrHisAlaCysArgAlaAsnGlyGln859095TyrPheLeuThrAsnCysCysAlaLeuGluAspIleGlyPheCysLeu100105110GluGlyGlyCysLeuValAlaLeuGlyCysThrIleCysThrAspArg115120125CysTrpProLeuTyrGlnAlaGlyLeuAlaVal130135(2)SEQIDNO178的信息(i)序列特征(A)长度663个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV变异体T55806(ix)特性(A)名称/关键词CDS(B)位置271..663(xi)序列描述SEQIDNO178GACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCCAGGGTTGGT60AGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGAGAAGGTTAAG120ATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCCTACCGGTGG180AATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACCTGGGCAAACG240ACGCTCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAGGTTT294MetSerLeuLeuThrAsnArgPhe15ATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTTACGGGGACG342IleArgArgValAspLysAspGlnTrpGlyProGlyValThrGlyThr101520GACCCCGAACCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCA390AspProGluProCysProSerArgTrpAlaGlyLysCysMetGlyPro25303540CCCAGCTCCGCGGCGGCCTGCAGCCGGGGTAGCCCAAGAATCCTTCGG438ProSerSerAlaAlaAlaCysSerArgGlySerProArgIleLeuArg455055GTGAGGGCGGGTGGCATTTCTCTTTTCTATACCATCATGGCAGTCCTT486ValArgAlaGlyGlyIleSerLeuPheTyrThrIleMetAlaValLeu606570CTGCTCTTCTTCGTGGTTGAGGCCGGGGCGATTCTCGCCCCGGCCACC534LeuLeuPhePheValValGluAlaGlyAlaIleLeuAlaProAlaThr758085CACGCTTGTCGGGCGAATGGGCAATATTTCCTCACAAATTGTTGCGCC582HisAlaCysArgAlaAsnGlyGlnTyrPheLeuThrAsnCysCysAla9095100CCAGAGGATGTTGGGTTCTGCCTGGAGGGCGGATGCCTGGTGGCTCTG630ProGluAspValGlyPheCysLeuGluGlyGlyCysLeuValAlaLeu105110115120GGGTGTACGATTTGCACTGACCGTTGCTGGCCA663GlyCysThrIleCysThrAspArgCysTrpPro125130(2)SEQIDNO179的信息(i)序列特征(A)长度131个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO179MetSerLeuLeuThrAsnArgPheIleArgArgValAspLysAspGln151015TrpGlyProGlyValThrGlyThrAspProGluProCysProSerArg202530TrpAlaGlyLysCysMetGlyProProSerSerAlaAlaAlaCysSer354045ArgGlySerProArgIleLeuArgValArgAlaGlyGlyIleSerLeu505560PheTyrThrIleMetAlaValLeuLeuLeuPhePheValValGluAla65707580GlyAlaIleLeuAlaProAlaThrHisAlaCysArgAlaAsnGlyGln859095TyrPheLeuThrAsnCysCysAlaProGluAspValGlyPheCysLeu100105110GluGlyGlyCysLeuValAlaLeuGlyCysThrIleCysThrAspArg115120125CysTrpPro130(2)SEQIDNO180的信息(i)序列特征(A)长度632个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV变异体EB20-2(ix)特性(A)名称/关键词CDS(B)位置271..632(xi)序列描述SEQIDNO180GACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCCAGGGTTGGT60AGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGAGAAGGTTAAG120ATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCCTACCGGTGT180AATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACCTGGGCAAACG240ACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAGGAGT294MetProLeuLeuAlaAsnArgSer15TATCTCCGGCGAGTTGGCAAGGACCAGTGGGGGCCGGGGGTTACGGGG342TyrLeuArgArgValGlyLysAspGlnTrpGlyProGlyValThrGly101520AAGGACCCCGAACCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGG390LysAspProGluProCysProSerArgTrpAlaGlyLysCysMetGly25303540CCACCCAGCTCCGCGGCGGCCTGCAGCCGGGGTAGCCCAAAAAACCTT438ProProSerSerAlaAlaAlaCysSerArgGlySerProLysAsnLeu455055CGGGTGAGGGCGGGTGGCATTTTCTTTTCCTATACCATCATGGCAGTC486ArgValArgAlaGlyGlyIlePhePheSerTyrThrIleMetAlaVal606570CTTCTGCTCCTTCTCGTGGTTGAGGCCGGGGCCATTTTGGCCCCGGCC534LeuLeuLeuLeuLeuValValGluAlaGlyAlaIleLeuAlaProAla758085ACCCACGCTTGCAGAGCTAATGGGCAATATTTCCTCACAAACTGTTGT582ThrHisAlaCysArgAlaAsnGlyGlnTyrPheLeuThrAsnCysCys9095100GCCTTGGAGGACATCGGGTTCTGCCTGGAAGGCGGATGCTTGGTGGCGCT632AlaLeuGluAspIleGlyPheCysLeuGluGlyGlyCysLeuValAla105110115120(2)SEQIDNO181的信息(i)序列特征(A)长度120个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO181MetProLeuLeuAlaAsnArgSerTyrLeuArgArgValGlyLysAsp151015GlnTrpGlyProGlyValThrGlyLysAspProGluProCysProSer202530ArgTrpAlaGlyLysCysMetGlyProProSerSerAlaAlaAlaCys354045SerArgGlySerProLysAsnLeuArgValArgAlaGlyGlyIlePhe505560PheSerTyrThrIleMetAlaValLeuLeuLeuLeuLeuValValGlu65707580AlaGlyAlaIleLeuAlaProAlaThrHisAlaCysArgAlaAsnGly859095GlnTyrPheLeuThrAsnCysCysAlaLeuGluAspIleGlyPheCys100105110LeuGluGlyGlyCysLeuValAla115120(2)SEQIDNO182的信息(i)序列特征(A)长度9103个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-JC变异体(ix)特性(A)名称/关键词CDS(B)位置276..9005(xi)序列描述SEQIDNO182CAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGACAGGGT60TGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAGAAGGT120TAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCCTACCG180GTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTAACCCGCCTGGGC240AAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCGCTCTTGACCAAT293MetSerLeuLeuThrAsn15AGGCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGTTTATG341ArgLeuSerArgArgValAspLysAspGlnTrpGlyProGlyPheMet101520GGGAAGGACCCCAAACCCTGCCCTTCCCGGCGGACCGGGAAATGCATG389GlyLysAspProLysProCysProSerArgArgThrGlyLysCysMet253035GGGCCACCCAGCTCCGCGGCGGCCTGCAGCCGGGGTAGCCCAAGAATC437GlyProProSerSerAlaAlaAlaCysSerArgGlySerProArgIle404550CTTCGGGTGAGGGCGGGTGGCATTTCTCTTCCTTATACCATCATGGAA485LeuArgValArgA1aGlyGlyIleSerLeuProTyrThrIleMetGlu55606570GCCCTCCTGTTCCTCCTCGGGGTGGAGGCCGGGGCCATTCTGGCCCCG533AlaLeuLeuPheLeuLeuGlyValGluAlaGlyAlaIleLeuAlaPro758085GCCACCCACGCTTGTCGAGCGAATGGGCAATATTTCCTCACAAACTGT581AlaThrHisAlaCysArgAlaAsnGlyGlnTyrPheLeuThrAsnCys9095100TGTGCTCCAGAGGACATTGGGTTCTGCCTCGAAGGCGGTTGCCTTGTG629CysAlaProGluAspIleGlyPheCysLeuGluGlyGlyCysLeuVal105110115GCCCTGGGGTGCACAGTTTGCACTGACCGATGCTGGCCGCTGTATCAG677AlaLeuGlyCysThrValCysThrAspArgCysTrpProLeuTyrGln120125130GCGGGCTTGGCTGTGCGGCCTGGCAAGTCCGCAGCCCAGCTGGTGGGG725AlaGlyLeuAlaValArgProGlyLysSerAlaAlaGlnLeuValGly135140145150CAACTGGGTGGCCTCTACGGGCCCTTGTCGGTGTCGGCCTACGTGGCC773GlnLeuGlyGlyLeuTyrGlyProLeuSerValSerAlaTyrValAla155160165GGCATCCTGGGCCTGGGTGAGGTGTACTCGGGTGTCCTAACAGTTGGT821GlyIleLeuGlyLeuGlyGluValTyrSerGlyValLeuThrValGly170175180GTTGCGTTGACGCGCCGGGTCTACCCGATGCCCAACCTGACGTGTGCA869ValAlaLeuThrArgArgValTyrProMetProAsnLeuThrCysAla185190195GTAGAGTGTGAGCTTAAGTGGGAAAGTGAGTTTTGGAGATGGACTGAG917ValGluCysGluLeuLysTrpGluSerGluPheTrpArgTrpThrGlu200205210CAGCTGGCCTCCAATTACTGGATTCTGGAATACCTTTGGAAGGTCCCG965GlnLeuAlaSerAsnTyrTrpIleLeuGluTyrLeuTrpLysValPro215220225230TTTGACTTCTGGAGAGGCGTGCTAAGCCTGACTCCCTTGCTGGTTTGC1013PheAspPheTrpArgGlyValLeuSerLeuThrProLeuLeuValCys235240245GTGGCCGCGTTGCTGCTGCTGGAGCAACGGATTGTCATGGTCTTCCTG1061ValAlaAlaLeuLeuLeuLeuGluGlnArgIleValMetValPheLeu250255260TTGGTGACGATGGCCGGGATGTCGCAAGGCGCTCCGGCCTCCGTTTTG1109LeuValThrMetAlaGlyMetSerGlnGlyAlaProAlaSerValLeu265270275GGGTCTCGCCCCTTTGACTACGGGTTGACATGGCAGTCTTGTTCCTGC1157GlySerArgProPheAspTyrGlyLeuThrTrpGlnSerCysSerCys280285290AGGGCTAATGGGTCGCGCTATACTACTGGGGAGAAGGTGTGGGACCGT1205ArgAlaAsnGlySerArgTyrThrThrGlyGluLysValTrpAspArg295300305310GGGAACGTCACGCTCCTGTGTGACTGCCCCAACGGCCCCTGGGTGTGG1253GlyAsnValThrLeuLeuCysAspCysProAsnGlyProTrpValTrp315320325TTGCCGGCCTTTTGCCAAGCAATCGGCTGGGGCGATCCCATCACTCAT1301LeuProAlaPheCysGlnAlaIleGlyTrpGlyAspProIleThrHis330335340TGGAGCCACGGCCAAAATCGGTGGCCCCTCTCATGCCCCCAGTATGTC1349TrpSerHisGlyGlnAsnArgTrpProLeuSerCysProGlnTyrVal345350355TATGGGTCTGTTTCAGTCACTTGCGTGTGGGGTTCCGTCTCTTGGTTT1397TyrGlySerValSerValThrCysValTrpGlySerValSerTrpPhe360365370GCCTCGACTGGCGGTCGCGACTCGAAGATCGATGTGTGGAGTCTGGTG1445AlaSerThrGlyGlyArgAspSerLysIleAspValTrpSerLeuVal375380385390CCGGTTGGTTCCGCCAGCTGCACCATAGCCGCTCTTGGATCGTCGGAT1493ProValGlySerAlaSerCysThrIleAlaAlaLeuGlySerSerAsp395400405CGGGACACGGTAGTTGAGCTCTCCGAGTGGGGAGTCCCGTGCGCAACG1541ArgAspThrValValGluLeuSerGluTrpGlyValProCysAlaThr410415420TGCATTCTGGATCGTCGGCCGGCCTCGTGCGGCACCTGTGTGAGAGAC1589CysIleLeuAspArgArgProAlaSerCysGlyThrCysValArgAsp425430435TGCTGGCCCGAAACCGGGTCGGTTAGGTTTCCATTCCATCGGTGCGGC1637CysTrpProGluThrGlySerValArgPheProPheHisArgCysGly440445450GCGGGGCCTAAGCTGACAAAGGACTTGGAAGCTGTGCCCTTCGTCAAT1685AlaGlyProLysLeuThrLysAspLauGluAlaValProPheValAsn455460465470AGGACAACTCCCTTCACCATAAGGGGCCCCCTGGGCAACCAGGGGAGA1733ArgThrThrProPheThrIleArgGlyProLeuGlyAsnGlnGlyArg475480485GGCAACCCGGTGCGGTCGCCCTTGGGTTTTGGGTCCTACGCCATGACC1781GlyAsnProValArgSerProLeuGlyPheGlySerTyrAlaMetThr490495500AAGATCCGAGACTCCTTACATTTGGTGAAATGTCCCACACCAGCCATT1829LysIleArgAspSerLeuHisLeuValLysCysProThrProAlaIle505510515GAGCCTCCCACCGGGACGTTTGGGTTCTTCCCCGGAGTGCCGCCTCTT1877GluProProThrGlyThrPheGlyPhePheProGlyValProProLeu520525530AACAACTGCCTGCTGTTGGGCACGGAAGTGTCCGAAGCGCTGGGCGGG1925AsnAsnCysLeuLeuLeuGlyThrGluValSerGluAlaLeuGlyGly535540545550GCCGGCCTCACGGGGGGGTTCTATGAACCCCTGGTGCGCAGGCGTTCG1973AlaGlyLeuThrGlyGlyPheTyrGluProLeuValArgArgArgSer555560565GAGCTGATGGGGCGCCGAAATCCGGTTTGCCCGGGGTTTGCATGGCTG2021GluLeuMetGlyArgArgAsnProValCysProGlyPheAlaTrpLeu570575580TCCTCGGGTCGACCTGACGGGTTTATACACGTCCAGGGCCACTTGCAG2069SerSerGlyArgProAspGlyPheIleHisValGlnGlyHisLeuGln585590595GAGGTCGATGCTGGCAACTTCATCCCTCCACCTCGCTGGTTGCTCTTG2117GluValAspAlaGlyAsnPheIleProProProArgTrpLeuLeuLeu600605610GACTTTGTGTTTGTCCTGTTATACCTGATGAAGCTGGCTGAGGCACGG2165AspPheValPheValLeuLeuTyrLeuMetLysLeuAlaGluAlaArg615620625630CTGGTCCCGTTGATCTTGCTTCTGCTGTGGTGGTGGGTGAACCAGTTG2213LeuValProLeuIleLeuLeuLeuLeuTrpTrpTrpValAsnGlnLeu635640645GCAGTCCTTGGACTGCCGGCTGTGGACGCCGCCGTGGCTGGTGAGGTC2262AlaValLeuGlyLeuProAlaValAspAlaAlaValAlaGlyGluVal650655660TTCGCGGGCCCGGCCCTGTCGTGGTGTCTGGGCCTCCCCACCGTTAGT2309PheAlaGlyProAlaLeuSerTrpCysLeuGlyLeuProThrValSer665670675ATGATCCTGGGCTTAGCAAACCTGGTGTTGTATTTCCGGTGGATGGGT2357MetIleLeuGlyLeuAlaAsnLeuValLeuTyrPheArgTrpMetGly680685690CCCCAACGCCTCATGTTCCTCGTGTTGTGGAAGCTCGCTCGGGGAGCC2405ProGlnArgLeuMetPheLeuValLeuTrpLysLeuAlaArgGlyAla695700705710TTCCCGCTGGCACTTCTGATGGGGATCTCGGCAACCCGCGGGCGCACC2453PheProLeuAlaLeuLeuMetGlyIleSerAlaThrArgGlyArgThr715720725TCGGTGCTCGGGGCCGAGTTCTGCTTCGATGTCACATTCGAGGTGGAC2501SerValLeuGlyAlaGluPheCysPheAspValThrPheGluValAsp730735740ACGTCGGTTTTGGGCTGGGTGGTGGCCAGTGTGGTAGCCTGGGCCATT2549ThrSerValLeuGlyTrpValValAlaSerValValAlaTrpAlaIle745750755GCGCTCCTGAGCTCGATGAGCGCGGGAGGGTGGAGGCACAAGGCCGTG2597AlaLeuLeuSerSerMetSerAlaGlyGlyTrpArgHisLysAlaVal760765770ATCTATAGGACGTGGTGTAAGGGGTACCAGGCAATACGCCAACGGGTG2645IleTyrArgThrTrpCysLysGlyTyrGlnAlaIleArgGlnArgVal775780785790GTGCGGAGCCCCCTCGGGGAGGGGCGGCCCACCAAACCCTTGACGTTT2693ValArgSerProLeuGlyGluGlyArgProThrLysProLeuThrPhe795800805GCTTGGTGCTTGGCCTCATACATCTGGCCGGATGCTGTGATGATGGTG2741AlaTrpCysLeuAlaSerTyrIleTrpProAspAlaValMetMetVal810815820GTGGTAGCCTTGGTGCTCCTCTTTGGCCTGTTCGACGCGTTGGACTGG2789ValValAlaLeuValLeuLeuPheGlyLeuPheAspAlaLeuAspTrp825830835GCTTTGGAGGAGCTCTTGGTGTCCCGGCCCTCGTTACGGCGTCTGGCC2837AlaLeuGluGluLeuLeuValSerArgProSerLeuArgArgLeuAla840845850CGGGTGGTTGAGTGCTGTGTGATGGCGGGAGAGAAGGCCACAACCGTC2885ArgValValGluCysCysValMetAlaGlyGluLysAlaThrThrVal855860865870CGGCTGGTCTCCAAGATGTGCGCGAGAGGGGCCTATTTGTTTGACCAT2933ArgLeuValSerLysMetCysAlaArgGlyAlaTyrLeuPheAspHis875880885ATGGGCTCTTTTTCGCGCGCTGTCAAGGAGCGCCTGCTGGAGTGGGAC2981MetGlySerPheSerArgAlaValLysGluArgLeuLeuGluTrpAsp890895900GCGGCTTTGGAACCCCTGTCATTCACTAGGACGGACTGTCGCATCATT3029AlaAlaLeuGluProLeuSerPheThrArgThrAspCysArgIleIle905910915AGAGATGCTGCGAGGACCTTGGCCTGCGGGCAGTGCGTCATGGGCTTG3077ArgAspAlaAlaArgThrLeuAlaCysGlyGlnCysValMetGlyLeu920925930CCTGTGGTAGCGCGCCGTGGTGACGAGGTTCTTATCGGTGTCTTTCAG3125ProValValAlaArgArgGlyAspGluValLeuIleGlyValPheGln935940945950GATGTGAACCATTTGCCTCCCGGATTCGTCCCGACCGCACCCGTTGTC3173AspValAsnHisLeuProProGlyPheValProThrAlaProValVal955960965ATCCGGCGGTGCGGGAAGGGGTTTCTGGGGGTCACTAAGGCTGCCTTG3221IleArgArgCysGlyLysGlyPheLeuGlyValThrLysAlaAlaLeu970975980ACTGGTCGGGATCCTGACTTACATCCAGGGAACGTCATGGTGTTGGGG3269ThrGlyArgAspProAspLeuHisProGlyAsnValMetValLeuGly985990995ACGGCTACGTCGCGAAGCATGGGGACATGCCTGAACGGCCTGCTGTTC3317ThrAlaThrSerArgSerMetGlyThrCysLeuAsnGlyLeuLeuPhe100010051010ACGACTTTCCATGGGGCTTCATCCCGAACCATCGCCACGCCCGTGGGG3365ThrThrPheHisGlyAlaSerSerArgThrIleAlaThrProValGly1015102010251030GCCCTTAATCCCAGGTGGTGGTCCGCCAGTGATGACGTCACGGTGTAC3413AlaLeuAsnProArgTrpTrpSerAlaSerAspAspValThrValTyr103510401045CCGCTCCCGGATGGGGCAACCTCGTTGACGCCCTGCACTTGCCAGGCT3461ProLeuProAspGlyAlaThrSerLeuThrProCysThrCysGlnAla105010551060GAGTCCTGTTGGGTCATACGGTCCGACGGGGCTTTGTGCCATGGCTTG3509GluSerCysTrpValIleArgSerAspGlyAlaLeuCysHisGlyLeu106510701075AGTAAGGGAGACAAGGTGGAGCTAGATGTGGCCATGGAGGTCTCAGAT3557SerLysGlyAspLysValGluLeuAspValAlaMetGluValSerAsp108010851090TTCCGTGGCTCGTCCGGCTCACCTGTCCTGTGCGACGAGGGGCACGCA3605PheArgGlySerSerGlySerProValLeuCysAspGluGlyHisAla1095110011051110GTAGGAATGCTCGTGTCGGTGCTCCACTCGGGTGGTCGGGTCACCGCG3653ValGlyMetLeuValSerValLeuHisSerGlyGlyArgValThrAla111511201125GCTCGATTCACCAGGCCGTGGACCCAGGTCCCAACAGATGCTAAGACC3701AlaArgPheThrArgProTrpThrGlnValProThrAspAlaLysThr113011351140ACCACTGAACCCCCTCCGGTGCCGGCAAAGGGAGTTTTCAAGGAAGCC3749ThrThrGluProProProValProAlaLysGlyValPheLysGluAla114511501155CCACTGTTTATGCCCACGGGCGCAGGAAAGAGCACGCGCGTCCCGTTG3797ProLeuPheMetProThrGlyAlaGlyLysSerThrArgValProLeu116011651170GAGTATGGCAACATGGGGCACAAGGTCCTGATTTTGAACCCCTCGGTG3845GluTyrGlyAsnMetGlyHisLysValLeuIleLeuAsnProSerVal1175118011851190GCGACAGTGAGGGCCATGGGCCCTTACATGGAGCGACTGGCGGGAAAA3893AlaThrValArgAlaMetGlyProTyrMetGluArgLeuAlaGlyLys119512001205CATCCAAGTATCTACTGTGGCCATGACACCACTGCCTTCACAAGGATC394lHisProSerIleTyrCysGlyHisAspThrThrAlaPheThrArgIle121012151220ACTGATTCCCCCTTAACGTACTCTACCTATGGGAGGTTTCTGGCCAAC3989ThrAspSerProLeuThrTyrSerThrTyrGlyArgPheLeuAlaAsn122512301235CCTAGGCAGATGCTGCGAGGTGTGTCGGTGGTCATTTGCGATGAATGC4037ProArgGlnMetLeuArgGlyValSerValValIleCysAspGluCys124012451250CACAGTCATGATTCCACTGTGTTGTTGGGGATTGGACGGGTCCGGGAG4085HisSerHisAspSerThrValLeuLeuGlyIleGlyArgValArgGlu1255126012651270CTGGCACGAGAGTGTGGGGTGCAGCTTGTGCTCTACGCCACTGCCACG4133LeuAlaArgGluCysGlyValGlnLeuValLeuTyrAlaThrAlaThr127512801285CCTCCTGGGTCCCCCATGACTCAGCATCCGTCAATCATTGAGACCAAA4181ProProGlySerProMetThrGlnHisProSerIleIleGluThrLys129012951300TTGGATGTGGGTGAGATTCCCTTCTATGGGCATGGCATACCCCTCGAG4229LeuAspValGlyGluIleProPheTyrGlyHisGlyIleProLeuGlu130513101315CGGATGCGGACCGGTAGGCACCTCGTATTCTGCTACTCTAAGGCAGAG4277ArgMetArgThrGlyArgHisLeuValPheCysTyrSerLysAlaGlu132013251330TGTGAGCGGCTAGCCGGTCAGTTTTCTGCTAGGGGAGTTAACGCCATA4325CysGluArgLeuAlaGlyGlnPheSerAlaArgGlyValAsnAlaIle1335134013451350GCCTATTACAGGGGAAAAGACAGTTCTATCATCAAGGACGGAGATCTG4373AlaTyrTyrArgGlyLysAspSerSerIleIleLysAspGlyAspLeu135513601365GTGGTGTGCGCGACCGACGCGCTATCCACTGGATACACTGGGAACTTC4421ValValCysAlaThrAspAlaLeuSerThrGlyTyrThrGlyAsnPhe137013751380GATTCTGTCACCGACTGTGGGTTAGTGGTGGAGGAGGTCGTCGAGGTG4469AspSerValThrAspCysGlyLeuValValGluGluValValGluVal138513901395ACCCTTGATCCCACCATTACCATCTCCCTGCGGACAGTGCCCGCGTCG4517ThrLeuAspProThrIleThrIleSerLeuArgThrValProAlaSer140014051410GCAGAACTGTCGATGCAGAGACGAGGACGCACGGGTAGAGGCAGGTCT4565AlaGluLeuSerMetGlnArgArgGlyArgThrGlyArgGlyArgSer1415142014251430GGGCGCTACTACTACGCCGGGGTCGGAAAGGCCCCCGCGGGTGTGGTG4613GlyArgTyrTyrTyrAlaGlyValGlyLysAlaProAlaGlyValVal143514401445CGCTCGGGTCCTGTCTGGTCGGCGGTGGAGGCCGGAGTGACCTGGTAT4661ArgSerGlyProValTrpSerAlaValGluAlaGlyValThrTrpTyr145014551460GGAATGGAACCTGACTTGACAGCTAACCTATTGAGACTTTACGACGAC4709GlyMetGluProAspLeuThrAlaAsnLeuLeuArgLeuTyrAspAsp146514701475TGCCCTTACACCGCAGCCGTCGCAGCTGACATCGGTGAAGCCGCGGTG4757CysProTyrThrAlaAlaValAlaAlaAspIleGlyGluAlaAlaVal148014851490TTTTTCTCCGGGCTAGCCCCGTTGAGGATGCATCCCGATGTTAGCTGG4805PhePheSerGlyLeuAlaProLeuArgMetHisProAspValSerTrp1495150015051510GCAAAAGTGCGCGGCGTCAACTGGCCCCTCTTGGTGGGTGTTCAGCGG4853AlaLysValArgGlyValAsnTrpProLeuLeuValGlyValGlnArg151515201525ACCATGTGCCGGGAAACACTGTCTCCCGGACCATCGGACGACCCCCAA4901ThrMetCysArgGluThrLeuSerProGlyProSerAspAspProGln153015351540TGGGCAGGTCTGAAGGGCCCGAATCCTGTTCCACTACTGCTGAGGTGG4949TrpAlaGlyLeuLysGlyProAsnProValProLeuLeuLeuArgTrp154515501555GGCAATGATTTACCATCAAAAGTGGCCGGCCACCACATTGTTGACGAC4997GlyAsnAspLeuProSerLysValAlaGlyHisHisIleValAspAsp156015651570CTGGTTCGTAGGCTTGGTGTGGCGGAGGGTTATGTCCGCTGCGATGCG5045LeuValArgArgLeuGlyValAlaGluGlyTyrValArgCysAspAla1575158015851590GGGCCGATCTTAATGGTCGGCCTCGCTATCGCGGGGGGGATGATCTAC5093GlyProIleLeuMetValGlyLeuAlaIleAlaGlyGlyMetIleTyr159516001605GCATCTTACACCGGGTCTTTAGTGGTGGTGACAGACTGGGATGTAAAG5141AlaSerTyrThrGlySerLeuValValValThrAspTrpAspValLys161016151620GGGGGTGGCAGCCCTCTTTATCGGCATGGAGACCAGGCCACGCCACAG5189GlyGlyGlySerProLeuTyrArgHisGlyAspGlnAlaThrProGln162516301635CCGGTTGTGCAGGTCCCCCCGGTAGACCATCGGCCGGGGGGGGAGTCT5237ProValValGlnValProProValAspHisArgProGlyGlyGluSer164016451650GCGCCTTCGGATGCCAAGACAGTGACAGATGCGGTGGCGGCCATCCAG5285AlaProSerAspAlaLysThrValThrAspAlaValAlaAlaIleGln1655166016651670GTGGATTGCGATTGGTCAGTCATGACCCTGTCGATCGGGGAAGTGCTG5333ValAspCysAspTrpSerValMetThrLeuSerIleGlyGluValLeu167516801685TCCTTGGCTCAGGCTAAAACAGCTGAGGCCTACACGGCAACCGCCAAG5381SerLeuAlaGlnAlaLysThrAlaGluAlaTyrThrAlaThrAlaLys169016951700TGGCTCGCTGGCTGCTACACGGGGACGCGGGCCGTTCCCACTGTTTCA5429TrpLeuAlaGlyCysTyrThrGlyThrArgAlaValProThrValSer170517101715ATTGTTGACAAGCTCTTTGCCGGAGGGTGGGCGGCTGTGGTTGGCCAC5477IleValAspLysLeuPheAlaGlyGlyTrpAlaAlaValValGlyHis172017251730TGTCACAGCGTCATAGCTGCGGCGGTGGCTGCCTACGGGGCTTCCAGG5525CysHisSerValIleAlaAlaAlaValAlaAlaTyrGlyAlaSerArg1735174017451750AGTCCGCCGTTGGCAGCCGCGGCTTCCTACCTGATGGGACTGGGCGTC5573SerProProLeuAlaAlaAlaAlaSerTyrLeuMetGlyLeuGlyVal175517601765GGAGGCAACGCTCAGACGCGTTTGGCGTCTGCCCTCCTGTTGGGGGCC5621GlyGlyAsnAlaGlnThrArgLeuAlaSerAlaLeuLeuLeuGlyAla177017751780GCTGGCACCGCCCTGGGCACTCCCGTCGTGGGTTTAACCATGGCGGGG5669AlaGlyThrAlaLeuGlyThrProValValGlyLeuThrMetAlaGly178517901795GCGTTCATGGGGGGTGCTAGCGTCTCTCCCTCCTTGGTCACCATCTTG5717AlaPheMetGlyGlyAlaSerValSerProSerLeuValThrIleLeu180018051810TTGGGGGCCGTGGGAGGCTGGGAGGGCGTCGTCAACGCTGCTAGCCTT5765LeuGlyAlaValGlyGlyTrpGluGlyValValAsnAlaAlaSerLeu1815182018251830GTCTTTGACTTCATGGCGGGGAAACTATCGTCAGAAGATCTGTGGTAC5813ValPheAspPheMetAlaGlyLysLeuSerSerGluAspLeuTrpTyr183518401845GCCATCCCAGTGCTCACCAGCCCGGGGGCGGGCCTTGCGGGGATCGCC5861AlaIleProValLeuThrSerProGlyAlaGlyLeuAlaGlyIleAla185018551860CTTGGGTTGGTGCTGTACTCAGCTAACAACTCTGGTACTACCACTTGG5909LeuGlyLeuValLeuTyrSerAlaAsnAsnSerGlyThrThrThrTrp186518701875TTGAACCGTCTGCTGACTACGTTACCTAGGTCTTCTTGCATCCCTGAC5957LeuAsnArgLeuLeuThrThrLeuProArgSerSerCysIleProAsp188018851890AGCTATTTCCAACAGGCCGATTACTGTGACAAGGTCTCGGCCGTGCTT6005SerTyrPheGlnGlnAlaAspTyrCysAspLysValSerAlaValLeu1895190019051910CGCCGACTGAGCCTCACCCGCACTGTGGTGGCCCTAGTCAATAGGGAA6053ArgArgLeuSerLeuThrArgThrValValAlaLeuValAsnArgGlu191519201925CCCAAGGTGGACGAGGTACAGGTGGGGTACGTCTGGGATCTCTGGGAG6101ProLysValAspGluValGlnValGlyTyrValTrpAspLeuTrpGlu193019351940TGGATCATGCGTCAAGTGCGCATGGTCATGGCCAGGCTCCGGGCTCTC6149TrpIleMetArgGlnValArgMetValMetAlaArgLeuArgAlaLeu194519501955TGCCCCGTGGTGTCACTGCCTTTGTGGCACTGCGGGGAGGGGTGGTCC6197CysProValValSerLeuProLeuTrpHisCysGlyGluGlyTrpSer196019651970GGAGAGTGGTTGTTGGACGGCCATGTGGAGAGTCGCTGTCTTTGCGGG6245GlyGluTrpLeuLeuAspGlyHisValGluSerArgCysLeuCysGly1975198019851990TGCGTGATCACCGGCGATGTTTTCAATGGGCAACTCAAAGAGCCAGTT6293CysValIleThrGlyAspValPheAsnGlyGlnLeuLysGluProVal199520002005TACTCTACAAAGTTGTGCCGGCACTATTGGATGGGGACCGTTCCTGTG6341TyrSerThrLysLeuCysArgHisTyrTrpMetGlyThrValProVal201020152020AACATGCTGGGTTACGGCGAAACATCACCCCTCTTGGCCTCTGACACC6389AsnMetLeuGlyTyrGlyGluThrSerProLeuLeuAlaSerAspThr202520302035CCGAAGGTGGTGCCTTTTGGGACGTCGGGCTGGGCTGAGGTGGTGGTG6437ProLysValValProPheGlyThrSerGlyTrpAlaGluValValVal204020452050ACCCCTACCCACGTGGTGATCAGGAGAACCTCTCCCTACGAGTTGCTG6485ThrProThrHisValValIleArgArgThrSerProTyrGluLeuLeu2055206020652070CGCCAACAAATCCTATCAGCTGCAGTTGCTGAGCCCTATTATGTCGAC6533ArgGlnGlnIleLeuSerAlaAlaValAlaGluProTyrTyrValAsp207520802085GGCATACCGGTCTCATGGGACGCGGACGCTCGTGCGCCTGCTATGGTT6581GlyIleProValSerTrpAspAlaAspAlaArgAlaProAlaMetVal209020952100TATGGCCCTGGGCAAAGTGTTACCATTGACGGGGAGCGCTACACCCTG6629TyrGlyProGlyGlnSerValThrIleAspGlyGluArgTyrThrLeu210521102115CCGCATCAACTGCGGCTCAGGAATGTAGCGCCCTCTGAGGTTTCATCC6677ProHisGlnLeuArgLeuArgAsnValAlaProSerGluValSerSer212021252130GAGGTGTCCATAGACATTGGGACGGAGACTGAAGACTCAGAACTGACT6725GluValSerIleAspIleGlyThrGluThrGluAspSerGluLeuThr2135214021452150GAGGCCGACCTGCCGCCGGCAGCTGCAGCCCTCCAGGCTATCGAGAAT6773GluAlaAspLeuProProAlaAlaAlaAlaLeuGlnAlaIleGluAsn215521602165GCTGCGAGGATTCTTGAGCCTCATATTGATGTCATCATGGAGGATTGC6821AlaAlaArgIleLeuGluProHisIleAspValIleMetGluAspCys217021752180AGTACACCCTCTCTTTGTGGTAGTAGCCGAGAGATGCCTGTGTGGGGA6869SerThrProSerLeuCysGlySerSerArgGluMetProValTrpGly218521902195GAAGACATCCCCCGCACTCCATCGCCAGCACTTATCTCGGTTACCGAG6917GluAspIleProArgThrProSerProAlaLeuIleSerValThrGlu220022052210AGCAGCTCAGATGAGAAGACCCCGTCGGTGTCCTCCTCGCAGGAGGAT6965SerSerSerAspGluLysThrProSerValSerSerSerGlnGluAsp2215222022252230ACCCCGTCCTCTGACTCATTCGAAGTCATCCAAGAGTCTGAGACAGCT7013ThrProSerSerAspSerPheGluValIleGlnGluSerGluThrAla223522402245GAAGGAGAGGAAAGTGTCTTCAACGTGGCTCTTTCCGTACTAGAAGCC706lGluGlyGluGluSerValPheAsnValAlaLeuSerValLeuGluAla225022552260TTGTTTCCACAGAGTGATGCCACTAGAAAGCTTACCGTCAGGATGAAT7109LeuPheProGlnSerAspAlaThrArgLysLeuThrValArgMetAsn226522702275TGCTGCGTTGAGAAGAGCGTCACGCGCTTCTTTTCTTTGGGGCTGACG7157CysCysValGluLysSerValThrArgPhePheSerLeuGlyLeuThr228022852290GTGGCTGATGTGGCCAGTCTGTGTGAGATGGAGATCCAGAACCATACA7205ValAlaAspValAlaSerLeuCysGluMetGluIleGlnAsnHisThr2295230023052310GCCTATTGTGACAAGGTGCGCACTCCGCTCGAATTGCAAGTTGGGTGC7253AlaTyrCysAspLysValArgThrProLeuGluLeuGlnValGlyCys231523202325TTGGTGGGCAATGAACTTACCTTTGAATGTGATAAGTGTGAGGCTAGG7301LeuValGlyAsnGluLeuThrPheGluCysAspLysCysGluAlaArg233023352340CAAGAGACTTTGGCCTCCTTCTCCTATATTTGGTCTGGGGTGCCATTG7349GlnGluThrLeuAlaSerPheSerTyrIleTrpSerGlyValProLeu234523502355ACTAGGGCCACACCGGCTAAACCACCTGTGGTGAGGCCGGTGGGGTCC7397ThrArgAlaThrProAlaLysProProValValArgProValGlySer236023652370TTGTTGGTGGCTGACACCACGAAAGTGTATGTCACAAACCCGGACAAT7445LeuLeuValAlaAspThrThrLysValTyrValThrAsnProAspAsn2375238023852390GTTGGGAGAAGAGTGGACAAGGTGACCTTCTGGCGCGCCCCCAGGGTC7493ValGlyArgArgValAspLysValThrPheTrpArgAlaProArgVal239524002405CATGACAAATATCTCGTGGACTCCATCGAGCGTGCCAGGAGGGCGGCT7541HisAspLysTyrLeuValAspSerIleGluArgAlaArgArgAlaAla241024152420CAAGCCTGCCAAAGCATGGGTTACACTTATGAGGAAGCAATAAGGACT7589GlnAlaCysGlnSerMetGlyTyrThrTyrGluGluAlaIleArgThr242524302435GTTAGGCCACATGCTGCCATGGGCTGGGGATCTAAGGTGTCGGTCAAG7637ValArgProHisAlaAlaMetGlyTrpGlySerLysValSerValLys244024452450GACTTGGCCACCCCTGCGGGGAAGATGGCCGTCCACGACCGACTTCAG7685AspLeuAlaThrProAlaGlyLysMetAlaValHisAspArgLeuGln2455246024652470GAGATACTTGAGGGGACTCCGGTCCCTTTTACTCTTACTGTGAAAAAG7733GluIleLeuGluGlyThrProValProPheThrLeuThrValLysLys247524802485GAGGTGTTCTTCAAAGACCGTAAGGAGGAGAAGGCCCCCCGCCTCATT7781GluValPhePheLysAspArgLysGluGluLysAlaProArgLeuIle249024952500GTGTTCCCCCCCCTGGACTTCCGGATAGCTGAGAAGCTTATCCTGGGA7829ValPheProProLeuAspPheArgIleAlaGluLysLeuIleLeuGly250525102515GACCCGGGGCGGGTGGCCAAGGCGGTGTTGGGGGGGGCTTACGCCTTC7877AspProGlyArgValAlaLysAlaValLeuGlyGlyAlaTyrAlaPhe252025252530CAGTACACCCCAAATCAGCGAGTTAAGGAGATGCTCAAACTGTGGGAG7925GlnTyrThrProAsnGlnArgValLysGluMetLeuLysLeuTrpGlu2535254025452550TCAAAGAAAACACCTTGCGCCATCTGTGTGGACGCCACTTGCTTCGAC7973SerLysLysThrProCysAlaIleCysValAspAlaThrCysPheAsp255525602565AGTAGCATTACTGAAGAGGACGTGGCGCTGGAGACAGAGCTGTACGCT8021SerSerIleThrGluGluAspValAlaLeuGluThrGluLeuTyrAla257025752580CTGGCCTCTGACCATCCAGAGTGGGTGCGAGCTTTGGGGAAGTACTAT8069LeuAlaSerAspHisProGluTrpValArgAlaLeuGlyLysTyrTyr258525902595GCCTCAGGAACCATGGTCACCCCTGAGGGGGTTCCCGTAGGTGAGAGG8117AlaSerGlyThrMetValThrProGluGlyValProValGlyGluArg260026052610TATTGTAGATCCTCAGGCGTTTTGACTACCAGCGCGAGTAACTGCCTG8165TyrCysArgSerSerGlyValLeuThrThrSerAlaSerAsnCysLeu2615262026252630ACCTGCTACATCAAGGTGAAAGCCGCTTGTGAGAGAGTGGGGCTGAAA8213ThrCysTyrIleLysValLysAlaAlaCysGluArgValGlyLeuLys263526402645AATGTCTCGCTTCTCATAGCCGGCGATGACTGTTTGATCATATGCGAA8261AsnValSerLeuLeuIleAlaGlyAspAspCysLeuIleIleCysGlu265026552660CGGCCAGTGTGCGACCCTTGTGACGCCTTGGGCAGAGCCCTGGCGAGC8309ArgProValCysAspProCysAspAlaLeuGlyArgAlaLeuAlaSer266526702675TATGGGTATGCTTGCGAGCCTTCGTATCATGCATCACTGGACACGGCC8357TyrGlyTyrAlaCysGluProSerTyrHisAlaSerLeuAspThrAla268026852690CCCTTCTGCTCCACTTGGCTCGCTGAGTGCAACGCAGATGGGAAACGC8405ProPheCysSerThrTrpLeuAlaGluCysAsnAlaAspGlyLysArg2695270027052710CATTTCTTCCTGACCACGGACTTTCGGAGGCCGCTTGCTCGCATGTCG8453HisPhePheLeuThrThrAspPheArgArgProLeuAlaArgMetSer271527202725AGCGAGTATAGTGACCCAATGGCTTCGGCCATAGGTTACATCCTCCTG8501SerGluTyrSerAspProMetAlaSerAlaIleGlyTyrIleLeuLeu273027352740TATCCCTGGCATCCCATCACACGGTGGGTCATCATCCCTCATGTGCTA8549TyrProTrpHisProIleThrArgTrpValIleIleProHisValLeu274527502755ACGTGCGCATTCAGGGGTGGTGGTACACCGTCTGATCCGGTTTGGTGT8597ThrCysAlaPheArgGlyGlyGlyThrProSerAspProValTrpCys276027652770CAGGTGCATGGTAACTACTACAAGTTTCCACTGGACAAACTGCCTAAC8545GlnValHisGlyAsnTyrTyrLysPheProLeuAspLysLeuProAsn2775278027852790ATCATCGTGGCCCTCCACGGACCAGCAGCGTTGAGGGTTACCGCAGAC8693IleIleValAlaLeuHisGlyProAlaAlaLeuArgValThrAlaAsp279528002805ACAACTAAGACAAAAATGGAAGCTGGGAAGGTGCTGAGTGACCTCAAG8741ThrThrLysThrLysMetGluAlaGlyLysValLeuSerAspLeuLys281028152820CTCCCTGGCCTAGCGGTCCACCGAAAGAAGGCCGGAGCACTGCGAACA8789LeuProGlyLeuAlaValHisArgLysLysAlaGlyAlaLeuArgThr282528302835CGCATGCTTCGGTCGCGCGGTTGGGCCGAGTTGGCGAGGGGCCTGTTG8837ArgMetLeuArgSerArgGlyTrpAlaGluLeuAlaArgGlyLeuLeu284028452850TGGCATCCAGGCCTCCGGCTCCCTCCCCCTGAGATTGCTGGTATCCCG8885TrpHisProGlyLeuArgLeuProProProGluIleAlaGlyIlePro2855286028652870GGGGGTTTCCCCCTCTCCCCCCCCTACATGGGGGTGGTGCATCAATTG8933GlyGlyPheProLeuSerProProTyrMetGlyValValHisGlnLeu287528802885GATTTTACAAGCCAGAGGAGTCGCTGGCGGTGGCTGGGGTTCTTAGCC8981AspPheThrSerGlnArgSerArgTrpArgTrpLeuGlyPheLeuAla289028952900CTGCTCATCGTAGCCCTCTTCGGGTGAACTAAATTCATCTGTTGCGGCAAGGTC9035LeuLeuIleValAlaLeuPheGly29052910CAGTGACTGATCATCACTGGAGGAGGTTCCCGCCCTCCCCGCCCCAGGGGTCTCCCCGCT9095GGGTAAAA9103(2)SEQIDNO183的信息(i)序列特征(A)长度2910个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)序列描述SEQIDNO183MetSerLeuLeuThrAsnArgLeuSerArgArgValAspLysAspGln151015TrpGlyProGlyPheMetGlyLysAspProLysProCysProSerArg202530ArgThrGlyLysCysMetGlyProProSerSerAlaAlaAlaCysSer354045ArgGlySerProArgIleLeuArgValArgAlaGlyGlyIleSerLeu505560ProTyrThrIleMetGluAlaLeuLeuPheLeuLeuGlyValGluAla65707580GlyAlaIleLeuAlaProAlaThrHisAlaCysArgAlaAsnGlyGln859095TyrPheLeuThrAsnCysCysAlaProGluAspIleGlyPheCysLeu100105110GluGlyGlyCysLeuValAlaLeuGlyCysThrValCysThrAspArg115120125CysTrpProLeuTyrGlnAlaGlyLeuAlaValArgProGlyLysSer130135140AlaAlaGlnLeuValGlyGlnLeuGlyGlyLeuTyrGlyProLeuSer145150155160ValSerAlaTyrValAlaGlyIleLeuGlyLeuGlyGluValTyrSer165170175GlyValLeuThrValGlyValAlaLeuThrArgArgValTyrProMet180185190ProAsnLeuThrCysAlaValGluCysGluLeuLysTrpGluSerGlu195200205PheTrpArgTrpThrGluGlnLeuAlaSerAsnTyrTrpIleLeuGlu210215220TyrLeuTrpLysValProPheAspPheTrpArgGlyValLeuSerLeu225230235240ThrProLeuLeuValCysValAlaAlaLeuLeuLeuLeuGluGlnArg245250255IleValMetValPheLeuLeuValThrMetAlaGlyMetSerGlnGly260265270AlaProAlaSerValLeuGlySerArgProPheAspTyrGlyLeuThr275280285TrpGlnSerCysSerCysArgAlaAsnGlySerArgTyrThrThrGly290295300GluLysValTrpAspArgGlyAsnValThrLeuLeuCysAspCysPro305310315320AsnGlyProTrpValTrpLeuProAlaPheCysGlnAlaIleGlyTrp325330335GlyAspProIleThrHisTrpSerHisGlyGlnAsnArgTrpProLeu340345350SerCysProGlnTyrValTyrGlySerValSerValThrCysValTrp355360365GlySerValSerTrpPheAlaSerThrGlyGlyArgAspSerLysIle370375380AspValTrpSerLeuValProValGlySerAlaSerCysThrIleAla385390395400AlaLeuGlySerSerAspArgAspThrValValGluLeuSerGluTrp405410415GlyValProCysAlaThrCysIleLeuAspArgArgProAlaSerCys420425430GlyThrCysValArgAspCysTrpProGluThrGlySerValArgPhe435440445ProPheHisArgCysGlyAlaGlyProLysLeuThrLysAspLeuGlu450455460AlaValProPheValAsnArgThrThrProPheThrIleArgGlyPro465470475480LeuGlyAsnGlnGlyArgGlyAsnProValArgSerProLeuGlyPhe485490495GlySerTyrAlaMetThrLysIleArgAspSerLeuHisLeuValLys500505510CysProThrProAlaIleGluProProThrGlyThrPheGlyPhePhe515520525ProGlyValProProLeuAsnAsnCysLeuLeuLeuGlyThrGluVal530535540SerGluAlaLeuGlyGlyAlaGlyLeuThrGlyGlyPheTyrGluPro545550555560LeuValArgArgArgSerGluLeuMetGlyArgArgAsnProValCys565570575ProGlyPheAlaTrpLeuSerSerGlyArgProAspGlyPheIleHis580585590ValGlnGlyHisLeuGlnGluValAspAlaGlyAsnPheIleProPro595600605ProArgTrpLeuLeuLeuAspPheValPheValLeuLsuTyrLeuMet610615620LysLeuAlaGluAlaArgLeuValProLeuIleLeuLeuLeuLeuTrp625630635640TrpTrpValAsnGlnLeuAlaValLeuGlyLeuProAlaValAspAla645650655AlaValAlaGlyGluValPheAlaGlyProAlaLeuSerTrpCysLeu660665670GlyLeuProThrValSerMetIleLeuGlyLeuAlaAsnLeuValLeu675680685TyrPheArgTrpMetGlyProGlnArgLeuMetPheLeuValLeuTrp690695700LysLeuAlaArgGlyAlaPheProLeuAlaLeuLeuMetGlyIleSer705710715720AlaThrArgGlyArgThrSerValLeuGlyAlaGluPheCysPheAsp725730735ValThrPheGluValAspThrSerValLeuGlyTrpValValAlaSer740745750ValValAlaTrpAlaIleAlaLeuLeuSerSerMetSerAlaGlyGly755760765TrpArgHisLysAlaValIleTyrArgThrTrpCysLysGlyTyrGln770775780AlaIleArgGlnArgValValArgSerProLeuGlyGluGlyArgPro785790795800ThrLysProLeuThrPheAlaTrpCysLeuAlaSerTyrIleTrpPro805810815AspAlaValMetMetValValValAlaLeuValLeuLeuPheGlyLeu820825830PheAspAlaLeuAspTrpAlaLeuGluGluLeuLeuValSerArgPro835840845SerLeuArgArgLeuAlaArgValValGluCysCysValMetAlaGly850855860GluLysAlaThrThrValArgLeuValSerLysMetCysAlaArgGly865870875880AlaTyrLeuPheAspHisMetGlySerPheSerArgAlaValLysGlu885890895ArgLeuLeuGluTrpAspAlaAlaLeuGluProLeuSerPheThrArg900905910ThrAspCysArgIleIleArgAspAlaAlaArgThrLeuAlaCysGly915920925GlnCysValMetGlyLeuProValValAlaArgArgGlyAspGluVal930935940LeuIleGlyValPheGlnAspValAsnHisLeuProProGlyPheVal945950955960ProThrAlaProValValIleArgArgCysGlyLysGlyPheLeuGly965970975ValThrLysAlaAlaLeuThrGlyArgAspProAspLeuHisProGly980985990AsnValMetValLeuGlyThrAlaThrSerArgSerMetGlyThrCys99510001005LeuAsnGlyLeuLeuPheThrThrPheHisGlyAlaSerSerArgThr101010151020IleAlaThrProValGlyAlaLeuAsnProArgTrpTrpSerAlaSer1025103010351040AspAspValThrValTyrProLeuProAspGlyAlaThrSerLeuThr104510501055proCysThrCysGlnAlaGluSerCysTrpValIleArgSerAspGly106010651070AlaLeuCysHisGlyLeuSerLysGlyAspLysValGluLeuAspVal107510801085AlaMetGluValSerAspPheArgGlySerSerGlySerProValLeu109010951100CysAspGluGlyHisAlaValGlyMetLeuValSerValLeuHisSer1105111011151120GlyGlyArgValThrAlaAlaArgPheThrArgProTrpThrGlnVal112511301135ProThrAspAlaLysThrThrThrGluProProProValProAlaLys114011451150GlyValPheLysGluAlaProLeuPheMetProThrGlyAlaGlyLys115511601165SerThrArgValProLeuGluTyrGlyAsnMetGlyHisLysValLeu117011751180IleLeuAsnProSerValAlaThrValArgAlaMetGlyProTyrMet1185119011951200GluArgLeuAlaGlyLysHisProSerIleTyrCysGlyHisAspThr120512101215ThrAlaPheThrArgIleThrAspSerproLeuThrTyrSerThrTyr122012251230GlyArgPheLeuAlaAsnProArgGlnMetLeuArgGlyValSerVal123512401245ValIleCysAspGluCysHisSerHisAspSerThrValLeuLeuGly125012551260IleGlyArgValArgGluLeuAlaArgGluCysGlyValGlnLeuVal1265127012751280LeuTyrAlaThrAlaThrProProGlySerProMetThrGlnHisPro128512901295SerIleIleGluThrLysLeuAspValGlyGluIleProPheTyrGly130013051310HisGlyIleProLeuGluArgMetArgThrGlyArgHisLeuValPhe131513201325CysTyrSerLysAlaGluCysGluArgLeuAlaGlyGlnPheSerAla133013351340ArgGlyValAsnAlaIleAlaTyrTyrArgGlyLysAspSerSerIle1345135013551360IleLysAspGlyAspLeuValValCysAlaThrAspAlaLeuSerThr136513701375GlyTyrThrGlyAsnPheAspSerValThrAspCysGlyLeuValVal138013851390GluGluValValGluValThrLeuAspProThrIleThrIleSerLeu139514001405ArgThrValProAlaSerAlaGluLeuSerMetGlnArgArgGlyArg141014151420ThrGlyArgGlyArgSerGlyArgTyrTyrTyrAlaGlyValGlyLys1425143014351440AlaProAlaGlyValValArgSerGlyProValTrpSerAlaValGlu144514501455AlaGlyValThrTrpTyrGlyMetGluProAspLeuThrAlaAsnLeu146014651470LeuArgLeuTyrAspAspCysProTyrThrAlaAlaValAlaAlaAsp147514801485IleGlyGluAlaAlaValPhePheSerGlyLeuAlaProLeuArgMet149014951500HisProAspValSerTrpAlaLysValArgGlyValAsnTrpProLeu1505151015151520LeuValGlyValGlnArgThrMetCysArgGluThrLeuSerProGly152515301535ProSerAspAspProGlnTrpAlaGlyLeuLysGlyProAsnProVal154015451550ProLeuLeuLeuArgTrpGlyAsnAspLeuProSerLysValAlaGly155515601565HisHisIleValAspAspLeuValArgArgLeuGlyValAlaGluGly157015751580TyrValArgCysAspAlaGlyProIleLeuMetValGlyLeuAlaIle1585159015951600AlaGlyGlyMetIleTyrAlaSerTyrThrGlySerLeuValValVal160516101615ThrAspTrpAspValLysGlyGlyGlySerProLeuTyrArgHisGly162016251630AspGlnAlaThrProGlnProValValGlnValProProValAspHis163516401645ArgProGlyGlyGluSerAlaProSerAspAlaLysThrValThrAsp165016551660AlaValAlaAlaIleGlnValAspCysAspTrpSerValMetThrLeu1665167016751680SerIleGlyGluValLeuSerLeuAlaGlnAlaLysThrAlaGluAla168516901695TyrThrAlaThrAlaLysTrpLeuAlaGlyCysTyrThrGlyThrArg170017051710AlaValProThrValSerIleValAspLysLeuPheAlaGlyGlyTrp171517201725AlaAlaValValGlyHisCysHisSerValIleAlaAlaAlaValAla173017351740AlaTyrGlyAlaSerArgSerProProLeuAlaAlaAlaAlaSerTyr1745175017551760LeuMetGlyLeuGlyValGlyGlyAsnAlaGlnThrArgLeuAlaSer176517701775AlaLeuLeuLeuGlyAlaAlaGlyThrAlaLeuGlyThrProValVal178017851790GlyLeuThrMetAlaGlyAlaPheMetGlyGlyAlaSerValSerPro179518001805SerLeuValThrIleLeuLeuGlyAlaValGlyGlyTrpGluGlyVal181018151820ValAsnAlaAlaSerLeuValPheAspPheMetAlaGlyLysLeuSer1825183018351840SerGluAspLeuTrpTyrAlaIleProValLeuThrSerProGlyAla184518501855GlyLeuAlaGlyIleAlaLeuGlyLeuValLeuTyrSerAlaAsnAsn186018651870SerGlyThrThrThrTrpLeuAsnArgLeuLeuThrThrLeuProArg187518801885SerSerCysIleProAspSerTyrPheGlnGlnAlaAspTyrCysAsp189018951900LysValSerAlaValLeuArgArgLeuSerLeuThrArgThrValVal1905191019151920AlaLeuValAsnArgGluProLysValAspGluValGlnValGlyTyr192519301935ValTrpAspLeuTrpGluTrpIleMetArgGlnValArgMetValMet194019451950AlaArgLeuArgAlaLeuCysProValValSerLeuProLeuTrpHis195519601965CysGlyGluGlyTrpSerGlyGluTrpLeuLeuAspGlyHisValGlu197019751980SerArgCysLeuCysGlyCysValIleThrGlyAspValPheAsnGly1985199019952000GlnLeuLysGluProValTyrSerThrLysLeuCysArgHisTyrTrp200520102015MetGlyThrValProValAsnMetLeuGlyTyrGlyGluThrSerPro202020252030LeuLeuAlaSerAspThrProLysValValProPheGlyThrSerGly203520402045TrpAlaGluValValValThrProThrHisValValIleArgArgThr205020552060SerProTyrGluLeuLeuArgGlnGlnIleLeuSerAlaAlaValAla2065207020752080GluProTyrTyrValAspGlyIleProValSerTrpAspAlaAspAla208520902095ArgAlaProAlaMetValTyrGlyProGlyGlnSerValThrIleAsp210021052110GlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsnValAla211521202125ProSerGluValSerSerGluValSerIleAspIleGlyThrGluThr213021352140GluAspSerGluLeuThrGluAlaAspLeuProProAlaAlaAlaAla2145215021552160LeuGlnAlaIleGluAsnAlaAlaArgIleLeuGluProHisIleAsp216521702175ValIleMetGluAspCysSerThrProSerLeuCysGlySerSerArg218021852190GluMetProValTrpGlyGluAspIleProArgThrProSerProAla219522002205LeuIleSerValThrGluSerSerSerAspGluLysThrProSerVal221022152220SerSerSerGlnGluAspThrProSerSerAspSerPheGluValIle2225223022352240GlnGluSerGluThrAlaGluGlyGluGluSerValPheAsnValAla224522502255LeuSerValLeuGluAlaLeuPheProGlnSerAspAlaThrArgLys226022652270LeuThrValArgMetAsnCysCysValGluLysSerValThrArgPhe227522802285PheSerLeuGlyLeuThrValAlaAspValAlaSerLeuCysGluMet229022952300GluIleGlnAsnHisThrAlaTyrCysAspLysValArgThrProLeu230523l023152320GluLeuGlnValGlyCysLeuValGlyAsnGluLeuThrPheGluCys232523302335AspLysCysGluAlaArgGlnGluThrLeuAlaSerPheSerTyrIle234023452350TrpSerGlyValProLeuThrArgAlaThrProAlaLysProProVal235523602365ValArgProValGlySerLeuLeuValAlaAspThrThrLysValTyr237023752380ValThrAsnProAspAsnValGlyArgArgValAspLysValThrPhe2385239023952400TrpArgAlaProArgValHisAspLysTyrLeuValAspSerIleGlu240524102415ArgAlaArgArgAlaAlaGlnAlaCysGlnSerMetGlyTyrThrTyr242024252430GluGluAlaIleArgThrValArgProHisAlaAlaMetGlyTrpGly243524402445SerLysValSerValLysAspLeuAlaThrProAlaGlyLysMetAla245024552460ValHisAspArgLeuGlnGluIleLeuGluGlyThrProValProPhe2465247024752480ThrLeuThrValLysLysGluValPhePheLysAspArgLysGluGlu248524902495LysAlaProArgLeuIleValPheProProLeuAspPheArgIleAla250025052510GluLysLeuIleLeuGlyAspProGlyArgValAlaLysAlaValLeu251525202525GlyGlyAlaTyrAlaPheGlnTyrThrProAsnGlnArgValLysGlu253025352540MetLeuLysLeuTrpGluSerLysLysThrProCysAlaIleCysVal2545255025552560AspAlaThrCysPheAspSerSerIleThrGluGluAspValAlaLeu256525702575GluThrGluLeuTyrAlaLeuAlaSerAspHisProGluTrpValArg258025852590AlaLeuGlyLysTyrTyrAlaSerGlyThrMetValThrProGluGly259526002605ValProValGlyGluArgTyrCysArgSerSerGlyValLeuThrThr261026152620SerAlaSerAsnCysLeuThrCysTyrIleLysValLysAlaAlaCys2625263026352640GluArgValGlyLeuLysAsnValSerLeuLeuIleAlaGlyAspAsp264526502655CysLeuIleIleCysGluArgProValCysAspProCysAspAlaLeu266026652670GlyArgAlaLeuAlaSerTyrGlyTyrAlaCysGluProSerTyrHis267526802685AlaSerLeuAspThrAlaProPheCysSerThrTrpLeuAlaGluCys269026952700AsnAlaAspGlyLysArgHisPhePheLeuThrThrAspPheArgArg2705271027152720ProLeuAlaArgMetSerSerGluTyrSerAspProMetAlaSerAla272527302735IleGlyTyrIleLeuLeuTyrProTrpHisProIleThrArgTrpVal274027452750IleIleProHisValLeuThrCysAlaPheArgGlyGlyGlyTnrPro275527602765SerAspProValTrpCysGlnValHisGlyAsnTyrTyrLysPhePro277027752780LeuAspLysLeuProAsnIleIleValAlaLeuHisGlyProAlaAla2785279027952800LeuArgValThrAlaAspThrThrLysThrLysMetGluAlaGlyLys280528102815ValLeuSerAspLeuLysLeuProGlyLeuAlaValHisArgLysLys282028252830AlaGlyAlaLeuArgThrArgMetLeuArgSerArgGlyTrpAlaGlu283528402845LeuAlaArgGlyLeuLeuTrpHisProGlyLeuArgLeuProProPro285028552860GluIleAlaGlyIleProGlyGlyPheProLeuSerProProTyrMet2865287028752880GlyValValHisGlnLeuAspPheThrSerGlnArgSerArgTrpArg288528902895TrpLeuGlyPheLeuAlaLeuLeuIleValAlaLeuPheGly290029052910(2)SEQIDNO184的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV5446IRT(xi)序列描述SEQIDNO184CGGTCCCTCGAACTCCAGCGAGTCTTTTTTTTTTTTTTT39(2)SEQIDNO185的信息(i)序列特征(A)长度70个氨基酸(B)类型氨基酸(C)链型双链(D)拓扑学未知(ii)分子类型蛋白质(iii)假设无(iv)反义无(vi)原始来源(C)各分离株来自T55806的GE帽(xi)序列描述SEQIDNO185MetSerLeuLeuThrAsnArgPheIleArgArgValAspLysAspGln151015TrpGlyProGlyValThrGlyThrAspProGluProCysProSerArg202530TrpAlaGlyLysCysMetGlyProProSerSerAlaAlaAlaCysSer354045ArgGlySerProArgIleLeuArgValArgAlaGlyGlyIleSerLeu505560PheTyrThrIleMetAla6570(2)SEQIDNO186的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-S59变异体(xi)序列描述SEQIDNO186AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGGGAAGGACCTCAAG360CCCTGCCCTTCCCGGTGGGGCGGGAAATGCATGGGGCCACC401(2)SEQIDNO187的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-S368变异体(xi)序列描述SEQIDNO187AGACGCAATGACTCGGCGCCAACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTACCCACC240CGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGAGAGGGACTCCAAG360TCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO188的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-S309变异体(xi)序列描述SEQIDNO188AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCCTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCATGCGGCGAGAACGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTCACGGGGAAGGACCCCGG360ATCCTGCCCTTCCCCGTGGGCCGGGAAATGCATGGGGCCACC402(2)SEQIDNO189的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-FZ变异体(xi)序列描述SEQIDNO189AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGCTACCCACC240TGGGCAAACGACGCCCATGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GATTCGTCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCCTGGGGAAGGACCCCAG360ACCCTGCCCTTCCCGGTGGGACGGGAAATGCATGGGGCCACC402(2)SEQIDNO190的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G21变异体(xi)序列描述SEQIDNO190AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGTCC180TACCGGTGTGAATAAGGACCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGGGAAGGACCCCAAG360CCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO191的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G23变异体(xi)序列描述SEQIDNO191AGACGCAATGACTCGGCGCCAACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCGCAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACATCAGGCATGTCGTTAAACCGAGCCCGTTACCCGCC240TGGGCTAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTTACGGGGAAGGACCCCGA360ACCCTGCCCTTCCCGGCGGACCGGGAAATGCATGGGGCCACC402(2)SEQIDNO192的信息(i)序列特征(A)长度405个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G59变异体(xi)序列描述SEQIDNO192AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACTGAGCCCGTAACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GGATTATTCCCGGCGAGTTGGCAAGGACCAGTGGGGGCCGGGAGCTACAGAGAAGGACTC360TGAGCTCTGCCCTTCCCGGTGGAACGGGAAATGCATGGGGCCACC405(2)SEQIDNO193的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-E36变异体(xi)序列描述SEQIDNO193AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGCCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCACTACCCACC240TGGGCAAACGACGCCCACGTACGGTCTACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTAAGCCGGCGAGTTGACAAAGACCAGTGGGGGCCGGGGGTCACAGGGATGGACCCTGG360ACCCTGCCCTTCCCGGTGGAGTGGGAAATGCATGGGGCCACC402(2)SEQIDNO194的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-R38730变异体(xi)序列描述SEQIDNO194AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGACAGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAGAAGGTTAAGGATCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCCTACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTATCCCACCTGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAGGTTCGTCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTTGCGGGGAAGGACCCCGAACTCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC(2)SEQIDNO195的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G281变异体(xi)序列描述SEQIDNO195AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGTCC180TACCGGTGTGAATAAGGACCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGGGAAGGACCCCAAG360CCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO196的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G157变异体(xi)序列描述SEQIDNO196AGACGCAATGACTCGGCGCCGACCCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGGG120AAGGTTAAGATTCCTCTTGTGCCTGTGGCGAGACAGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGACCGACACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGTGCTGGGGGAAGGACCCCCTT360GCACCGCCCTTCCCGGTGGGACGGGAAATGCATGGGGCCACC402(2)SEQIDNO197的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G154变异体(xi)序列描述SEQIDNO197AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCCTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTACGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGCTGGCCT180TACCGGTGTGAATAAAGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAGTAG300GTTTAACCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGCCTTGGAGATGGACTCCAAG360TCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO198的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G213变异体(xi)序列描述SEQIDNO198AGACGCAATGACTCGGCGCCAACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGTCC180TACCGGTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTATGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTTCGGGGAAGGACCCCGTA360CCCTGCCCTTCCCGGTGGAACGGGAAATGCATGGGGCCACC401(2)SEQIDNO199的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G204变异体(xi)序列描述SEQIDNO199AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTTAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCCTGGAGAGGGACTCCAGG360TCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO200的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G191变异体(xi)序列描述SEQIDNO200AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCCTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGGATCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGCTAAACCGAGCCCGTATCCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGAGGTTACGGGGAAGGACCCCGA360GCCTCGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC402(2)SEQIDNO201的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-G299变异体(xi)序列描述SEQIDNO201AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGCACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GAGTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGAGTCACGGGGATGGACCCCGG360GCTCTGCCCTTCCCGGTGGAACGGGAAATGCATGGGGCCACC402(2)SEQIDNO202的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-T56957变异体(xi)序列描述SEQIDNO202AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCATCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTACAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTCACAGGGATGGACCCTGG360GCCCTGCCCTTCCCGGTGGGGTGGGAAATGCATGGGGCCACC402(2)SEQIDNO203的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-C01698变异体(xi)序列描述SEQIDNO203AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGAGATGGACTCCAAG360TCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO204的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-T27034变异体(xi)序列描述SEQIDNO204AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCATTTCCCGCC240TGGGCTAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGAGTCACTGGGATGGACCCAGG360GCTCTGCCCTTCCCGGCGGGGTGGGAAAAGCATGGGGCCACC402(2)SEQIDNO205的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-E57963变异体(xi)序列描述SEQIDNO205AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCGCAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGAGAAGGACTCCAAG360TCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO206的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-R37166变异体(xi)序列描述SEQIDNO206AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTAACCCGCC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GTTTAACCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGCCTTGGAGATGGACTCCAAG360TCCTGCCCTTCCCGGCGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO207的信息(i)序列特征(A)长度404个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-B5变异体(xi)序列描述SEQIDNO207AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCCTGGTAGCCACTATAGGTGGGTCTTAAGGG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCTAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTTATGGGGAAGGACCCC360AAACCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC404(2)SEQIDNO208的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-B33变异体(xi)序列描述SEQIDNO208AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCCTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTCCCCGCC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGATCATGGGGAAGGACCCCAG360ATCCTGCCCTTCCCGGCGGGCCGGGAAATGCATGGGGCCACC402(2)SEQIDNO209的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-FH010变异体(xi)序列描述SEQIDNO209AGACGCAATGACTCGGCGCCGACCCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGGG120AAGGTTAAGATTCCTCTTGTGCCTGTGGCGAGACAGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACTGAGACCGACACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTGGGGGAAGGACCCCCAG360TCCTGCCCTTCCCGGTGGGACGGGAAATGCATGGGGCCACC401(2)SEQIDNO210的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-PNF2161变异体(xi)序列描述SEQIDNO210AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTTACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCGTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTTGGAGAGGGACTCCAAG360TCCCGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO211的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-JC变异体(xi)序列描述SEQIDNO211AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTAACCCGCC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCGCTCTTGACCAATAG300GCTTAGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGTTTATGGGGAAGGACCCCAA360ACCCTGCCCTTCCCGGCGGACCGGGAAATGCATGGGGCCACC402(2)SEQIDNO212的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-7155变异体(xi)序列描述SEQIDNO212AGACGTTATGAACCGGCGCCGCCCCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGGG120GTGGTCAAGGTCCCTCTAGCGCTTGTGGCGAGAAAGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCATTATCCTCC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGTGCCGGGGGAAGGACCCCCGG360TACTGCCCCTCCCGGAGGAGTGGGAAATGCATGGGGCCACC401(2)SEQIDNO213的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-7244变异体(xi)序列描述SEQIDNO213AGACGTTAAGAACCGGCGCCGCCCCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGGG120GTGGTCAAGGTCCCTCTGGCGCTTGTGGCGAGAAAGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCATTACCCTCC240TGGGCAAACGACGCCCATGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGTGGCGGGGGAAGGACCCCCGT360CACTGCCCTTCCCGGAGGGGTGGGAAATGCATGGGGCCACC401(2)SEQIDNO214的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-K27变异体(xi)序列描述SEQIDNO214AGACGTTAAGTACCGGCGCCGACCCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGGG120TTGGTCAAGGTCCCTCTGGCGCTTGTGGCGAGAAAGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCATTACCCACC240TGGGCAAACAACGCCCACGTACGGTCCACGTCGCCCTACAATGTCTCTCTTGACCAATAG300GCTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCTGGGCGGCGAGGGAAGGACCCTCGT360CGCTGCCCTTCCCGGCGGGGTGGGGAATGCATGGGGCCACC401(2)SEQIDNO215的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-K30变异体(xi)序列描述SEQIDNO215AGACGTTAAGAACCGGCGCCTTCCCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAGTCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGGG120AGGGTTAAGGTCCCTCTGGCGCTTGTGGCGAGAAAGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCATTACCCACC240TGGGCAAACAACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTTTGCCGGCGAGTTGACAAGGACCAGTGGGGGCTGGGCGGTAGGGGAAGGACCCTTGC360CGCTGCCCTTCCCGGTGGGGTGGGAAATGCATGGGGCCACC401(2)SEQIDNO216的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-T55875变异体(xi)序列描述SEQIDNO216AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGACGAGACCGCGCACGGTCCGCAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GTTTAACCGGCGAGTTGGCAAGGACCAGTGGGGGCCGGGGGCTTGGAGAGGGACTCCAAG360TCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO217的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-T56633变异体(xi)序列描述SEQIDNO217AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCACTACCCACC240TGGGCTAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAG300GCTAGTCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGAGGTCACAGGGATGGACCCTGG360GCCTTGCCCTTCCCGGTGGAGTGGGAAAAGCATGGGGCCACC402(2)SEQIDNO218的信息(i)序列特征(A)长度404个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-EB20变异体(xi)序列描述SEQIDNO218AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACCT240GGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAGG300AGTTATCTCCGGCGAGTTGGCAAGGACCAGTGGGGGCCGGGGGTTACGGGGAAGGACCCC360GAACCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC404(2)SEQIDNO219的信息(i)序列特征(A)长度401个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-T55806变异体(xi)序列描述SEQIDNO219AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGCC60AGGGTTGGTAGGTCGTAAATCCCGGTCATCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACCT240GGGCAAACGACGCTCACGTACGGTCCACGTCGCCCTTCAATGTCTCTCTTGACCAATAGG300TTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGTTACGGGGACGGACCCCGAA360CCCTGCCCTTCCCGGTGGGCCGGGAAATGCATGGGGCCACC401(2)SEQIDNO220的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-BG34变异体(xi)序列描述SEQIDNO220AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCACAGGTGTTGGCCC180TACCGGTGTGAATAAGGGCCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGTCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GAGTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGAGTCACGGGGATGGACCCCGG360GCTCTGCCCTTCCCGGTGGAACGGGAAACGCATGGGGCCACC402(2)SEQIDNO221的信息(i)序列特征(A)长度402个碱基对(B)类型核酸(C)链型双链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV-BE12变异体(xi)序列描述SEQIDNO221AGACGCAATGACTCGGCGCCGACTCGGCGACCGGCCAAAAGGTGGTGGATGGGTGATGAC60AGGGTTGGTAGGTCGTAAATCCCGGTCACCTTGGTAGCCACTATAGGTGGGTCTTAAGAG120AAGGTTAAGATTCCTCTTGTGCCTGCGGCGAGACCGCGCACGGTCCGCAGGTGTTGGTCC180TACCGGTGTGAATAAGGACCCGACGTCAGGCTCGTCGTTAAACCGAGCCCGCCACCCACC240TGGGCAAACGACGCCCACGTACGGTCCACGTCGCCCTTCAATGCCTCTCTTGGCCAATAG300GTTTATCCGGCGAGTTGACAAGGACCAGTGGGGGCCGGGGGCTCCGGGGAAGAACCCCGA360GCCCCGCCCTTCCCGGTGGGACGGGAAATGCATGGGGCCACC402(2)SEQIDNO222的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV正向引物(xi)序列描述SEQIDNO222CCAAAAGGTGGTGGATGGGTGATG24(2)SEQIDNO223的信息(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV正向引物(xi)序列描述SEQIDNO223GTGATGMCAGGGTTGGTAGGTCGT24(2)SEQIDNO224的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV正向引物(xi)序列描述SEQIDNO224GGTAGCCACTATAGGTGGGTCTTAAG26(2)SEQIDNO225的信息(i)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV反向引物(xi)序列描述SEQIDNO225GAGMGRCATTGWAGGGCGACGTRGA25(2)SEQIDNO226的信息(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV反向引物(xi)序列描述SEQIDNO226GRCATTGWAGGGCGACGTRGA21(2)SEQIDNO227的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株HGV反向引物(xi)序列描述SEQIDNO227CCCCACTGGTCYTTGYCAACTC22(2)SEQIDNO228的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV75-36FE(xi)序列描述SEQIDNO228GCGAGATCTAAAATGCAGGCCTGATGGGT29(2)SEQIDNO229的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学未知(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GV75-7064RLE(xi)序列描述SEQIDNO229GCGAGATCTAAAATGTGGACTGCTAAGCC29(2)SEQIDNO230的信息(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-28F(xi)序列描述SEQIDNO230GCGAGATCTAAAATGGCAAGCCCCAGAAACCGACGCCTATCTAAGT46(2)SEQIDNO231的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-2864R(xi)序列描述SEQIDNO231GGCATGATGAATTCGCAACGAGGGCCGGGACACCAAGAT39(2)SEQIDNO232的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-6439F(xi)序列描述SEQIDNO232GCGAGATCTAAAATGGGCCTCCGACACCCCGAAGGTTGT39(2)SEQIDNO233的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物FV94-9331R(xi)序列描述SEQIDNO233GCGAGATCTGAATTCTTCCCGGGGTGCACCCCTTCAGAT39(2)SEQIDNO234的信息(i)序列特征(A)长度9327个碱基对(B)类型核酸(C)链型双链(D)拓扑学线性(ii)分子类型cDNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株3ZHGV-6,来自PNF2161的HGV(xi)序列描述SEQIDNO234GCAAGCCCCAGAAACCGACGCCTATCTAAGTAGACGCAATGACTCGGCGCCGACTCGGCG60ACCGGCCAAAAGGTGGTGGATGGGTGATGACAGGGTTGGTAGGTCGTAAATCCCGGTCAC120CTTGGTAGCCACTATAGGTGGGTCTTAAGAGAAGGTTAAGATTCCTCTTGTGCCTGCGGC180GAGACCGCGCACGGTCCACAGGTGTTGGCCCTACCGGTGGGAATAAGGGCCCGACGTCAG240GCTCGTCGTTAAACCGAGCCCGTTACCCACCTGGGCAAACGACGCCCACGTACGGTCCAC300GTCGCCCTTCAATGTCTCTCTTGACCAATAGGCGTAGCCGGCGAGTTGACAAGGACCAGT360GGGGGCCGGGGGCTTGGAGAGGGACTCCAAGTCCCGCCCTTCCCGGTGGGCCGGGAAATG420CATGGGGCCACCCAGCTCCGCGGCGGCCTGCAGCCGGGGTAGCCCAAGAATCCTTCGGGT480GAGGGCGGGTGGCATTTCCTTTTTCTATACCATCATGGCAGTCCTTCTGCTCCTTCTCGT540GGTTGAGGCCGGGGCCATTCTGGCCCCGGCCACCCACGCTTGTCGAGCGAATGGGCAATA600TTTCCTCACAAATTGTTGTGCCCCGGAGGACATCGGGTTCTGCCTGGAGGGTGGATGCCT660GGTGGCCCTGGGGTGCACGATTTGCACTGACCAATGCTGGCCACTGTATCAGGCGGGTTT720GGCTGTGCGGCCTGGCAAGTCCGCGGCCCAACTGGTGGGGGAGCTGGGTAGCCTATACGG780GCCCCTGTCGGTCTCGGCCTATGTGGCTGGGATCCTGGGCCTGGGTGAGGTGTACTCGGG840TGTCCTAACGGTGGGAGTCGCGTTGACGCGCCGGATCTACCCGGTGCCTAACCTGACGTG900TGCAGTCGCGTGTGAGTTAAAGTGGGAAACTGAGTTTTGGAGATGGACTGAACAGCTGGC960CTCCAACTACTGGATTCTGGAATACCTCTGGAAGGTCCCATTTGATTTCTGGAGAGGCGT1020GATAAGCCTGACCCCCTTGTTGGTTTGCGTGGCCGCATTGCTGCTGCTTGAGCAACGGGT1080TGTCATGGTCTTCCTGTTGGTGACGATGGCCGGGATGTCGCAAGGCGCCCCTGCCTCCGT1140TTTGGGGTCACGCCCCTTTGACTACGGGTTGACTTGGCAGACCTGCTCTTGCAGGGCCAA1200CGGTTCGCGTTTTTCGACTGGGGAGAAGGTGTGGGACCGTGGGAACGTTACGCTTCAGTG1260TGACTGCCCTAACGGCCCCTGGGTGTGGTTGCCAGCCTTTTGCCAAGCAATCGGCTGGGG1320TGACCCCATCACTTATTGGAGCCACGGGCAAAATCAGTGGCCCCTTTCATGCCCCCAGTA1380TGTCTATGGGTCTGCTACAGTCACTTGCGTGTGGGGTTCCGCTTCTTGGTATGCCTCCAC1440CAGTGGTCGCGACTCGAAGATAGATGTGTGGAGTTTAGTGCCAGTTGGCTCTGCCACCTG1500CACCATAGCCGCACTTGGATCATCGGATCGCGACACGGTGCCTGGGCTCTCCGAGTGGGG1560AATCCCGTGCGTGACGTGTGTTCTGGACCGTCGGCCTGCTTCATGCGGCACCTGTGTGAG1620GGACTGCTGGCCCGAGACCGGGTCGGTTAGGTTCCCATTCCATCGGTGCGGCGTGGGGCC1680TCGGCTGACAAAGGACTTGGAAGCTGTGCCCTTCGTCAATAGGACAACTCCCTTCACCAT1740TAGGGGGCCCCTGGGCAACCAGGGCCGAGGCAACCCGGTGCGGTCGCCCTTGGGTTTTGG1800GTCCTACGCCATGACCAGGATCCGAGATACCCTACATCTGGTGGAGTGTCCCACACCAGC1860CATCGAGCCTCCCACCGGGACGTTTGGGTTCTTCCCCGGGACGCCGCCTCTCAACAACTG1920CATGCTCTTGGGCACGGAAGTGTCCGAGGCACTTGGGGGGGCTGGCCTCACGGGGGGGTT1980CTATGAACCCCTGGTGCGCAGGTGTTCGGAGCTGATGGGAAGCCGAAATCCGGTTTGTCC2040GGGGTTTGCATGGCTCTCTTCGGGCAGGCCTGATGGGTTTATACATGTCCAGGGTCACTT2100GCAGGAGGTGGATGCAGGCAACTTCATCCCGCCCCCGCGCTGGTTGCTCTTGGACTTTGT2160ATTTGTCCTGTTATACCTGATGAAGCTGGCTGAGGCACGGTTGGTCCCGCTGATCTTGCT2220GCTGCTATGGTGGTGGGTGAACCAGCTGGCAGTCCTAGGGCTGCCGGCTGTGGAAGCCGC2280CGTGGCAGGTGAGGTCTTCGCGGGCCCTGCCCTGTCCTGGTGTCTGGGACTCCCGGTCGT2340CAGTATGATATTGGGTTTGGCAAACCTGGTGCTGTACTTTAGATGGTTGGGACCCCAACG2400CCTGATGTTCCTCGTGTTGTGGAAGCTTGCTCGGGGAGCTTTCCCGCTGGCCCTCTTGAT2460GGGGATTTCGGCGACCCGCGGGCGCACCTCAGTGCTCGGGGCCGAGTTCTGCTTCGATGC2520TACATTCGAGGTGGACACTTCGGTGTTGGGCTGGGTGGTGGCCAATGTGGTAGCTTGGGC2580CATRGCGCTCCTGAGCTCGATGAGCGCAGGGGGGTGGAGGCACAAAGCCGTGATCTATAG2640GACGTGGTGTAAGGGGTACCAGGCAATCCGTCAAAGGGTGGTGAGGAGCCCCCTCGGGGA2700GGGGCGGCCTGCCAAACCCCTGACCTTTGCCTGGTGCTTGGCCTCGTACATCTGGCCAGA2760TGCTGTGATGATGGTGGTGGTTGCCTTGGTTCTTCTCTTTGGCCTGTTCGACGCGTTGGA2820TTGGGCCTTGGAGGAGATCTTGGTGTCCCGGCCCTCGCTGCGGCGTTTGGCTCGGGTGGT2880TGAGTGCTGTGTGATGGCGGGTGAGAAGGCCACAACCGTCCGGCTGGTCTCCAAGATGTG2940TGCGAGAGGAGCTTATTTGTTCGATCATATGGGCTCATTTTCGCGTGCTGTCAAGGAGCG3000CCTGTTGGAATGGGACGCGGCTCTTGAACCTCTGTCATTCACTAGGACGGACTGTCGCAT3060CATACGGGATGCCGCGAGGACTTTGTCCTGCGGGCAATGCGTCATGGGTTTACCCGTGGT3120TGCGCGCCGTGGTGATGAGGTTCTCATCGGCGTCTTCCAGGATGTGAATCATTTGCCTCC3180CGGGTTTGTTCCGACCGCGCCTGTTGTCATCCGACGGTGCGGAAAGGGCTTCTTGGGGGT3240CACAAAGGCTGCCTTGACAGGTCGGGATCCTGACTTACATCCAGGGAACGTCATGGTGTT3300GGGGACGGCTACGTCGCGAAGCATGGGAACATGCTTGAACGGCCTGCTGTTCACGACCTT3360CCATGGGGCTTCATCCCGAACCATCGCCACACCCGTGGGGGCCCTTAATCCCAGATGGTG3420GTCAGCCAGTGATGATGTCACGGTGTATCCACTCCCGGATGGGGCTACTTCGTTAACGCC3480TTGTACTTGCCAGGCTGAGTCCTGTTGGGTCATCAGATCCGACGGGGCCCTATGCCATGG3540CTTGAGCAAGGGGGACAAGGTGGAGCTGGATGTGGCCATGGAGGTCCCTGATTTCCGTGG3600CTCGTCTGGCTCACCGGTCCTATGTGACGAGGGGCACGCAGTAGGAATGCTCGTGTCTGT3660GCTTCACTCCGGTGGTAGGGTCACCGCGGCACGGTTCACTAGGCCGTGGACCCAAGTGCC3720AACAGATGCCAAAACCACCACTGAACCCCCTCCGGTGCCGGCCAAAGGAGTTTTCAAAGA3780GGCCCCGTTGTTTATGCCTACGGGAGCGGGAAAGAGCACTCGCGTCCCGTTGGAGTACGG3840CAACATGGGGCACAAGGTCTTAGTCTTGAACCCCTCAGTGGCCACTGTGCGGGCCATGGG3900CCCGTACATGGAGCGGCTGGCGGGTAAACATCCAAGTATATACTGTGGGCATGATACAAC3960TGCTTTCACRAGGATCACTGACTCCCCCCTGACGTATTCAACCTATGGGAGGTTTTTGGC4020CAACCCTAGGCAGATGCTACGGGGCGTTTCGGTGGTCATTTGTGATGAGTGCCACAGTTA4080TGACTCAACCGTGCTGTTAGGCATTGGGAGGGTTCGGGAGCTGGCGCGTGGGTGCGGAGT4140GCAACTAGTGCTCTACGCCACCGCTACGCCTCCCGGATCCCCTATGACCCAGCACCCTTC4200CATAATTGAGACAAAATTGGACGTGGGCGAGATTCCCTTTTATGGGCACGGAATACCCCT4260CGAGCGGATGCGAACCGGAAGGCACCTCGTGTTCTGCCATTCTAAGGCTGAGTGCGAGCG4320CCTTGCTGGCCAGTTCTCCGCTAGGGGGGTCAATGCCATTGCCTATTATAGGGGTAAAGA4380CAGTTCTATCATCAAGGATGGGGACCTGGTGGTCTGTGCCACAGACGCGCTTTCCACTGG4440GTACACTGGAAATTTCGACTCCGTCACCGACTGTGGATTAGTGGTGGAGGAGGTCGTTGA4500GGTGACCCTTGATCCTACCATTACCATCTCCCTGCGGACAGTGCCTGCGTCGGCTGAACT4560GTCGATGCAAAGACGAGGACGCACGGGTAGGGGCAGGTCTGGACGCTACTACTACGCGGG4620GGTGGGCAAAGCCCCTGCGGGTGTGGTGCGCTCAGGTCCTGTCTGGTCGGCGGTGGAAGC4680TGGAGTGACCTGGTACGGAATGGAACCTGACTTGACAGCTAACCTACTGAGACTTTACGA4740CGACTGCCCTTACACCGCAGCCGTCGCGGCTGATATCGGAGAAGCCGCGGTGTTCTTCTC4800TGGGCTCGCCCCATTGAGGATGCACCCTGATGTCAGCTGGGCAAAAGTTCGCGGCGTCAA4860CTGGCCCCTCTTGGTGGGTGTTCAGCGGACCATGTGTCGGGAAACACTGTCTCCCGGCCC4920ATCGGATGACCCCCAATGGGCAGGTCTGAAGGGCCCAAATCCTGTCCCACTCCTGCTGAG4980GTGGGGCAATGATTTACCATCTAAAGTGGCCGGCCACCACATAGTGGACGACCTGGTCCG5040GAGACTCGGTGTGGCGGAGGGTTACGCCCGCTGCGACGCTGGGCCGATCTTGATGATCGG5100TCTAGCTATCGCGGGGGGAATGATCTACGCGTCGTACACCGGGTCGCTAGTGGTGGTGAC5160AGACTGGGATGTGAAGGGGGGTGGCGCCCCCCTTTATCGGCATGGAGACCAGGCCACGCC5220TCAGCCGGTGGTGCAGGTTCCTCCGGTAGACCATCGGCCGGGGGGTGAATCAGCACCATC5280GGATGCCAAGACAGTGACAGATGCGGTGGCAGCGATCCAGGTGGACTGCGATTGGACTAT5340CATGACTCTGTCGATCGGAGAAGTGTTGTCCTTGGCTCAGGCTAAGACGGCCGAGGCCTA5400CACAGCAGCCACCAAGTGGCTCGCTGGCTGCTATACGGGGACGCGGGCCGTTCCCACTGT5460ATCCATTGTTGACAAGCTCTTCGCCGGAGGGTGGGCGGCTGTGGTGGGCCATTGCCACAA5520CGTGATTGCTGCGGCGGTGGCGGCCTACGGGGCTTCAAAGAGCCCGCCGTTGGCAGCCGC5580GGCTTCCTACCTGATGGGGTTGGGCGTTGGAGGCAACGCTCAGACGCGTCTGGCATCTGC5640CCTCCTATTGGGGGCTGCTGGAACCGCCTTGGGCACTCCTGTCGTGGGCTTGACCATGGC5700AGGTGCGTTCATGGGGGGCGCCAGTGTCTCCCCCTCCTTGGTCACCATTTTATTGGGGGC5760CGTCGGAGGTTGGGAGGGTGTTGTCAACGCGGCGAGCCTAGTCTTTGACTTCATGGCGGG5820GAAACTTTCATCAGAAGATCTGTGGTATGCCATCCCGGTACTGACCAGCCCGGGGGCGGG5880CCTTGCGGGGATCGCTCTCGGGTTGGTTTTGTATTCAGCTAACAACTCTGGCACTACCAC5940TTGGTTGAACCGTCTGCTGACTACGTTACCAAGGTCTTCATGTATCCCGGACAGTTACTT6000TCAGCAAGTTGACTATTGCGACAAGGTCTCAGCCGTGCTCCGGCGCCTGAGCCTCACCCG6060CACAGTGGTTGCCCTGGTCAACAGGGAGCCTAAGGTGGATGAGGTACAGGTGGGGTATGT6120CTGGGACCTGTGGGAGTGGATCATGCGCCAAGTGCGCGTGGTCATGGCCAGACTCAGGGC6180CCTCTGCCCCGTGGTGTCATTACCCTTGTGGCACTGCGGGGAGGGGTGGTCCGGGGAATG6240GTTGCTTGACGGTCATGTTGAGAGTCGCTGCCTCTGTGGCTGCGCGATCACTGGTGACGT6300TCTGAATGGGCAACTCAAAGAACCAGTTTACTCTACCAAGCTGTGCCGGCACTATTGGAT6360GGGGACTGTCCCTGTGAACATGCTGGGTTACGGTGAAACGTCGCCTCTCCTGGCCTCCGA6420CACCCCGAAGGTTGTGCCCTTCGGGACGTCTGGCTGGGCTGAGGTGGTGGTGACCACTAC6480CCACGTGGTAATCAGGAGAACCTCCGCCTATAAGCTGCTGCGCCAGCAAATCCTATCGGC6540TGCTGTAGCTGAGCCCTACTACGTCGACGGCATTCCGGTCTCATGGGACGCGGACGCTCG6600TGCGCCCGCCATGGTCTATGGCCCTGGGCAAAGTGTTACCATTGACGGGGAGCGCTACAC6660CCTGCCTCATCAACTGAGGCTCAGGAATGTGGCGCCCTCTGAGGTTTCATCCGAGGTGTC6720CATTGACATTGGGACGGAGACTGGAGACTCAGAACTGACTGAGGCCGATCTGCCGCCGGC6780GGCTGCTGCTCTCCAAGCGATCGAGAATGCTGCGAGGATTCTTGAACCGCACATTGATGC6840CATCATGGAGGACTGCAGTACACCCTCTCTTTGTGGTAGTAGCCGAGAGATGCCTGTATG6900GGGAGAAGACATCCCCCGTACTCCATCGCCAGCACTTATCTCGGTTACTGAGAGCAGCTC6960AGATGAGAAGACCCCGTCGGTGTCCTCCTCGCAGGAGGATACCCCGTCCTCTGACTCATT7020CGAGGTCATCCAAGAGTCCGAGACAGCCGAAGGGGAGGAAAGCGTCTTCAACGTGGCTCT7080TTCCGTATTAGAAGCCTCATTTCCACAGAGCGACGCGACCAGGAAGCTTACCGTCAAGAT7140GTCGTGCTGCGTTGAAAAGAGCGTCACGCGCTTTTTCTCATTGGGGTTGACGGTGGCTGA7200TGTTGCTAGCCTGTGTGAGATGGAAATCCAGAACCATACAGCCTATTGTGACAAGGTGCG7260CACTCCGCTTGAATTGCAGGTTGGGTGCTTGGTGGGCAATGAACTTACCTTTGAATGTGA7320CAAGTGTGAGGCTAGGCAAGAAACCTTGGCCTCCTTCTCTTACATTTGGTCTGGAGTGCC7380GCTGACTAGGGCCACGCCGGCCAAGCCTCCCGTGGTGAGGCCGGTTGGCTCTTTATTAGT7440GGCCGACACTACTAAGGTGTATGTTACCAATCCAGACAATGTGGGACGGAGGGTGGACAA7500GGTGACCTTCTGGCGTGCTCCTAGGGTTCATGATAAGTACCTCGTGGACTCTATTGAGCG7560CGCTAAGAGGGCCGCTCAAGCCTGCCTAAGCATGGGTTACACTTATGAGGAAGCAATAAG7620GACTGTAAGGCCACATGCTGCCATGGGCTGGGGATCTAAGGTGTCGGTTAAGGACTTAGC7680CACCCCCGCGGGGAAGATGGCCGTCCATGACCGGCTCCAGGAGATACTTGAAGGGACTCC7740GGTCCCCTTTACTCTTACTGTGAAAAAGGAGGTGTTCTTCAAAGACCGGAAGGAGGAGGA7800GGCCCCCCGCCTCATTGTGTTCCCCCCCCTGGACTTCCGGATAGCTGAAAAGCTCATCTT7860GGGAGACCCAGACCGGGTAGCCAAGGCGGTGTTGGGGGGGGCCTACGCCTTCCAGTACAC7920CCCAAATCAGCGAGTTAAGGAGATGCTCAAGCTATGGGAGTCTAAGAAGACCCCTTGCGC7980CATCTGTGTGGACGCCACCTGCTTCGACAGTAGCATAACTGAAGAGGACGTGGCTTTGGA8040GACAGAGCTGTACGCTCTGGCCTCTGACCATCCAGAATGGGTGCGGGCACTTGGGAAATA8100CTATGCCTCAGGCACCATGGTCACCCCGGAAGGGGTGCCCGTCGGTGAGAGGTATTGCAG8160ATCCTCGGGTGTCCTAACAACTAGCGCGAGCAACTGCTTGACCTGCTACATCAAGGTGAA8220AGCCGCCTGTGAGAGGGTGGGGCTGAAGAATGTCTCTCTTCTCATAGCCGGCGATGACTG8280CTTGATCATATGTGAGCGGCCAGTGTGCGACCCAAGCGACGCTTTGGGCAGAGCCCTAGC8340GAGCTATGGGTACGCGTGCGAGCCCTCATATCATGCATCCTTGGACACGGCCCCCTTCTG8400CTCCACTTGGCTTGCTGAGTGCAATGCAGATGGGAAGCGCCATTTCTTCCTGACCACGGA8460CTTCCGGAGGCCGCTCGCTCGCATGTCGAGTGAGTATAGTGACCCGATGGCTTCGGCGAT8520CGGTTACATCCTCCTTTATCCTTGGCACCCCATCACACGGTGGGTCATCATCCCTCATGT8580GCTAACGTGCGCATTCAGGGGTGGAGGCACACCGTCTGATCCGGTTTGGTGCCAGGTACA8640TGGTAACTACTACAAGTTTCCACTGGACAAACTGCCTAACATCATCGTGGCCCTCCACGG8700ACCAGCAGCGTTGAGGGTTACCGCAGACACAACTAAAACAAAGATGGAGGCTGGTAAGGT8760TCTGAGCGACCTCAAGCTCCCTGGCTTAGCAGTCCACCGAAAGAAGGCCGGGGCGTTGCG8820AACACGCATGCTCCGCTCGCGCGGTTGGGCTGAGTTGGCTAGGGGCTTGTTGTGGCATCC8880AGGCCTACGGCTTCCTCCCCCTGAGATTGCTGGTATCCCGGGGGGTTTCCCTCTCTCCCC8940CCCCTATATGGGGGTGGTACACCAATTGGATTTTACAAGCCAGAGGAGTCGCTGGCGGTG9000GTTGGGGTTCTTAGCCCTGCTCATCGTAGCCCTCTTCGGGTGAACTAAATTCATCTGTTG9060CGGCGAGGTCTGGTGACTGATCGTCACCGGAGGAGGTTCCCGCCCTCCCCGCCCCAGGGG9120TCTCCCCGCTGGGTAAAAAGGGCCCGGCCTTGGGAGGCATGGTGGTTACTAACCCCCTGG9180CAGGGTTAAAGCCTGATGGTGCTAATGCACTGCCACTTCGGTGGCGGGTCGCTACCTTAT9240AGCGTAATCCGTGACTACGGGCTGCTCGCAGAGCCCTCCCCGGATGGGGCACAGTGCACT9300GAGATCTGAAGGGGTGCACCCCGGGAA9327(2)SEQIDNO235的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GLI-F(xi)序列描述SEQIDNO235TAGCATGGCCTTTGCAGGGCTG22(2)SEQIDNO236的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GLI-R(xi)序列描述SEQIDNO236AAGCTGTGACCGTCTCCG18(2)SEQIDNO237的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE1-NF(xi)序列描述SEQIDNO237GCCGCCATGGCGGGGAAACTTTCATCAGAAG31(2)SEQIDNO238的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE1-NR(xi)序列描述SEQIDNO238GCGCGGATCCTAGTGACACCACGGGGCAGAGG32(2)SEQIDNO239的信息(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE57F(xi)序列描述SEQIDNO239GCCGCCATGGCTCTCTTGACCAATAGGTTTATC33(2)SEQIDNO240的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GE57R(xi)序列描述SEQIDNO240GCGCGGATCCAGAAATGCCACCCGCCCTCAC31(2)SEQIDNO241的信息(i)序列特征(A)长度61个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(iii)假设无(iv)反义无(vi)原始来源(C)各分离株GE57氨基酸序列(xi)序列描述SEQIDNO241MetSerLeuLeuThrAsnArgPheIleArgArgValAspLysAspGln151015TrpGlyProGlyValThrGlyThrAspProGluProCysProSerArg202530TrpAlaGlyLysCysMetGlyProProSerSerAlaAlaAlaCysSer354045ArgGlySerProArgIleLeuArgValArgAlaGlyGly505560(2)SEQIDNO242的信息(i)序列特征(A)长度52个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株E1的正向引物(xi)序列描述SEQIDNO242GCGCAGATCTAAAATGAGCCGTGGTGGCATTTCCTTTTTCTATACCATCATG52(2)SEQIDNO243的信息(i)序列特征(A)长度38个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株E1的反向引物(xi)序列描述SEQIDNO243GCGCAGATCTCCAGAAATCAAATGGGACCTTCCAGAGG38(2)SEQIDNO244的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株带有昆虫信号序列的E2的正向引物(xi)序列描述SEQIDNO244CGCGAGATCTGTCGCAAGGCGCCCCT26(2)SEQIDNO245的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株带有昆虫信号序列的E2的反向引物(xi)序列描述SEQIDNO245GCGCAGATCTAGTTGCCTGCATCCACCT28(2)SEQIDNO246的信息(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株带有HGV信号序列的E2的正向引物(xi)序列描述SEQIDNO246CGCGAGATCTAAAATGAAACTGCTTGTCATGGTCTTCCTGTT42(2)SEQIDNO247的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株带有HGV信号序列的反向引物(xi)序列描述SEQIDNO247GCGCAGATCTAGTTGCCTGCATCCACCT28(2)SEQIDNO248的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株NS2a的正向引物(xi)序列描述SEQIDNO248GCGCAGATCTGGCCGTGGCAGGTGAGGTCTTCGC34(2)SEQIDNO249的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株NS2a的反向引物(xi)序列描述SEQIDNO249GCGCAGATCTTAACGCCGCAACGAGGGCCGG31(2)SEQIDNO250的信息(i)序列特征(A)长度46个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株NS2b的正向引物(xi)序列描述SEQIDNO250GCGCGGATCCAAAATGATCGCTCGGGTGGTTGAGTGCTGTGTGATG46(2)SEQIDNO251的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株NS2b的反向引物(xi)序列描述SEQIDNO251GCGCGGATCCAGGCGCGGTCGGAACAAACCCG32(2)SEQIDNO252的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株正向引物NS3(xi)序列描述SEQIDNO252GCGAGATCTAAAATGTGCGGAAAGGGCTTCTTGGGGGTC39(2)SEQIDNO253的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株反向引物NS3(xi)序列描述SEQIDNO253GCGAGATCTCATCTCCGGACCAGGTCGTCCACTATGTGG39(2)SEQIDNO254的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株正向引物NS4a(xi)序列描述SEQIDNO254GGCGGATCCAAAATGATCGGTGTGGCGGAGG31(2)SEQIDNO255的信息(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株反向引物NS4a(xi)序列描述SEQIDNO255GGCGGGATCCATGCGCCGGAGCACGG26(2)SEQIDNO256的信息(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株正向引物NS4b(xi)序列描述SEQIDNO256GCGGGATCCAAAATGATCAGCCTCACCCGCACAG34(2)SEQIDNO257的信息(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株反向引物NS5a(xi)序列描述SEQIDNO257GGCGGGATCCTACCTCCTGATTACCACGT29(2)SEQIDNO258的信息(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株正向引物NS5a(xi)序列描述SEQIDNO258GCGAGATCTAAAATGACCTCCGCCTATAAGCTGCTGCGCCAG42(2)SEQIDNO259的信息(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株反向引物NS5a(xi)序列描述SEQIDNO259GGCAGATCTACCTCCGTCCCACATTGTCTGGATTGGTAAC40(2)SEQIDNO260的信息(i)序列特征(A)长度43个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株正向引物NS5b(xi)序列描述SEQIDNO260GCGAGATCTAAAATGGTGGACAAGGTGACCTTCTGGCGTGCTC43(2)SEQIDNO261的信息(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株反向引物NS5b(xi)序列描述SEQIDNO261GCGAGATCTCACCCGAAGAGGGCTACGATGAGCAGG36(2)SEQIDNO262的信息(i)序列特征(A)长度52个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株正向引物E1-E2-NS2a(xi)序列描述SEQIDNO262GCGCAGATCTAAAATGAGCCGTGGTGGCATTTCCTTTTTCTATACCATCATG52(2)SEQIDNO263的信息(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株反向引物E1-E2-NS2a(xi)序列描述SEQIDNO263GCGCAGATCTTAACGCCGCAACGAGGGCCGG31(2)SEQIDNO264的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物9E3-REV(xi)序列描述SEQIDNO264GCTGGCTGAGGCACGGTTGGTC22(2)SEQIDNO265的信息(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物E39-94PR(xi)序列描述SEQIDNO265CACCATCATCACAGCATCTGGC22(2)SEQIDNO266的信息(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-F12(xi)序列描述SEQIDNO266GCAACCATGGAACCTGCCAAACCCCTGACCTT32(2)SEQIDNO267的信息(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-R12(xi)序列描述SEQIDNO267AGCCCCATGGAAGGTCGTGAA21(2)SEQIDNO268的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-F14(xi)序列描述SEQIDNO268TTGGGATCCCTCGTGTTCCGCCATTCTAAG30(2)SEQIDNO269的信息(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-R13(xi)序列描述SEQIDNO269TATGGATCCTGGTAAATCATTGCCCCACCT30(2)SEQIDNO270的信息(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物470ep-F8(xi)序列描述SEQIDNO270GCTGAATTCGCCATGGCGACGTGCGCATTCAGGGGTGGA39(2)SEQIDNO271的信息(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株引物GEP-R14(xi)序列描述SEQIDNO271GGAGGATCCGCGACCCGCCACCGAAGT27(2)SEQIDNO272的信息(i)序列特征(A)长度48个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Y5表位(xi)序列描述SEQIDNO272IleAspGlyGluArgTyrThrLeuProHisGlnLeuArgLeuArgAsn151015ValAlaProSerGluValSerSerGluValSerIleAspIleGlyThr202530GluAlaGluAsnSerGluLeuThrGluAlaAspLeuProProAlaAla354045(2)SEQIDNO273的信息(i)序列特征(A)长度55个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Q9表位(xi)序列描述SEQIDNO273CysGlyLeuLeuThrArgHisHisThrAlaLeuAsnHisProSerGln151015ThrProGlnArgGlyProGlyHisGlnAspLeuLeuGlnGlyProIle202530GlnArgValGluGlnAlaLysGluLysAspGlnGlyAsnHisHisHis354045HisHisSerIleTrpProAsp5055(2)SEQIDNO274的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Q11表位(xi)序列描述SEQIDNO274AlaAlaValAlaGluProTyrTyrValAspGlyIleProValSerTrp151015AspAlaAspAlaArgAlaProAlaMetValTyrGlyProGlyGlnSer202530ValThrIle35(2)SEQIDNO275的信息(i)序列特征(A)长度225个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Q7-12-1env克隆(xi)序列描述SEQIDNO275GTGCCCTTCGTCAACAGGACAACTCTCTTCACCATTAGGGGGCCCCTGGGCAACCAGGGC60CGAGGCAACCCGGTGCGGTCGCCCTTGGGTTTTGGGTCCTACGCCATGACCAGGATCCGA120GATACCCTACATCTGGTGGAGTGTCCCACACCAGCCATCGAGCCTCCCACCGGGACGTCT180GGGTTCTTCCCCGGGACGCCGCCTCTCAACAACTGCATGCATATG225(2)SEQIDNO276的信息(i)序列特征(A)长度192个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Y12-15-1NS3克隆DNA(xi)序列描述SEQIDNO276AACATGGGGCACAAGGTCTTAATCTTGAACCCCTCAGTGGCCACTGTGCGGGCCATGGGC60CCGTACATGGAGCGGCTGGCGGGTAAACATCCAAGTATATACTGTGGGCATGATACAACT120GCTTTCACAAGGATCACTGACTCCCCCCTGACGTATTCAACCTATGGGAGGTTTTTGGCC180AACCCTAGGCAA192(2)SEQIDNO277的信息(i)序列特征(A)长度264个碱基对(B)类型核酸(C)链型两种(D)拓扑学线性(ii)分子类型DNA(iii)假设无(iv)反义无(vi)原始来源(C)各分离株Y12-10-2NS3克隆(xi)序列描述SEQIDNO277CCCCTCGAGCGGATGCGAACCGGAAGGCACCTCGTGTTCTGCCATTCTAAGGCTGAGTGC60GAGCGCCTTGCTGGCCAGTTCTCCGCTAGGGGGGTCAATGCCATTGCCTATTATAGGGGT120AAAGACAGCTCTATCATCAAGGATGGGGACCTGGTGGTCTGTGCTACAGACGCGCTTTCC180ACTGGGTACACTGGAAATTTCGACTCCGTCACCGACTGTGGATTAGTGGTGGAGGAGGTC240GTTGAGGTGACCCTTGATCCCACC26权利要求1.一种基本上为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽。2.权利要求1的多肽,其中所述的HGV的特征如下(i)可在灵长类动物中传染,(ii)在血清学上与甲肝病毒(HAV)、乙肝病毒(HBV)、丙肝病毒(HCV)、丁肝病毒(HDV)和戊肝病毒(HEV)不同,和(iii)为黄热病毒科(Flaviviridae)病毒的一种。3.权利要求1的多肽,包含一种与至少一种抗HGV抗体特异性发生免疫反应的表位。4.权利要求1的多肽,还包含一种与HGV特异性发生免疫反应的抗原决定簇,其中HGV的特征在于(i)包含可读框(ORF)的基因组、cDNA或其互补链;和(ii)所述的ORF编码具有至少40%序列与SEQIDNO15的2873个氨基酸序列,或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。5.权利要求4的多肽,其中所述的ORF编码具有55%序列与SEQIDNO15的2873个氨基酸序列,或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。6.权利要求1的多肽,其中所述的多肽是固定在固相上的。7.由化学合成制备的权利要求1的多肽。8.由重组DNA表达制备的权利要求1的多肽。9.权利要求8的多肽,包含由SEQIDNO20、SEQIDNO38或SEQIDNO15衍生的多肽序列。10.权利要求8的多肽,包含一种由SEQIDNO14编码的多肽序列。11.权利要求8的多肽,包含一种由SEQIDNO14的互补链编码的多肽序列。12.权利要求1的多肽,其中所述的多肽是一种包含HGV多肽和一个第二种多肽的融合多肽。13.权利要求12的多肽,其中所述的第二种多肽是β-半乳糖苷酶或谷胱甘肽-S-逆转移酶蛋白质序列。14.权利要求12的多肽,其中所述的第二种多肽包含形成颗粒的蛋白。15.权利要求1的多肽,它包含由HGV基因组、cDNA或其互补链编码的至少60个氨基酸的连续序列。16.权利要求15的多肽,其中所述的连续序列包含SEQIDNO15的2873个氨基酸序列,或其片断。17.权利要求15的多肽,其中所述的连续序列包含SEQIDNO38的190个氨基酸序列,或其片断。18.权利要求15的多肽,其中所述的连续序列包含SEQIDNO20的67个氨基酸序列,或其片断。19.权利要求15的多肽,其中所述的连续序列被编码在PNF2161cDNA来源的λgt11文库中。20.一种克隆载体,它能在适合的条件下表达由非甲非乙非丙非丁非戊肝炎病毒(HGV)基因组,cDNA或其互补链衍生的cDNA可读框(ORF),其中所述的ORF可操作地连接于与所需宿主相容的控制序列。21.权利要求20的克隆载体,其中所述的ORF是由SEQIDNO14或其互补链衍生的。22.权利要求21的克隆载体,其中所述的ORF是由SEQIDNO37或SEQIDNO19衍生的。23.一种由权利要求20载体转化的细胞。24.一种生产非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽的方法,它包括在产生表达可读框(ORF)序列的条件下,培养权利要求23的细胞。25.权利要求24的方法,其中所述ORF序列编码选自SEQIDNO15,SEQIDNO38和SEQIDNO20的多肽序列或其片段。26.权利要求24的方法,其中载体为λgt11噬菌体载体并且细胞为大肠杆菌。27.一种诊断试剂盒,用于筛选含有特异性地抗非甲非乙非丙非丁非戊肝炎病毒(HGV)感染的抗体的血清,它包含一种基本上分离的HGV多肽抗原,该抗原包含特异性地与至少一种抗HGV抗体发生免疫反应的表位,和检测所述抗体与抗原结合的试剂。28.权利要求27的试剂盒,其中HGV特征在于(i)基因组,cDNA或其互补链,它们含有可读框(ORF)和(ii)所述ORF编码具有至少40%序列与SEQIDNO15的2873个氨基酸序列,或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。29.权利要求27的试剂盒,其中重组产生所述多肽抗原。30.权利要求27的试剂盒,其中化学合成所述多肽抗原。31.权利要求27的试剂盒,其中所述多肽抗原被连接到固体支持物上。32.权利要求27的试剂盒,其中所述检测试剂包括与所述多肽抗原相连的固相支持物,还提供了一种没有报告分子标记相连的抗人抗体,其中所述血清抗体与所述多肽抗原的结合可通过报告分子标记的抗体与所述血清抗体的结合而被检测。33.一种检测试验个体中非甲非乙非丙非丁非戊肝炎病毒(HGV)感染的方法,包括将来自HGV试验个体的血清与基本上分离的HGV多肽抗原反应,和通过检验抗原而得知是否有结合抗体的存在。34.权利要求33的方法,其中多肽抗原被连于固相支持物上,所述反应包括将血清与支持物反应,接着将支持物与报告分子标记的抗人抗体反应,所述检验包括检测固相支持物上的报告分子标记的抗体的存在。35.基本为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)。36.来自非甲非乙非丙非丁非戊肝炎病毒(HGV)的基本上为分离形式的多肽制剂。37.基本为分离形式的非甲非乙非丙非丁非戊肝炎病毒(HGV)多核苷酸。38.权利要求37的多核苷酸,其中所述HGV特征如下(i)可在灵长类动物中传染,(ii)在血清学上与甲肝病毒(HAV)、乙肝病毒(HBV)、丙肝病毒(HCV)、丁肝病毒和/戊肝病毒,和(iii)为黄热病毒科病毒中的一种。39.权利要求37的多核苷酸,包含HGV基因组的cDNA或cDNA互补链。40.权利要求37的多核苷酸,其中所述多核苷酸具有至少40%的序列与选自SEQIDNO14,SEQIDNO37和SEQIDNO19的多核苷酸或它们的互补链同源。41.权利要求37的多核苷酸,其中所述多核苷酸具有至少55%的序列与选自SEQIDNO14,SEQIDNO37和SEQIDNO19的多核苷酸或它们的互补链同源。42.权利要求37的多核苷酸,其中所述多核苷酸具有选自SEQIDNO14,SEQIDNO37和SEQIDNO19的多核苷酸或它们的互补链衍生的序列。43.权利要求37的多核苷酸,其中所述多核苷酸至少为10个核苷酸长度。44.权利要求37的多核苷酸,其中所述多核苷酸为至少15个核苷酸长度。45.权利要求37的多核苷酸,其中所述多核苷酸为至少20个核苷酸长度。46.权利要求37的多核苷酸,其中所述多核苷酸为DNA多核苷酸。47.权利要求37的多核苷酸,其中所述多核苷酸为RNA多核苷酸。48.权利要求37的多核苷酸,其中所述多核苷酸为特异性地与HGV杂交的多核苷酸探针。49.权利要求37的多核苷酸,其中重组产生所述多核苷酸。50.权利要求37的多核苷酸,其中所述多核苷酸编码一个HGV的表位。51.权利要求50的多核苷酸,其中所述多核苷酸包括SEQIDNO14,SEQIDNO19或SEQIDNO37。52.权利要求37的多核苷酸,其中所述的多核苷酸被编码在PNF2161cDNA来源的λgt11文库。53.权利要求37的多核苷酸,包含能选择性杂交至HGV多核苷酸上的邻接的核苷酸,其中HGV的特征在于(i)为包含可读框(ORF)的基因组,cDNA或它的互补链;和(ii)所述ORF编码具有至少40%的序列与SEQIDNO15的2873个氨基酸序列或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。54.权利要求53的多核苷酸,其中所述多核苷酸为特异性地与HGV杂交的多核苷酸探针。55.权利要求54的多核苷酸,其中所述多核苷酸探针被固定至固相支持物上。56.一种编码非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽的DNA多核苷酸。57.权利要求56的DNA多核苷酸,进一步包含具有HGV特异性免疫反应性的抗原决定簇。58.权利要求57的DNA多核苷酸,其中HGV的特征在于(i)为包含可读框(ORF)的基因组,cDNA或它们的互补链;和(ii)所述ORF编码具有至少40%的序列与SEQIDNO15的2873个氨基酸或SEQIDNO38的190个氨基酸或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。59.权利要求57的DNA多核苷酸,其中所述ORF编码具有至少55%的序列与SEQIDNO15的2873个氨基酸序列,SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。60.权利要求57的DNA多核苷酸,其中所述多核苷酸具有至少40%的序列与选自SEQIDNO14,SEQIDNO37和SEQIDNO19的多核苷酸同源。61.权利要求57的DNA多核苷酸,其中所述多核苷酸为至少10个核苷酸长度。62.权利要求57的DNA多核苷酸,其中所述多核苷酸为至少15个核苷酸长度。63.权利要求57的DNA多核苷酸,其中所述多核苷酸为至少20个核苷酸长度。64.权利要求56的DNA多核苷酸,其中所述多核苷酸被编码在DNF2161cDNA来源的λgt11文库中。65.权利要求56的DNA多核苷酸,其中所述多核苷酸编码一个HGV表位。66.权利要求56的DNA多核苷酸,其中所述多核苷酸为特异性地与HGV杂交的多核苷酸探针。67.权利要求56的DNA多核苷酸,其中所述多肽包含至少60个氨基酸的,具有55%的序列与由HGV基因组,cDNA或它们的互补链编码的至少60个氨基酸的连续序列同源的连续序列。68.一种包含权利要求56的DNA多核苷酸的重组载体。69.一种用权利要求68的载体转化的宿主细胞。70.一种多核苷酸探针,其特异性地与非甲非乙非丙非丁非戊肝炎病毒(HGV)基因组,cDNA或它们的互补链杂交。71.权利要求70的多核苷酸探针,其中该探针的序列与从SEQIDNO19,SEQIDNO37,或SEQIDNO14得的序列或它们的互补链具有至少40%的同源性。72.权利要求70的多核苷酸探针,其中探针的序列从SEQIDNO19,SEQIDNO37或SEQIDNO14或它们的互补链得到。73.一种检测试验个体中的非甲非乙非丙非丁非戊肝炎病毒(HGV)核酸的方法,包括从个体中获得含有核酸的样品,将含有核酸的样品和至少一种权利要求的探针结合,和检测由HGV核酸与探针杂交形成的HGV核酸/探针复合物的存在。74.权利要求73的方法,其中所述检测通过将含有至少一种报告分子的探针杂交到HGV核酸中来完成。75.权利要求73的方法,其中所述检测包括使用HGV核酸特异性探针,其中两个探针确定HGV核酸的内在区域,并且各个探针具有含有位于区域内部的3′末端的一条链,通过引物延伸反应,将核酸/探针杂交复合物转化成含有探针的双链片段,通过连续重复下面步骤扩增含有探针的片段的数目,(i)将双链片段变性,产生单链片段,(ii)将单链与探针杂交,形成链/探针复合物,(iii)在DNA聚合酶和所有四种脱氧核糖核苷酸存在下,从链/探针复合物产生双链片段,和(iv)重复(i)-(iii)步骤直至达到所需程度的扩增,鉴定扩增产物。76.权利要求73的方法,其中所述检测通过选自自身维持的(self-sustained)序列复制,连接酶链反应和链置换扩增的靶扩增方法来实现。77.权利要求73的方法,其中所述检测采用选自支链DNA探针和Q-β复制酶方法的信号扩增技术来实现。78.一种试剂盒,用于分析样品中是否存在从非甲非乙非丙非丁非戊肝炎病毒(HGV)产生的多核苷酸,包括至少一种含有特异性地与HGV多核苷酸杂交的核苷酸序列的多核苷酸探针,和一种适宜的容器。79.权利要求78的试剂盒,其中所述试剂盒含有两个多核苷酸探针,两个探针确定HGV多核苷酸的内在区域,每个探针具有一条含有位于这个区域内的3′末端的链。80.权利要求79的试剂盒,其中所述探针可用于聚合酶链反应扩增中的引物。81.一种非甲非乙非丙非丁非戊肝炎病毒(HGV)疫苗组合物,包含一种以药理学有效剂量存在于药学上可接受的载体中的基本上分离的HGV多肽抗原,该抗原包含一个特异性地与至少一个抗HGV抗体发生免疫反应的表位。82.权利要求81的组合物,其中重组制备所述多肽抗原。83.权利要求81的组合物,其中化学合成所述多肽抗原。84.权利要求81的组合物,其中HGV的特征在于(i)为包含可读框(ORF)的基因组,cDNA或它的互补链;和(ii)所述ORF编码具有至少40%的序列与SEQIDNO15的2873个氨基酸序列,SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源。85.一种特异性地与非甲非乙非丙非丁非戊肝炎病毒(HGV)表位发生免疫反应的单克隆抗体。86.一种特异性地与非甲非乙非丙非丁戊肝炎病毒(HGV)发生免疫反应的多克隆抗体的基本上分离的制剂。87.权利要求86的多克隆抗体的制剂,其中所述的多克隆抗体通过亲和层析制备。88.一种生产非甲非乙非丙非丁非戊肝炎病毒(HGV)的抗体的方法,包括将有效量的包含特异性地与至少一种抗HGV抗体发生免疫反应的表位的基本上分离的HGV多肽抗原施加到试验个体中以产生免疫应答。89.一种诊断试剂盒,用于筛选含有非甲非乙非丙非丁非戊肝炎病毒(HGV)抗原的血清,包含一种基本上分离的特异性地与非甲非乙非丙非丁非戊肝炎病毒(HGV)多肽抗原发生免疫反应的抗体,和检测所述多肽抗原与所述抗体结合的方法。90.权利要求89的试剂盒,其中所述抗体为单克隆抗体。91.权利要求89的试剂盒,其中所述抗体被连接至固相支持物上。92.权利要求89的试剂盒,其中所述检测方法包括第二种标记的单克隆抗体。93.权利要求89的试剂盒,其中所述检测方法包括标记的竞争性抗原。94.权利要求89的试剂盒,其中HGV的特征在于(i)包含可读框(ORF)的基因组,cDNA或它的互补链;和(ii)所述ORF编码具有至少40%的序列与SEQIDNO15的2873个氨基酸序列或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源的氨基酸序列。95.一种检测试验个体中非甲非乙非丙非丁非戊肝炎病毒(HGV)感染的方法,包括将来自试验材料的血清与权利要求89的试剂盒的基本上分离的HGV特异性抗体反应,和为结合的抗原的存在而检验抗体。96.一种被非甲非乙非丙非丁非戊肝炎病毒(HGV)感染的体外生长的细胞。97.权利要求96的体外生长的细胞,其中所述细胞为肝细胞,所述细胞生长于组织培养基中。98.权利要求97的体外生长的细胞,其中所述细胞为无限增殖化的肝细胞。99.权利要求97的体外生长的细胞,其中所述细胞为从HGV感染的灵长类动物的肝脏获得的细胞系。100.一种繁殖非甲非乙非丙非丁非戊肝炎病毒(HGV)的方法,包括提供权利要求96的HGV感染的细胞,在能启动HGV繁殖的条件,体外培养所述细胞。101.由权利要求100的方法产生的非甲非乙非丙非丁非戊肝炎病毒(HGV)颗粒。102.一种镶嵌型的多肽,包含至少两个非甲非乙非丙非丁非戊肝炎病毒(HGV)表位,其中所述多肽基本上缺乏正常间插在天然HGV编码序列中的表位之间的氨基酸。103.权利要求102的镶嵌型多肽,其中所述多肽被连至固相支持物上。104.权利要求102的镶嵌型多肽,其中HGV特征在于(i)包含可读框(ORF)的基因组,cDNA或它的互补链;和(ii)所述ORF编码具有至少40%的序列与SEQIDNO15的2873个氨基酸序列或SEQIDNO38的190个氨基酸序列或SEQIDNO20的67个氨基酸序列同源。105.编码权利要求102的镶嵌型多肽的核酸。106.一种检测试验个体中非甲非乙非丙非丁非戊肝炎病毒(HGV)感染的方法,包括将含有来自个体的样品的抗体与权利102的多肽接触,并为结合的抗体的存在而检测抗原。107.一种非甲非乙非丙非丁非戊肝炎病毒(HGV)疫苗组合物,包含一种权利要求102的镶嵌型多肽,其中所述镶嵌型多肽包含多于一种的HGV表位,并以药物学有效剂量存在于药学上可接受的载体中。全文摘要本发明公开了一类多肽抗原,其可与患有非甲非乙非丙非丁非戊型肝炎个体的血清发生免疫反应,这里称之为庚型肝炎病毒(HGV)。公开了包含抗原多肽的多核苷酸编码的开放阅读框序列的相应的基因组片段的克隆。该抗原用于检测试验个体是否有HGV的论断方法。该抗原也有用于疫苗和抗原的制备。此外,提示了两个HGV分离株的完整编码序列。提出了以核酸为基础的样品中HGV的检测方法,以及HGV有关的其它基因组序列的分离方法。文档编号G01N33/576GK1153529SQ95194249公开日1997年7月2日申请日期1995年5月19日优先权日1994年5月20日发明者J·P·金,K·E·弗莱,L·M·杨格,J·M·林伦,J·韦杰斯申请人:基因实验室技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1