非-m、非-o、hiv-1毒株、片段及应用的制作方法

文档序号:451081阅读:1290来源:国知局
专利名称:非-m、非-o、hiv-1毒株、片段及应用的制作方法
技术领域
本发明涉及非-M、非-O HIV-1族的逆转录病毒毒株,尤其涉及一种称为YBF30的毒株,涉及其片段及其作为诊断试剂和免疫原性制剂的应用。
人类获得性免疫缺陷病毒HIV-1和HIV-2是逆转录慢病毒,这类病毒存在于许多非洲灵长类中。所有的这些病毒看来有一个共同的祖先;然而,要预先判断这些不同的病毒是在什么时期从这个前体分离是非常困难的。更为远缘但属于同族的其它病毒,存在于其它哺乳动物中(有蹄动物和猫科动物)。
所有这些病毒与长期感染有关;在天然感染的猴中症状的缺乏是普遍规律。
由于其与Sooty Mangabey(西部非洲)病毒很强的同源性,HIV-2的起源看来是较明确的,但在猴中没有发现与HIV-1密切关联的病毒。关系最为密切的病毒是在两只黑猩猩中发现的病毒(CPZGABSIV,ANT SIV)。
业已发现所有的慢病毒都显示出很大的遗传变异性,对这些获自许多不同地理位置的变种进行的种系发生学研究,已使得HIV-1的8个亚型(分化枝)得到区别分类,它们各自之间都是等距的。分化枝仅是一种变异性表达的数字表示;基于氨基酸而不是核酸的表型学分析得出了不同的结果(Korber等人,1994)。
亚型的证实与一项种系发生学分析是一致的,到目前为止,种系发生学分析还没有任何病理生理学交联,但相反,却有地理对应性。这是因为每一种亚型主要见于一个特定的地理区域。B亚型主要见于欧洲和美国,而两种亚型即E和B,见于泰国,且传染方式(事实上与特定人群相对应)与所发现的亚型之间有很强的相关性。在非洲发现的所有分化枝及其在世界其它地区的分布,反映了沉溺于高危险行为的人们之间相互交流的可能性。主要的分化枝是分化枝A,之所以它是主要的,是因为在非洲的大部分地区都存在。在某些非洲国家已发现了很大程度的变异性(G.Myers,1994;P.M.Sharp等人,1994)。在西中部非洲国家如中非共和国(Murphy等人,1993)和喀麦隆(Nkengasong等人,1994),某些亚型的特征已得以表征。
最后,携带HIV-1的病毒变种的病人已得到表征,对在法国市场销售的特定试剂盒来说,他们的血清已提出了检测问题,而且他们的确证性Western印迹是不典型的(Loussert-Ajaka等人,1994;Simon等人,1994;PCT国际申请WO 96/27013)。
对这些变种的分析证实了这样一个事实,即1型HIV病毒应被分为两个族,即M(主要)族和O(外围层)族,后者包括这些分离株,正如Charneau等人1994年提出的那样。对已知的O族病毒序列进行的同义突变/非同义突变比率分析表明,这一新族也是古老的,即使不比M族更为古老(Loussert-Ajaka等人,1995)。到目前为止,它的低流行率-即在喀麦隆被HIV-1感染病人的8%(Zekeng等人,1994)以及在法国确定的18例,被认为是由于纯粹的流行病学因素。
HIV-1的这两个族形成了一株形状象双星形骨针的树(图9-19)。两个分离株-即从加蓬的一只黑猩猩身上得到的CPZGAB SIV(Huet等人,1990)以及从Antwerp动物园的一只黑猩猩身上得到的CPZANT SIV,具有的序列和遗传结构与HIV-1有非常密切的关联,但它们并不属于这两个族中的任何一族,且在进化系统树上形成两个新枝。
对于开发用于检测HIV感染的足够敏感和特异的试剂,也就是说不会产生假阴性或假阳性结果的试剂,以及对于开发对既不属于M族、也不属于O族的亚型有保护作用的组合物,新亚型的证实是非常重要的。
因此,申请者自己制定了一个目标,即提供一种非-M、非-O毒株,以及来源于该毒株的序列,后者适用于检测非-M、非-OHIV变种,而且不会产生假阴性或假阳性结果。为了达到这个目的,发明者特地建立了一个规则系统,用于区别并确证M族和O族HIV-1感染,据此使他们能够选择非-M、非-O变种。
本发明涉及一种非-M、非-O HIV-1毒株,它显示也一种逆转录病毒的形态和免疫学特征,该逆转录病毒已于1996年7月2日保藏在国立微生物保藏中心,保藏号I-1753(命名为YBF30),由巴斯德研究所保管。
非-M、非-O变种被认为是指一种1型HIV,从血清学和分子方面不能将其识别归属于这些族中的任何一族。
本发明还涉及以上定义的毒株(SEQ ID No.1)的完整核苷酸序列,以及涉及源自该毒株的、大小至少为10个核苷酸的核酸片段。
可能会提到的该类型的片段是-YBF 30 LTR(SEQ ID No.2)-YBF 30 GAG(SEQ ID No.3)(gag基因)-YBF 30 POL(SEQ ID No.5)(pol基因)-YBF 30 VIF(SEQ ID No.7)(vif基因)-YBF 30 VPR(SEQ ID No.9)(vpr基因)-YBF 30 VPU(SEQ ID No.11)(vpu基因)-YBF 30 TAT(SEQ ID No.13)(tat基因)-YBF 30 REV(SEQ ID No.15)(rev基因)-YBF 30 ENV gp160(SEQ ID No.17)(env基因)-YBF 30 NEF(SEQ ID No.19)(nef基因)-SEQ ID Nos.21-57,也被分别命名,YLG、LPBS.1、GAG YAS1.1、GAG Y AS1、GAG 6、GAG Y S1、GAG Y S1.1、GAG YS1.2、YRT AS1.3、YRT AS1.2、YRT AS1.1、YRT 2、YRT AS1、YRT 2.1、YRT2.2、YRT2.3、YRT2.4、4481-1、4481-2、4235.1、4235.2、4235.3、4235.4、SK69.6、SK69.5、SK69.4、SK69.3、SK69.2、SK69.1、SK68.1、SK68.2、SK68.3、LAI AS1.3、LSIAS1.2、LSI AS1.1、LSI A1、YLPA以及与以上核苷酸序列之一不同,或与这些序列之一不互补,但能够与来自一种非-M、非-OHIV-1病毒的核酸序列特异性杂交的任何序列。
这样的序列可被用于非-M、非-O HIV-1的特异性鉴别,且作为诊断试剂或单独或与其它试剂合在一起,用于任何HIV-1的特异性鉴别。
这些序列尤其可作为引物或探针用于诊断试验,包括或是与待测病毒序列的直接杂交,或是该病毒序列的扩增,这些试验应用一种包含至少10个核苷酸的寡核苷酸,后者包括在以上序列中的任何一个序列中,尤其是上述序列之一SEQ ID No.21-57。
本发明还涉及HIV-1病毒,其特征在于它们与M族和O族都不相同,而且显示以下特征*对M和O族的蛋白质几乎没有或没有血清学反应性,而对源自YBF30毒株或CPZGABSIV毒株的蛋白质却有很强的血清学反应性;*当应用来自M和O族HIV-1病毒env和gag区的引物时,无基因组扩增;*当来自以上定义的YBF30毒株的引物存在时,基因组扩增;以及*相对于YBF30毒株,包膜基因产物的同源性大于70%。
本发明还涉及上述序列的应用,以提供HIV-1型核酸序列的杂交和/或基因扩增的一种方法,这些方法可用于体外诊断非-M、非-OHIV-1型病毒在一个体的潜在感染。
这种体外诊断方法是应用一种生物样本(血清或循环淋巴细胞)进行的,它包括●提取待测核酸的步骤,核酸属于病毒的基因组,该病毒有可能存在于生物样本中,以及,在适当的时候,应用一种逆转录酶处理核酸的步骤,如果该核酸为RNA形式的话。
●至少一个循环,包括以下步骤使核酸变性,与至少一个根据本发明的序列杂交,以及,在适当的时候,延伸杂交物,后者是在适当的试剂(聚合剂,如DNA聚合酶和dNTP)存在时形成的,以及●检测属于非-M、非-O HIV-1族型病毒的基因组核酸的可能存在的步骤。
应用以下条件用于利用来源于YBF30毒株的引物进行PCR-根据酚/氯仿技术提取淋巴细胞DNA,在260nm波长用分光度法对其定量。所有的扩增都是应用Perkin Elmer 2400热循环仪进行的。
-长片段(9kb)PCR的进行应用了XL PCR试剂盒(PerkinElmer)按照生产商的条件、以及应用了dNTP、提供的缓冲液以及Perkin Elmer的“热启动(hot start)”,这一长片段PCR的扩增循环是●94℃,变性2分钟一个循环,●然后16个循环94℃15秒钟,55℃15秒钟,68℃8分钟,●然后24个循环94℃15秒钟,55℃15秒钟,68℃8分钟,每个循环另外增加15秒钟(加长)。
-对长片段PCR的扩增产物进行巢式PCR。进行巢式PCR的条件如下●“扩展高度精确PCR系统(Expand High Fidelity PCRsystem)”Tag聚合酶缓冲液和酶来自Boehringer Mannheim,按照生产商的说明进行,dNTP和“热启动”来自Perkin Elmer,●每dNTP各200μmol,根据本发明的每种引物各20pmol,DNA 5μl,10×PCR缓冲液10μl,以及Tag聚合酶2.6单位,体积为100μl,●扩增94℃2分钟一个循环,随后38个循环94℃15秒钟,55℃15秒钟,72℃延伸一段时间-根据待扩增PCR产物的大小,时间长短不一(从30秒至2分钟),以及最后的延伸循环,72℃10分钟。
扩增产物优选应用直接测序检测。
本发明还涉及一种肽或一种肽片段,其特征在于它能被一种非-M、非-O HIV-1毒株表达,或应用一种上述核苷酸序列而被表达,而且它能够(1)被上述非-M、非-O HIV-1病毒、尤其是YBF30毒株或该毒株的变种诱导产生的抗体所识别,这些抗体存在于用非-M、非-O HIV-1毒株感染后获得的生物标本中,和/或(2)诱导抗非-M、非-O HIV-1抗体的产生。
可能会提到的这种类型的肽,尤其是来自YBF30毒株的肽,有gag基因表达的肽(SEQ ID No.4)、pol基因表达的肽(SEQ IDNo.6)、vif基因表达的肽(SEQ ID No.8)、vpr基因表达的肽(SEQID No.10)、vpu基因表达的肽(SEQ ID No.12)、tat基因表达的肽(SEQ ID No.14)、rev基因表达的肽(SEQ ID No.16)、env基因表达的肽(SEQ ID No.18)或其片段之一如V3环区的一个片段,即CTRPGNNTGGQVQIGPAMTFYNIEKIVGDIRQAYC (SEQ IDNo.58),以及nef基因表达的肽(SEQ ID No.20),或者能够识别上述非-M、非-O HIV-1感染期间产生的抗体的这些多肽的一个片段。
本发明还涉及免疫原性组合物,其包括根据本发明的核苷酸序列的一个或多个翻译产物,和/或上述、尤其是通过合成方法获得的肽中的一个。
本发明还涉及针对上述一个或多个肽的抗体,以及它们在提供用于在体外,尤其是特异性诊断HIV-1型病毒在一个体的感染的方法的用途,利用的方法是本领域熟练的技术人员所熟知的。
本发明包括所有的、能被从获自非-M、非-O HIV-1毒株感染后的感染血清中分离的抗体所识别的肽,以及能够被根据本发明的一种抗体所识别的肽。
本发明进一步涉及一种在体外诊断非-M、非-O HIV-1病毒的方法,该方法的特征在于它包括使一种取自病人的生物标本接触根据权利要求10的抗体,其可能会与抗-CPZGAB SIV抗体结合,以及检测可能存在于该生物样本中的HIV-1抗原与该抗体之间形成的免疫复合物。
本发明还涉及一种用于诊断HIV-1的试剂盒,该试剂盒的特征在于它包括至少一种根据本发明的试剂。
除上述条款外,本发明还包括其它条款,这在以下描述中物是显而易见的,以下描述提及实施作为本发明之主题的方法的实例,并提及附图,其中
-

图1-7显示了不同的引物在YBF30毒株基因组上的位置;-图8显示了YBF30毒株的基因组结构;-图9-16描绘了与M族HIV-1和O族HIV-1相比,YBF30毒株不同基因的系统发生学分析(图91tr基因,图10gag基因,图11tat基因,图12rev基因,图13vif基因,图14env gp120基因,图15env gp41基因,图16nef基因,图17pol基因,图18vpr基因,图19vpu基因,);-图20显示了YBF30与HIV-1/GPZGAB SIV之间的百分比遗传距离。
不过,理所当然应予理解的是,这些实施例只是以说明本发明的主题方式提供的,它们绝不对本发明构成限制。
实施例获得根据本发明的非-M、非-O HIV-1变种(YBF30)及其应用联系到在喀麦隆的对人类免疫缺陷病毒(HIV)感染进行的流行病学研究,这尤其是可能的,其流行病学是特别似非而是的。在这个国家,毒株的多样性非常突出,目前已知的HIV-1病毒M(主要)族的大多数亚型都有报道。O族(O代表外围层)高度多样性的HIV-1病毒的感染病例已有报道,几乎仅见于喀麦隆血统的病人。HIV-2、HTLV-1和HTLV-2亚型A和B感染病例也有报道。
以先前的血清学和基因型评估结果为基础,本发明者建立了一种区分并确证M族和O族HIV-1病毒感染的规则系统,以选择非-M、非-O变种。
这些方法被用到送至雅温得国家参比实验室检测HIV感染的标本上,使之有可能鉴定出一种高度多样性的HIV分离株,并明确用于鉴定一种新的HIV-1族的工具,其中将观察到的这种人类毒株YBF30与猿毒株CPZGABSIV之间的同源性考虑在内。I-在流行病学研究中从血清学上鉴定YBF30变种的方法
1)采集标本研究了1994年和1995年送至雅温得参比实验室以检测或确证HIV感染的全部成年病人血清(n=8831)。
2)从血清学上区别M族和O族HIV-1,并选择变种如果抗-HIV抗体检测为阳性(Genelvia Mixt间接混合HIV-1和HIV-2 EIA,Sanofi-Pasteur,巴黎,法国),那么,根据与M族特异性抗原竞争的原理,将其与EIA试验结合(Wellcozyme Rec HIV-1,Murex,Dartford,英国)。
如果竞争Wellcozyme Rec HIV-1试验是阳性的,以光密度(OD)的反应性与阈值或截断值(CO)相比的比率大于5(CO/OD>5),那么,这份血清就被认为是HIV-1阳性,这一结果应在一种新标本上予以确证。
选择反应性比率大于5作为竞争试验是确证感染HIV-1的试验,是基于Bichat医院病毒实验室得到的经验反应的比率>5的全部7200份样本都产生了强阳性HIV-1 Western印迹(WB,New Lav Blot 1,SDP,Marnes 1a Coquette)。除了HIV-1血清转换的病例外,确证为HIV阳性、而Wellcozyme比率<5的标本,相应于HIV-2感染或者O族HIV-1或其它HIV-1变种感染。
为了在进行混合EIA检测时消除假阳性反应,CO/OD比率<5的样本用第三代混合HIV-1/HIV-2 EIA(Enzygnost Plus,Marburg,德国)的系统测试,包括M和O HIV-1族的抗原(MVP 5180毒株的重组gp41)。如果这项试验是阳性的,然后再进行一种区别HIV-1与HIV-2的快速试验(Multispot,SDP,Mrnes Ia Coquette)以及一种Western印迹(WB,New Lav Blot 1或2,SDP)。
3)从血清学上确证O族HIV-1与HIV-1变种感染所有CO/DO比率<5、且被WB区别为阳性(阳性标准2ENV+/-POL+/-GAG或1 ENV+POL+/-GAG)和HIV-1的样本,都接受应用V3和跨膜区肽抗原的斑点印迹试验测试(InnoLia,Innogenetics,Ghent,比利时)。
4)O族和变种毒株的逆转录病毒分离在喀麦隆用Ficoll-Hypaque梯度分离血清阳性病人的外周血单核细胞(PMBC),然后收集在液氮中保存并运往巴黎。
病人的PBMC在解冻后与血清阴性高加索供血者的淋巴细胞共同培养。在为期一个月的时间内,通过检测逆转录酶活性以及进行检测P24抗原的试验(Elavia P24 Polyclonal,SDP),以证实培养上清中的病毒复制。
5)序列根据片段大小在1~1.4%浓度的琼脂糖凝胶上显现PCR产物,在3M乙酸钠(1∶10)和3体积的纯乙醇中沉淀,在-80℃孵育30分钟,然后13,000转/分离心20分钟。将沉淀干燥,然后溶于10μl蒸馏水(Sigma)中。根据生产商的说明,用“Qiauick凝胶提取试剂盒”(Qiagen)进行纯化;根据以往的描述(Loussert-Ajakat等人,1995),应用Applied Biosystem Dye Terminator试剂盒,在自动DNA测序仪上对产物进行测序;在Sequence Navigator软件(AppliedBiosystem)上分析核苷酸序列,应用GeneWorks软件(IntelligeneticsInc.)进行序列对比。
6)系统发生学分析应用CLUSTAL软件对序列进行多重对比,并将生物学和理论生物物理学实验室(Los Alamos,New Mexico,87545,美国)拥有的HIV序列汇集的序列对比作为参比模板。
应用PHYLIP软件进行系统发生学分析;首先应用DNADIST计算距离,然后应用NEIGBOR JOINTING或FITCH进行系统发生学分析最后,应用DRAWTREE画系统树(图9~19)。图20还显示了遗传距离百分比。
首先应用SEQBOOT进行“引导程序(bootstrapping)”分析,随后DNADIST与NEIGHBOR JOINTING或FITCH。最后,应用CONSENS获得引导程序值。II-检测O族和变种HIV病毒的研究结果在筛查中发现为阳性的3193份样本中,有174份样本被认为是有异常血清学反应的O族或M族,或被认为是变种。III-显示异常血清学反应的非-O族和非-M族样本的检测WB(蛋白质印迹)为HIV-1阳性、但在竞争EIA中反应性CO/CD比率<5的174份血清,应用来自M族、O族和CPZGAB SIV的V3肽,通过鉴别LIA斑点印迹进行了测试-7份没有与任何代表性肽(M,O或CPZGAB SIV)起反应。细胞收集的缺乏不能允许得出任何结论。
-82份与至少一种对应于O族毒株V3环的肽产生反应性。交叉反应的频率低,而且限于对应于共有V3区(11%)和CPZGAB SIV V3区(43%)的表位。
-84份血清没有与O族表位起反应。这些样本中的大多数获自表现艾滋病综合症的病人(75/84)。
-1份获自一位喀麦隆病人(NJ)的血清只与CPZGAB SIV肽起反应。这种与CPZAB SIV抗原的孤立反应性以往从未有描述。因为已从该病人身上取到淋巴细胞,所以有可能继续对这一被称为YBF30的毒株进行病毒学表征。
IV-对取自该病人的第一批标本(1995年5月)进行血清学和病毒学检测的结果(血清号95-6295)1)商品化ELISA试验(光密度/阈值)阳性标准OD/CO>1Genelavia=>15Wellcozyme CO/OD=1.55Abbott Plus=>15Behring Plus=4.22) Western印迹
New Lav 1 Oasteur WB160++,120++,68++,55+,41+,40+/-,34++,24++,18+3)Inngenetics LIA斑点印迹除CPZGAB SIV V3外,全部O族和B族条带均为阴性。
4)对M族和O族特异性肽进行的探索性血清学检查结果对TOURS CHU病毒实验室Francis Barin教授开创的技术进行了修改(Barin F等人,1996);应用了合成的跨膜区肽(Biom*rieux)以建立一种区别M族和O族的试验。这项技术是以O族和M族跨膜gp41肽之间的抗体结合竞争为基础的,肽沉淀在固相,O族或是M族的gp41跨膜肽以更高的浓度存在于高渗性液体的反应相。结果如下表I所示,其中CP孔相当于100%抑制对照,CSP孔相当于0%抑制对照。
表I6295份血清的族间O族M鉴别结果
这些结果证实,与固相肽(CSP)有很强的结合,以及由于M和O肽(CP)的联合加入而造成明显抑制,但无论是M肽还是O肽,都无明确的区别。因此这一血清学证据表明,感染毒株既不属于M族、也不属于O族。
考虑到InnoLia斑点印迹中CPZGAB SIV V3抗原的孤立反应性,同样依据肽之间的竞争,通过将gp41 M、gp41 O和gp41 CPZGABSIV肽与其竞争,对该血清进行了研究。
取自名为‘Amandine’的黑猩猩的血清(M.Petters惠赠,他分离出了CPZGAB SIV毒株,AIDS 1992)之应用,初步使该技术得到证实。表II中,最低值(OD)表示与抗原的最高度结合。
表II应用Amandine黑猩猩血清和6295份血清进行族间O-族M-CPZGAB SIV鉴别的结果
“Amandine”血清的反应性证实了根据本发明的试验及其正确性,并且显示,尽管该病人的血清同样与M和CPZGAB SIV肽起反应,但它与O肽并无交叉反应。
这些结果表明,M族gp41和CPZGAB SIV gp41肽对该病人血清有相似的抑制作用。感染毒株的抗原因此产生了抗体,后者以相似的方式识别M族和CPZBAG SIV gp41肽。
5)从淋巴细胞分离(1995年5月采样)中得出的结果应用标准技术从1995年5月22日采集的淋巴细胞中分离了一种逆转录病毒。应用MT2细胞系培养,显示YBF30毒株没有形成任何合胞体(NSI)。V-对第二份血液标本(1995年11月)(血清号95-3371)进行的血清学检查结果1)Innogenetics LIA斑点印迹除了CPZGAB SIV V3外,全部条带均为阴性。
2)对M族和O族特异性肽进行的探索性血清学检查结果表III显示了应用3371份血清进行族间O-族M-CPZGAB SIVgp41鉴别的结果。
表III应用3371份血清进行族间O-族M-CPZGAB SIV gp41鉴别的结果
对此新的血液标本(取自处于疾病终末期的同一病人)研究的结果证实,CPZGAB SIV gp41肽显著抑制该病人的血清。
感染毒株的抗原因此诱导产生了优选地识别CPZGAB gp41肽的抗体。
3.淋巴细胞分离的结果(血样于95年11月采集(95-3371-YBF31))应用标准技术从1995年11月采样的淋巴细胞中分离出一种逆转录病毒,命名为YBF31;其序列成分与YBF30相同。VI-基因组扩增与YBF30的序列用于全部PCR操作的DNA是从阳性培养结束时获得的细胞中提取的。
应用O族HIV-1引物进行的PCR在检测的不同区(gap、pol、env)都是阴性的。同样,应用M族HIV-1特异性引物进行的PCR也是阴性的。
O族PCR的扩增和杂交条件同Loussert-Ajaka,1995描述的一样。M族PCR的扩增和杂交条件同下文作者引用的一样。
这些M族引物的定位根据以下HIV-1 HXB2序列-在env gp120ED3/ED12(位置5956-5985;7822-7792);ED5/ED14(6556-6581;7960-7931);ED5/ED12;ED3/ED14;ES7/ES8(7001-7020;7667-7647)(Delwart等人,科学(Science)1993;2621257-1261)。
-在env gp41先是PCR、ED3/M29,随后是巢式PCR,M28/M29(7785-7808;8099-8124);M28/M29具有以下序列M28CGGTTCTT(AG)GGAGCAGC(ACT)GGAAGCA,M29T(CT)T(ACGT)TCCCA(CT)T(AT)(CT)A(AGT)CCA(AGT)GTCAT;SK68/SK69(Ou等人,科学,1988;239295-297)。
-在gagAmplicor Roche诊断系统;巢式gag引物(Loussert-Ajaka等人,柳叶刀(Lancet)1995346912-913);SK38/SK39(Ou等人,科学,1988;239295-297)。
-在polA/NE1(Boucher等人,柳叶刀,1990;336585-590);pol3/pol4(Laure等人,柳叶刀,1988;ii,538-541)。
只有应用H pol引物(4235/4538)进行的PCR是阳性的,随之应用引物4327/4481(Fransen等人,分子与细胞探针(Molecular andCellular Probes)1994;8317-322)进行了巢式PCR。这一位于整合酶(260 bp)中的H pol片段已被测序。由于病毒过量使之可以利用HPOL引物扩增。这是因为应用的DNA是从强阳性培养(逆转录酶>100,000cpm)结束时的细胞中提取的。对未经共同培养的新鲜细胞中提取的DNA进行扩增是不可能的,这是因为在HPOL引物(尤其是在3′区)与YBF30分离株的序列之间存在大量错配。该3′末端的保守对于Tag聚合酶的延伸活性是非常重要的。
1-pol基因序列非常简并引物通过RT-PCR用于扩增从阳性培养上清中提取的RNA,产生了阳性扩增。这些引物是所有逆转录病毒共有的(Donehowert等人,病毒学方法杂志(J.Virol.Methods)1990;2833-46),位于pol基因的逆转录酶区。测序后的片段分析使之有可能从YBF30分离株中产生一种特异性引物,即YRT2(SEQID No.32),并应用Hpol 4481引物(Fransen等人,1994,loc.cit.)作为反义引物,以扩增pol基因。通过按照所产生的每一片段所需来合成特异性引物,对片段进行测序(图1)。
2-env基因序列第二个步骤是进行长片段PCR(XL-PCR,Perkin Elmer),以此扩增整个病毒(9000 bp),应用的引物位于LTRLPBS1(SEQ ID No.22);LsiGi,随后应用YRT2(SEQ IDNo.32)/SK69进行6000bp巢式PCR,并按照相同步骤测序整个包膜。gp41区的测序应用巢式PCR,使用引物SK 68/LSiGi。
3-gag基因序列巢式PCR的应用是通过长片段PCR(LPBS1/LSiGi)进行的,使用的引物Gag5和Gag11i,按照需要由这种特异性引物产生,以便沿病毒基因组走行。
VII-测序结果对YBF30毒株进行了全部测序(见序列表)。对1995年11月的YBF31毒株进行了部分测序,显著变异的缺乏证实了YBF30序列的正确性。
VIII-合成YBF30毒株V3环区的肽研究V3环区的序列使之有可能合成相应的肽,并对YBF30毒株V3环区的氨基酸与其它M亚型和O毒株的氨基酸进行比较。
这些肽的序列是YBF30 SEQ ID No.58CPZGAB SIVCHRPGNNTRGEVQIGPGMTFYNIENVYGDTRSAYC(SEQ ID No.59)O族 CIRPGNRTYRNLQIGPGMTFYNVEIATGDIRKAFC(ANT70)(SEQ ID No.60)M族 CTRPNNTRKSVRIGPGQAFYATGDIIGDIRQAHC(SS-A型) (SEQ ID No.61)从环的5′区的两个天冬酰胺开始合成肽,并根据以往描述的同一原理应用(见IV4),那就是供其与M族、O族和CPZGAB SIV的肽竞争。表IV显示的结果证实了这一毒株的原始本质以及这些株的可能传播,因为血清学结果支持在喀麦隆有YBF30型的感染。此外,一项对从喀麦隆选择的200份HIV-1阳性血清的研究,提供了一例新病例的证据,该病例显示的特征与YBF30相似。
表IV 200份血清的反应性研究血清 起源V3AV3cpz V3YBF3 CPCSP0953371喀麦隆 1.66 0.381.39 0.39 1.64956295喀麦隆 1.72 0.371.16 0.51 1.73967321喀麦隆 0.07 0.170.5 0.05 0.27Amandine GABSIV 1.74 0.141.48 0.19 1.74NOA*ANTSIV 2.66 0.311.88 0.46 1.9*来自CPZ ANT SIV的血清血清953371和956295(与分离出YBF30毒株的病人相对应)与CPZ SIV肽的反应性在这一新试验中得到确证。与其自身V3抗原的反应性较低,在疾病的晚期是常见的。然而,这种反应性一直高于M肽引起的反应性。另一例喀麦隆病人(血清967321)显示出同样的肽反应性特征。
参考文献*Barin F.等人,艾滋病研究与人类逆转录病毒,1996,12,13,1279-1289,抗体与代表HIV 1型基因型A至E共有序列的V3肽结合的多样性用于HIV 1型血清学亚型分型的一种方法。
*Charneau P.,Borman AM.,Quillent C.,Guetard D.,ChamaretS.,Cohen J.,Remy G.,Montagnier L.,及F.Clavel,病毒学(Virology),1994,205,247-253,一种高度趋异的HIV-1分离株的分离及包膜序列一种新的HIV-1族的定义。
*Descamps D.,Collin G.,Loussert-Ajaka I.,Saragosti S.,SimonF.及F.Brun-Vezinet.艾滋病(AIDS),1995,9,977-978,HIV-1 O族对抗逆转录病毒药物的敏感性。
*Huet,T.,Cheynier R.,Meyerhans A.,Roelants,G.,及S.Wain-Hobson,自然(Nature),1990,345,356-359,一种与HIV-1相关的黑猩猩慢病毒的遗传结构。
*Korber BTM.,MacInnes K.,Smith R.及G.Myers,病毒学杂志(J.Virol),1994,68-6730-6744,在HIV-1的不同遗传谱系中观察到的V3环蛋白质序列的突变趋势。
*Loussert-Ajaka I.,Ly TD.,Chaix Ml,Ingrand D.,Saragosti S.,Courouce AM.,Brun-Vezinet F.及F.Simon,柳叶刀(Lancet),1994,343,1393-1394,HIV-1亚型O感染病人中的HIV-1/HIV-2血清阴性。
*Loussert-Ajaka I.,Chairk. ML.,Korber B.,Letourneur F.,Gomans E.,Allen E.,Ly Td.,Brun-Vezinet F.,Simon F.及S.Saragosti,病毒学杂志,1995,69,5640-5649,从居信在法车的喀麦隆病人身上分离的HIV1型O族毒株的变异性。
*Murphy,E.,B.Korber,Georgs-Courbot,MC.,You B.,Pinter A.,cook D.,Loeml1/MP.,Georges A.,Mathiot C.,Barr*-Sinoussi F.,及M.Girard,艾滋病研究与人类逆转录病毒(AIDS Res。Hum.Retroviruses),1993,9997-1006,来自中非共和国的人类免疫缺陷病毒1型V3区序列的多样性。
*G.Myers,艾滋病研究与人类逆转录病毒,1994,10,11,1317-1324,艾滋病10周年评述。
*Nkengasong,J.N.,Janssens W.,Heyndrickx L.,Fransen K.,Ndumbe PM.,Motte J.,Leonaers A.,Ngolle M.,Ayuk J.,Poit P.,及G.Van der Groen,艾滋病1994,8,1405-1412,喀麦隆HIV-1的基因型亚型。
*Sharp P.M.,等人,艾滋病,1994,8,增刊1,S27-S42,人类免疫缺陷病毒的起源与多样性。
*Simon,F.,T.D.Ly,A.Ballou-Beaufils,V.Schneider-Fauveau,J.de Saint-Martin,I。L-Ajaka,M.L. Chaix,S.Saragosti,a.M.Courouc*,D.Ingrand,C.Janot,及F.Brun-Vezinet,艾滋病,1994,8,1628-1629,抗-HIV-1亚型O抗体筛查试剂盒的敏感性。
*Zekeng,L.,L.Guttlet,E.Afane Ze,A.Sam-Abbenyi,G,Mbouni,Essomba,E.Mpoudi-Noglle,M.Mouny-lobbe,J.B.Tapko,及L.Kaptue,艾滋病,1994,8,1626-1628,喀麦隆HIV-1亚型O的流行率初步结果。
从上文可以看出,本发明绝不限于刚刚清楚地予以描述的实施方案;相反,它包括所有的、技术人员可能想到的变化,而不背离本发明的内容或范围。
序列表(1)一般信息(i)申请人(A)姓名INSTUTUT NATIONAL DE LA SANTE ET DE LATRCHERCHE MEDICALE-INSERM(B)街道101 rue DE TOLBIAC(C)城市巴黎(E)国家法国(F)邮政编码(ZIP)75654 CEDEX 13(A)姓名ASSISTANCE PUBLIQUE-HOPITAUS DE PARIS(B)街道3 avenue Victoria(C)城市巴黎(E)国家法国(F)邮政编码(ZIP)75100 RP(A)姓名INSTITUT PASTEUR(B)街道28 rue du Docteur Rous(C)城市巴黎(E)国家法国(F)邮政编码(ZIP)75724 Cedex 15(A)姓名MAUCLERE Philippe(B)街道2 rue Buhan(C)城市Bordeaux(E)国家法国(F)邮政编码(ZIP)33000(A)姓名LOUSSERT AJAKA Ibtissam(B)街道26 avenue de la Republique(C)城市SARTROUVILLE(E)国家法国(F)邮政编码(ZIP)78500(A)姓名STMON francois(B)街道8 rue Germain Pilon(C)城市巴黎(E)国家法国(F)邮政编码(ZIP)75018(A)姓名SARAGOSTI Sentob(B)街道69 bis rue do Billancourt(C)城市BOULOGNE BILLANCOURT(E)国家法国(F)邮政编码(ZIP)92100(A)姓名BARRE-SINOUSSL Francoise(B)街道104 le capricorne,50 rue d’Erevan(C)城市ISSY LES MOULINEAUX(E)国家法国(F)邮政编码(ZIP)92130(ii)发明名称非-M、非-O HIV-1毒株、片段及应用(iii)序列数目61(iv)计算机可读信息(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,Version#1.30(EPO)(2)SEQ ID NO1的信息(i)序列特征(A)长度9183个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(xi)SEQ ID NO1的序列描述CTTCTCGCTT GTACTGGGTC TCTCTTGCTG GACCAGATTA GAGCCTGGGA GCTCTCTGGC60TAGCAGGGAA CCCACTGCTT AAGCCTCAAT AAAGCTTGCC TTGAGTGCTA AAGTGGTGTG 120TGCCCATCCA TTCGGTAACT CTGGTACCTA GAGATCCCTC AGACCATCTA GACTGAGTGA 180AAAATCTCTA GCAGTGGCGC CCGAACAGGG ACTTGAAAAC GAAAGTAGAA CCGGAGGCTG 240AATCTCTCGA CGCAGGACTC GGCTCGTTGG TGCACACAGC GAGAGGCGAG GCGGCGGAAG 300TGTGAGTACG CAATTTTGAC TGGCGGTGGC CAGAAAGTAG GAGAGAGGAT GGGTGCGAGA 360GCGTCAGTGT TAACAGGGGG AAAATTAGAT CAATGGGAAT CAATTTATTT GAGACCAGGG 420GGAAAGAAAA AATACAGAAT GAAACATTTA GTATGGGCAA GCAGGGAGCT GGAAAGATTC 480GCTTGTAACC CAGGTCTCAT GGACACAGCG GACGGCTGTG CCAAGTTACT AAATCAATTA 540GAACCAGCTC TCAAGACAGG GTCAGAAGAA CTGCGCTCTT TATATAACGC TCTAGCAGTT 600CTTTATTGTG TCCATAGTAG GATACAGATA CACAACACAC AGGAAGCTTT GGACAAGATA 660AAAGAGAAAC AGGAACAGCA CAAGCCCGAG CCAAAAAACC CAGAAGCAGG GGCAGCGGCA 720GCAACTGATA GCAATATCAG TAGGAATTAT CCTCTAGTCC AGACTGCTCA AGGACAAATG 780GTACATCAGC CGCTGACACC CAGAACCTTA AATGCTTGGG TGAAAGTGAT AGAGGAGAAG 840GCCTTTAGTC CAGAAGTAAT ACCAATGTTT ATGGCCTTGT CAGAAGGGGC AACGCCCTCA 900GATCTAAATA CTATGTTAAA TACAGTAGGG GGACATCAGG CAGCAATGCA GATGCTGAAG 960GAAGTCATCA ATGAGGAAGC AGCAGACTGG GATAGGACAC ATCCAGTCCC TGTGGGACCA 1020CTACCCCCAG GGCAACTGAG AGACCCTAGA GGAAGTGATA TAGCAGGAAC AACTAGCACC 1080CTGGCAGAAC AGGTGGCTTG GATGACTGCT AATCCTCCTG TTCCAGTAGG AGATATTTAT 1140AGAAGATGGA TAGTCCTGGG GTTAAACAGA ATTGTGAGAA TGTATAGTCC TGTCAGCATT 1200CTAGAGATCA AACAAGGACC AAAAGAACCC TTCAGAGACT ATGTAGACAG GTTCTACAAA 1260ACTCTAAGAG CAGAGCAGGC AACACAGGAA GTAAAGAATT GGATGACAGA AACACTCTTA 1320GTACAAAATG CAAACCCAGA TTGTAAACAG CTCCTAAAAG CATTAGGGCC AGGAGCTACC 1380TTAGAAGAGA TGATGACGGC CTGCCAGGGA GTGGGGGGAC CAGCACATAA GGCAAGAGTG 1440CTAGCAGAGG CTATGTCACA GGTGCAGCAG CCAACAACTA GTGTCTTTGC ACAAAGGGGA 1500AACTTTAAAG GCATAAGGAA ACCCATTAAA TGTTTCAATT GTGGCAAAGA GGGCCATTTG 1560GCAAGAAACT GTAAGGCCCC TAGAAGAGGA GGCTGTTGGA AGTGTGGGCA AGAAGGACAT 1620CAAATGAAAG ATTGTAAAAA TGAAGGAAGA CAGGCTAATT TTTTAGGGAA GAGCTGGTCT 1680CCCTTCAAAG GGAGACCAGG AAACTTCCCC CAGACAACAA CAAGGAAAGA GCCCACAGCC 1740CCGCCACTAG AGAGTTATGG GTTTCAGGAG GAGAAGAGCA CACAGGGGAA GGAGATGCAG 1800GAGAACCAGG AGAGGACAGA GAACTCTCTG TACCCACCTT TAACTTCCCT CAGATCACTC 1860TTTGGCAACG ACCCGTCATC ACAGTAAAAA TAGGGAAAGA AGTAAGAGAA GCTCTTTTAG 1920ATACAGGAGC TGATGATACA GTAATAGAAG AGCTACAATT AGAGGGAAAA TGGAAACCAA 1980AAATGATAGG AGGAATTGGA GGATTTATCA AAGTGAGACA ATATGATAAT ATAACAGTAG 2040ACATACAGGG AAGAAAAGCA GTTGGTACAG TATTAGTAGG ACCAACACCT GTTAATATTA 2100TAGGAAGAAA TCTTTTAACC CAGATTGGCT GTACTTTAAA TTTTCCAATA AGTCCTATTG 2160AAACTGTACC AGTAAAATTA AAACCAGGAA TGGATGGCCC AAAGGTAAAA CAATGGCCTT 2220TGACAACAGA AAAAATAGAG GCATTAAGAG AAATTTGTAC AGAAATGGAA AAGGAAGGAA 2280AAATTTCTAG AATAGGGCCT GAGAATCCAT ATAACACTCC AATTTTTGCT ATAAAAAAGA 2340AAGATAGCAC TAAATGGAGA AAATTAGTAG ATTTCAGGGA ATTAAATAAA AGGACCCAAG 2400ATTTTTGGGA AGTGCAGCTA GGAATTCCAC ATCCAGCAGG ATTAAAGCAG AAAAAATCAG 2460TGACAGTTTT GGATGTAGGA GATGCTTATT TTTCATGTCC CTTGGACAAA GATTTTAGAA 2520AGTATACAGC TTTTACCATA CCTAGTATAA ACAATGAGAC ACCTGGTATT AGATACCAGT 2580ATAATGTGCT GCCACAAGGC TGGAAAGGGT CACCAGCAAT TTTTCAGAGT ACAATGACAA 2640AAATTCTAGA ACCATTCAGA GAGAAACATC CAGAGATAAT CATTTACCAG TACATGGATG 2700ACCTCTATGT GGGATCTGAC TTAGAACTAG CACAACATAG AGAGGCAGTA GAAGACCTTA 2760GAGATCATCT TTTGAAGTGG GGCTTTACGA CCCCTGACAA AAAACATCAG AAGGAACCCC 2820CGTTCCTCTG GATGGGATAT GAACTCCATC CAGACAAATG GACAGTCCAG CCAATAAAGT 2880TACCAGAAAA GGATGTATGG ACTGTCAATG ATATACAGAA ATTAGTAGGA AAGTTAAATT 2940GGGCAAGTCA GATCTATCCA GGAATCAGAG TAAAACAGCT CTGTAAATTA ATCAGAGGAA 3000CCAAAGCTTT GACAGAAGTA GTCAACTTTA CAGAAGAAGC AGAATTAGAA CTAGCAGAAA 3060ACAGGGAGAT ATTAAAAGAA CCCCTGCATG GAGTCTATTA TGACCCAGGA AAAGAATTAG 3120TAGCAGAAAT TCAAAAGCAA GGACAAGGTC AGTGGACATA TCAGATTTAT CAGGAGTTAC 3180ATAAAAATTT AAAAACAGGA AAGTATGCAA AAATGAGATC TGCCCATACT AATGATATAA 3240AACAGTTAGT TGAAGTGGTA AGGAAAGTGG CAACAGAAAG TATAGTAATT TGGGGAAAGA 3300CTCCTAAATT TAGATTACCA GTACAAAAGG AAGTGTGGGA GGCATGGTGG ACCGATCATT 3360GGCAAGCAAC TTGGATTCCT GAGTGGGAAT TTGTCAACAC TCCTCCCCTT GTAAAATTAT 3420GGTATCAGTT AGAAACAGAG CCAATCAGTG GGGCAGAAAC TTTCTATGTA GATGGAGCAG 3480CTAATAGGGA AACAAAATTG GGAAAAGCAG GTTTTGTGAC AGATAGGGGA AGACAGAAAG 3540TGGTCTCTAT TGCAGACACC ACCAATCAAA AGGCTGAGTT ACAAGCTATC CTTATGGCCT 3600TACAAGAGTC AGGACGGGAT GTAAACATAG TCACTGACTC TCAGTATGCT ATGGGAATAA 3660TTCATTCACA GCCAGATAAA AGTGAATCAG AATTGGTGAG CCAAATAATA GAAGAGCTCA 3720TAAAAAAGGA AAGAGTTTAT CTCTCTTGGG TACCTGCACA TAAAGGTATT GGAGGAAATG 3780AGCAGGTAGA CAAATTAGTT AGCTCAGGAA TTAGAAAAAT ATTATTCCTA GATGGTATAG 3840AAAAAGCCCA AGAAGATCAT GACAGATATC ACAGCAATTG GAAAGCAATG GCCAGTGATT 3900TTAACTTACC CCCCATAGTG GCAAAAGAAA TAGTAGCCAG CTGTGACAAA TGCCAGCTAA 3960AAGGGGAAGC CATGCATGGA CAGGTCAATT GTAGTCCAGG AGTGTGGCAA TTAGATTGTA 4020CACACTTAGA GGGAAAAATC ATCCTTGTGG CGGTCCATGT GGCCAGTGGC TACTTAGAAG 4080CAGAAGTTAT TCCTGCAGAG ACAGGACAGG AAACAGCATA TTTTATTTTA AAGTTAGCTG 4140GAAGATGGCC AGTAAAAGTT ATACACACTG ATAATGGATC CAATTTCACT AGTGCCACTG 4200TAAAAGCAGC CTGTTGGTGG GCAAATATCA AACAGGAATT TGGGATACCC TACAATCCTC 4260AAAGTCAGGG AGCAGTAGAG TCCATGAATA AAGAATTAAA GAAAATTATA GGACAAATCA 4320GAGATCAAGC AGAACATCTA AAGACAGCAG TGCAAATGGC GGTTTTCATT CACAATTTTA 4380AAAGAAAAGG GGGGATTGGG GGGTACACTG CAGGGGAAAG AATAATAGAC ATAATAGCAA 4440CAGACATACA GACAACAAAT TTACAAACAC AAATTTTAAA AGTTCAAAAT TTTCGGGTTT 4500ATTACAGAGA CAGCAGAGAT CCCATTTGGA AAGGACCAGC CAAACTTCTG TGGAAAGGAG 4560AAGGGGCAGT GGTAATTCAA GATAACGGGG ATATAAAAGT AGTCCCACGT AGGAAAGCAA 4620AAATAATTAG GGATTATGGA AAACAGATGG CAGGTGATGG TTGTGTGGCA AGTGGACAGG 4680ATGAAAATCA GGAAATGGAA TAGCTTAGTA AAACATCATA TGTATGTGTC AAAAAAGGCA 4740AAAGGATGGT ATTATAGACA TCATTATGAA ACACATCACC CAAAAATAAG TTCAGAAGTA 4800CATATCCCAG TAGGTCAGGC AAGATTAGTG ACAGTCACTT ATTGGGGGCT AACAACAGGA 4860GAACAGTCTT GGCATCTAGG ACATGGAGTA TCCATAGAAT GGAGACTAAG AAAATACAAG 4920ACACAAGTTG ATCCTGAAAT GGCAGACAAG CTAATACATC TTCATTATTT TGATTGTTTT 4980ACAGCCTCTG CCATAAGGCA AGCGGTCTTA GGGAGACCAG TATTACCTAG GTGTGAATAT 5040CCAGCAGGGC ACAAACAGGT AGGCACCCTA CAATATCTAG CACTAACAGC CTGGGTGGGA 5100GCAAAGAAGA GAAAGCCACC CTTACCTAGT GTGACTAAGC TAACAGAAGA TAGATGGAAC 5160GAGCACCAGA AGATGCAGGG CCACAGAGGG AACCCTATAA TGAATGGGCA CTAGAATTAT 5220TAGAAGAATT AAAAAATGAA GCTGTGCGCC ATTTTCCAAG GATTTGGCTA CATGGGTTAG 5280GACAACACAT CTATAACACA TATGGAGACA CCTGGGAGGG GGTAGAGGCA ATTATCAGGA 5340TACTACAACA ATTACTGTTT ATCCATTATA GGATTGGCTG CCAGCACAGC AGAATAGGGA 5400TCACTCCTCA AAGGAGAAGG AATGGAACCA GTAGATCCTA GATTAGAGCC CTGGAATCAT 5460CCAGGAAGCC AACCTAAAAC AGCTTGCAAT AATTGCTATT GTAAAAGATG TTGCTATCAC 5520TGCTTATATT GCTTCACAAA GAAAGGCTTA GGCATCTCAT ATGGCAGGAA GAAGCGGAGT 5580CAACGACGAA GAACTCCTCA GAGCAGTAAG AGTCATCAAG ATCTTATACC AGAGCAGTAA 5640GTAAAACCTG TATATATGCT GTCATTGGGA TTCATAGCGT TAGGAGCAGC AGTTAGCATA 5700GCAGTAATAG TCTGGGCATT ACTATATAGA GAATATAAGA AAATAAAATT GCAGGAAAAA 5760ATAAAACACA TAAGACAGAG AATAAGAGAA AGAGAAGAAG ATAGTGGCAA TGAAAGTGAT 5820GGGGATGCAG AGTGGTTGGA TGGGGATGAA GAGTGGTTGG TTACTCTTCT ATCTTCTAGT 5880AAGCTTGATC AAGGTAATTG GGTCTGAACA ACATTGGGTA ACAGTGTACT ATGGGGTACC 5940AGTATGGAGA GAAGCAGAGA CAACTCTTTT CTGTGCTTCA GATGCTAAAG CCCATAGTAC 6000AGAGGCTCAC AACATCTGGG CCACACAAGC ATGTGTTCCT ACTGATCCCA ATCCACAAGA 6060AGTGCTATTA CCCAATGTAA CTGAAAAATT TAATATGTGG GAAAATAAAA TGGCAGACCA 6120AATGCAAGAG GATATTATCA GTCTGTGGGA ACAGAGCTTA AAGCCCTGTG TTAAATTAAC 6180CCCATTATGT GTAACTATGC TTTGTAACGA TAGCTATGGG GAGGAAAGGA ACAATACAAA 6240TATGACAACA AGAGAACCAG ACATAGGATA CAAAAAATG AAAAATTGCT CATTCAATGC 6300AACCACTGAG CTAACAGATA AAAAGAAGCA AGTTTACTCT CTGTTTTATG TAGAAGATGT 6360AGTACCAATC AATGCCTATA ATAAAACATA TAGGCTAATA AATTGTAATA CCACAGCTGT 6420GACACAAGCT TGTCCTAAGA CTTCCTTTGA GCCAATTCCA ATACATTACT GTGCACCACC 6480AGGCTTTGCC ATTATGAAAT GTAATGAAGG AAACTTTAGT GGAAATGGAA GCTGTACAAA 6540TGTGAGTACT GTACAATGCA CACATGGAAT AAAGCCAGTG ATATCCACTC AGTTAATCCT 6600AAATGGAAGC TTAAATACAG ATGGAATTGT TATTAGAAAT GATAGTCACA GTAATCTGTT 6660GGTGCAATGG AATGAGACAG TGCCAATAAA TTGTACAAGG CCAGGAAATA ATACAGGAGG 6720ACAGGTGCAG ATAGGACCTG CTATGACATT TTATAACATA GAAAAAATAG TAGGAGACAT 6780TAGACAAGCA TACTGTAATG TCTCTAAAGA ACTATGGGAA CCAATGTGGA ATAGAACAAG 6840AGAGGAAATA AAGAAAATCC TGGGGAAAAA CAACATAACC TTCAGGGCTC GAGAGAGGAA 6900TGAAGGAGAC CTAGAAGTGA CACACTTAAT GTTCAATTGT AGAGGAGAGT TTTTCTATTG 6960TAACACTTCC AAATTATTTA ATGAGGAATT ACTTAACGAG ACAGGTGAGC CTATTACTCT 7020GCCTTGTAGA ATAAGACAGA TTGTAAATTT GTGGACAAGG GTAGGAAAAG GAATTTATGC 7080ACCACCAATT CGGGGAGTTC TTAACTGTAC CTCCAATATT ACTGGACTGG TTCTAGAATA 7140TAGTGGTGGG CCTGACACCA AGGAAACAAT AGTATATCCC TCAGGAGGAA ACATGGTTAA 7200TCTCTGGAGA CAAGAGTTGT ATAAGTACAA AGTAGTTAGC ATAGAACCCA TAGGAGTAGC 7260ACCAGGTAAA GCTAAAAGAC GCACAGTGAG TAGAGAAAAA AGAGCAGCCT TTGGACTAGG 7320TGCGCTGTTT CTTGGGTTTC TTGGAGCAGC AGGGAGCACT ATGGGCGCAG CGTCAATAAC 7380GCTGACGGTA CAGGCCCGGA CATTATTATC TGGGATAGTG CAACAGCAGA ATATTCTGTT 7440GAGAGCAATA GAGGCGCAAC AACATTTGTT GCAACTCTCA ATCTGGGGCA TTAAACAGCT 7500CCAGGCAAAA GTCCTTGCTA TAGAAAGATA CCTTAGGGAT CAGCAAATCC TAAGTCTATG 7560GGGCTGCTCA GGAAAAACAA TATGCTATAC CACTGTGCCT TGGAATGAGA CTTGGAGCAA 7620CAATACCTCT TATGATACAA TCTGGAATAA TTTAACCTGG CAACAATGGG ATGAGAAAGT 7680AAGAAACTAT TCAGGTGTCA TTTTTGGACT TATAGAACAG GCACAAGAAC AACAGAACAC 7740AAATGAGAAA TCACTCTTGG AATTGGATCA ATGGGACAGT CTGTGGAGCT GGTTTGGTAT 7800TACAAAATGG CTGTGGTATA TAAAAATAGC TATAATGATA GTAGCAGGCA TTGTAGGCAT 7860AAGAATCATA AGTATAGTAA TAACTATAAT AGCAAGAGTT AGGCAGGGAT ATTCTCCCCT 7920TTCGTTGCAG ACCCTTATCC CAACAGCAAG GGGACCAGAC AGGCCAGAAG AAACAGAAGG 7980AGGCGTTGGA GAGCAAGACA GAGGCAGATC CGTGCGATTA GTGAGCGGAT TCTCAGCTCT 8040TGTCTGGGAG GACCTCCGGA ACCTGTTGAT CTTCCTCTAC CACCGCTTGA CAGACTCACT 8100CTTGATACTG AGGAGGACTC TGGAACTCCT GGGACAGAGT CTCAGCAGGG GACTGCAACT 8160ACTGAATGAA CTCAGAACAC ACTTGTGGGG AATACTTGCA TATTGGGGAA AAGAGTTAAG 8220GGATAGTGCT ATCAGCTTGC TTAATACAAC AGCTATTGTA GTAGCAGAAG GAACAGATAG 8280GATTATAGAA TTAGCACAAA GAATAGGAAG GGGAATATTA CACATACCTA GAAGAATCAG 8340ACAAGGCCTA GAAAGAGCAC TGATATAAGA TGGGAAAGAT TTGGTCAAAG AGCAGCCTAG 8400TAGGATGGCC AGAAATCAGA GAAAGAATGA GAAGACAAAC GCAAGAACCA GCAGTAGAGC 8460CAGCAGTAGG AGCAGGAGCA GCTTCTCAAG ATCTAGCTAA TCGAGGGGCC ATCACCATAA 8520GAAATACTAG AGACAATAAT GAAAGTATAG CTTGGCTAGA AGCACAAGAA GAAGAAGAGG 8580AAGTAGGCTT TCCAGTACGC CCTCAGGTAC CATTAAGGCC AATAACCTAT AAACAGGCTT 8640TTGATCTTTC CTTCTTTTTA AAAGATAAGG GGGGACTGGA AGGGCTAGTT TGGTCCAGAA 8700AAAGGCAAGA TATTCTAGAC CTCTGGATGT ATCACACACA AGGCATCCTC CCTGACTGGC 8760ATAACTACAC ACCAGGGCCA GGAATTAGAT ACCCCGTAAC CTTTGGATGG TGCTTCAAAC 8820TAGTACCATT GTCAGCTGAA GAAGTAGAAG AGGCTAATGA AGGAGACAAC AATGCCCTCT 8880TACACCCCAT ATGTCAACAT GGAGCAGATG ATGATCATAA AGAAGTGTTG GTGTGGCGAT 8940TTGACAGCTC CCTAGCAAGA AGACATGTAG CAAGAGAGCT GCATCCGGAG TTTTACAAGA 9000ACTGCTGACA AGGGACTTTA CTGCTGACAA GGGACTTTAT ACTTGGGGAC TTTCCGCCAG 9060GGACTTTCCA GGGAGGTGTG GTTGGGGGAG TGGCTTGCCC TCAGAGCTGC ATAAAAGCAG 9120CCGCTTCTCG CTTGTACTGG GTCTCTCTTG CTGGACCAGA TTAGAGTCTG GGAGCATATT 9180GGG9183(2)SEQ ID NO2的信息(i)序列特征(A)长度813个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(xi)SEQ ID NO2的序列描述TTGGAAGGGC TAGTTTGGTC CAGAAAAAGG CAAGATATTC TAGACCTCTG GATGTATCAC60ACACAAGGCA TCCTCCCTGA CTGGCATAAC TACACACCAG GGCCAGGAAT TAGATACCCC 120GTAACCTTTG GATGGTGCTT CAAACTAGTA CCATTGTCAG CTGAAGAAGT AGAAGAGGCT 180AATGAAGGAG ACAACAATGC CCTCTTACAC CCCATATGTC AACATGGAGC AGATGATGAT 240CATAAAGAAG TGTTGGTGTG GCGATTTGAC AGCTCCCTAG CAAGAAGACA TGTAGCAAGA 300GAGCTGCATC CGGAGTTTTA CAAGAACTGC TGACAAGGGA CTTTACTGCT GACAAGGGAC 360TTTATACTTG GGGACTTTCC GCCAGGGACT TTCCAGGGAG GTGTGGTTGG GGGAGTGGCT 420TGCCCTCAGA GCTGCATAAA AGCAGCCGCT TCTCGCTTGT ACTGGGTCTC TCTTGCTGGA 480CTATACAGAT TAGAGCCTGG GAGCTCTCTG GCTAGCAGGG AACCCACTGC TTAAGCCTCA 540ATAAATACAG CTTGCCTTGA GTGCTAAAGT GGTGTGTGCC CATCCATTCG GTAACTCTGG 600TACCTAGAGA ATCCCTCAGA CCATCTAGAC TGAGTGAAAA ATCTCTAGCA GTGGCGCCCG 660AACAGGGACT TAGTTGAAAA CGAAAGTAGA ACCGGAGGCT GAATCTCTCG ACGCAGGACT 720CGGCTCGTTG GTGCACACAG CGAGAGGCGA GGCGGCGGAA GTGTGAGTAC GCAATTTTGA 780CTGGCGGTGG CCAGAAAGTA GGAGAGAGGG AGG813(2)SEQ ID NO3的信息(i)序列特征(A)长度1539个碱基对(B)类型核酸(C)链型单链
(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..1536(xi)SEQ ID NO3的序列描述ATG GGT GCG AGA GCG TCA GTG TTA ACA GGG GGA AAA TTA GAT CAA TGG48Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp1 5 10 15GAA TCA ATT TAT TTG AGA CCA GGG GGA AAG AAA AAA TAC AGA ATG AAA96Glu Ser Ile Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys20 25 30CAT TTA GTA TGG GCA AGC AGG GAG CTG GAA AGA TTC GCT TGT AAC CCA 144His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro35 40 45GGT CTC ATG GAC ACA GCG GAC GGC TGT GCC AAG TTA CTA AAT CAA TTA 192Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu50 55 60GAA CCA GCT CTC AAG ACA GGG TCA GAA GAA CTG CGC TCT TTA TAT AAC 240Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn65 70 75 80GCT CTA GCA GTT CTT TAT TGT GTC CAT AGT AGG ATA CAG ATA CAC AAC 288Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg Ile Gln Ile His Asn85 90 95ACA CAG GAA GCT TTG GAC AAG ATA AAA GAG AAA CAG GAA CAG CAC AAG 336Thr Gln Glu Ala Leu Asp Lys Ile Lys Glu Lys Gln Glu Gln His Lys100 105 110CCC GAG CCA AAA AAC CCA GAA GCA GGG GCA GCG GCA GCA ACT GAT AGC 384Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser115 120 125AAT ATC AGT AGG AAT TAT CCT CTA GTC CAG ACT GCT CAA GGA CAA ATG 432Asn Ile Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met130 135 140GTA CAT CAG CCG CTG ACA CCC AGA ACC TTA AAT GCT TGG GTG AAA GTG 480Val His Gln Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val145 150 155 160ATA GAG GAG AAG GCC TTT AGT CCA GAA GTA ATA CCA ATG TTT ATG GCC 528Ile Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Met Ala165 170 175TTG TCA GAA GGG GCA ACG CCC TCA GAT CTA AAT ACT ATG TTA AAT ACA 576Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr180 185 190GTA GGG GGA CAT CAG GCA GCA ATG CAG ATG CTG AAG GAA GTC ATC AAT624Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Val Ile Asn195 200 205GAG GAA GCA GCA GAC TGG GAT AGG ACA CAT CCA GTC CCT GTG GGA CCA672Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro210 215 220CTA CCC CCA GGG CAA CTG AGA GAC CCT AGA GGA AGT GAT ATA GCA GGA720Leu Pro Pro Gly Gln Leu Arg Asp Pro Arg Gly Ser Asp Ile Ala Gly225 230 235 240ACA ACT AGC ACC CTG GCA GAA CAG GTG GCT TGG ATG ACT GCT AAT CCT768Thr Thr Ser Thr Leu Ala Glu Gln Val Ala Trp Met Thr Ala Asn Pro245 250 255CCT GTT CCA GTA GGA GAT ATT TAT AGA AGA TGG ATA GTC CTG GGG TTA816Pro Val Pro Val Gly Asp Ile Tyr Arg Arg Trp Ile Val Leu Gly Leu260 265 270AAC AGA ATT GTG AGA ATG TAT AGT CCT GTC AGC ATT CTA GAG ATC AAA864Asn Arg Ile Val Arg Met Tyr Ser Pro Val Ser Ile Leu Glu Ile Lys275 280 285CAA GGA CCA AAA GAA CCC TTC AGA GAC TAT GTA GAC AGG TTC TAC AAA912Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys290 295 300ACT CTA AGA GCA GAG CAG GCA ACA CAG GAA GTA AAG AAT TGG ATG ACA960Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr305 310 315 320GAA ACA CTC TTA GTA CAA AAT GCA AAC CCA GAT TGT AAA CAG CTC CTA 1008Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Gln Leu Leu325 330 335AAA GCA TTA GGG CCA GGA GCT ACC TTA GAA GAG ATG ATG ACG GCC TGC 1056Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys340 345 350CAG GGA GTG GGG GGA CCA GCA CAT AAG GCA AGA GTG CTA GCA GAG GCT 1104Gln Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala355 360 365ATG TCA CAG GTG CAG CAG CCA ACA ACT AGT GTC TTT GCA CAA AGG GGA 1152Met Ser Gln Val Gln Gln Pro Thr Thr Ser Val Phe Ala Gln Arg Gly370 375 380AAC TTT AAA GGC ATA AGG AAA CCC ATT AAA TGT TTC AAT TGT GGC AAA 1200Asn Phe Lys Gly Ile Arg Lys Pro Ile Lys Cys Phe Asn Cys Gly Lys385 390 395 400GAG GGC CAT TTG GCA AGA AAC TGT AAG GCC CCT AGA AGA GGA GGC TGT 1248Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys405 410 415TGG AAG TGT GGG CAA GAA GGA CAT CAA ATG AAA GAT TGT AAA AAT GAA 1296Trp Lys Cys Gly Gln Glu Gly His Gln Met Lys Asp Cys Lys Asn Glu420 425 430GGA AGA CAG GCT AAT TTT TTA GGG AAG AGC TGG TCT CCC TTC AAA GGG 1344Gly Arg Gln Ala Asn Phe Leu Gly Lys Ser Tro Ser Pro Phe Lys Gly
435 440 445AGA CCA GGA AAC TTC CCC CAG ACA ACA ACA AGG AAA GAG CCC ACA GCC 1392Arg Pro Gly Asn Phe Pro Gln Thr Thr Thr Arg Lys Glu Pro Thr Ala450 455 460CCG CCA CTA GAG AGT TAT GGG TTT CAG GAG GAG AAG AGC ACA CAG GGG 1440Pro Pro Leu Glu Ser Tyr Gly Phe Gln Glu Glu Lys Ser Thr Gln Gly465 470 475 480AAG GAG ATG CAG GAG AAC CAG GAG AGG ACA GAG AAC TCT CTG TAC CCA 1488Lys Glu Met Gln Glu Asn Gln Glu Arg Thr Glu Asn Ser Leu Tyr Pro485 490 495CCT TTA ACT TCC CTC AGA TCA CTC TTT GGC AAC GAC CCG TCA TCA CAG 1536Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gln500 505 510TAA 1539(2)SEQ ID NO4的信息(i)序列特征(A)长度512个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO4的序列描述Met Gly Ala Arg Ala Ser Val Leu Thr Gly Gly Lys Leu Asp Gln Trp1 5 10 15Glu Ser Ile Tyr Leu Arg Pro Gly Gly Lys Lys Lys Tyr Arg Met Lys20 25 30His Leu Val Trp Ala Ser Arg Glu Leu Glu Arg Phe Ala Cys Asn Pro35 40 45Gly Leu Met Asp Thr Ala Asp Gly Cys Ala Lys Leu Leu Asn Gln Leu50 55 60Glu Pro Ala Leu Lys Thr Gly Ser Glu Glu Leu Arg Ser Leu Tyr Asn65 70 75 80Ala Leu Ala Val Leu Tyr Cys Val His Ser Arg Ile Gln Ile His Asn85 90 95Thr Gln Glu Ala Leu Asp Lys Ile Lys Glu Lys Gln Glu Gln His Lys100 105 110Pro Glu Pro Lys Asn Pro Glu Ala Gly Ala Ala Ala Ala Thr Asp Ser115 120 125Asn Ile Ser Arg Asn Tyr Pro Leu Val Gln Thr Ala Gln Gly Gln Met130 135 140Val His Gln Pro Leu Thr Pro Arg Thr Leu Asn Ala Trp Val Lys Val145 150 155 160Ile Glu Glu Lys Ala Phe Ser Pro Glu Val Ile Pro Met Phe Met Ala165 170 175Leu Ser Glu Gly Ala Thr Pro Ser Asp Leu Asn Thr Met Leu Asn Thr180 185 190Val Gly Gly His Gln Ala Ala Met Gln Met Leu Lys Glu Val Ile Asn195 200 205Glu Glu Ala Ala Asp Trp Asp Arg Thr His Pro Val Pro Val Gly Pro210 215 220Leu Pro Pro Gly Gln Leu Arg Asp Pro Arg Gly Ser Asp Ile Ala Gly225 230 235 240Thr Thr Ser Thr Leu Ala Glu Gln Val Ala Trp Met Thr Ala Asn Pro245 250 255Pro Val Pro Val Gly Asp Ile Tyr Arg Arg Trp Ile Val Leu Gly Leu260 265 270Asn Arg Ile Val Arg Met Tyr Ser Pro Val Ser Ile Leu Glu Ile Lys275 280 285Gln Gly Pro Lys Glu Pro Phe Arg Asp Tyr Val Asp Arg Phe Tyr Lys290 295 300Thr Leu Arg Ala Glu Gln Ala Thr Gln Glu Val Lys Asn Trp Met Thr305 310 315 320Glu Thr Leu Leu Val Gln Asn Ala Asn Pro Asp Cys Lys Gln Leu Leu325 330 335Lys Ala Leu Gly Pro Gly Ala Thr Leu Glu Glu Met Met Thr Ala Cys340 345 350Gln Gly Val Gly Gly Pro Ala His Lys Ala Arg Val Leu Ala Glu Ala355 360 365Met Ser Gln Val Gln Gln Pro Thr Thr Ser Val Phe Ala Gln Arg Gly370 375 380Asn Phe Lys Gly Ile Arg Lys Pro Ile Lys Cys Phe Asn Cys Gly Lys385 390 395 400Glu Gly His Leu Ala Arg Asn Cys Lys Ala Pro Arg Arg Gly Gly Cys405 410 415Trp Lys Cys Gly Gln Glu Gly His Gln Met Lys Asp Cys Lys Asn Glu
420 425 430Gly Arg Gln Ala Asn Phe Leu Gly Lys Ser Trp Ser Pro Phe Lys Gly435 440 445Arg Pro Gly Asn Phe Pro Gln Thr Thr Thr Arg Lys Glu Pro Thr Ala450 455 460Pro Pro Leu Glu Ser Tyr Gly Phe Gln Glu Glu Lys Ser Thr Gln Gly465 470 475 480Lys Glu Met Gln Glu Asn Gln Glu Arg Thr Glu Asn Ser Leu Tyr Pro485 490 495Pro Leu Thr Ser Leu Arg Ser Leu Phe Gly Asn Asp Pro Ser Ser Gln500 505 510(2)SEQ ID NO5的信息(i)序列特征(A)长度3045个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..3042(xi)SEQ ID NO5的序列描述TTT TTT AGG GAA GAG CTG GTC TCC CTT CAA AGG GAG ACC AGG AAA CTT 48Phe Phe Arg Glu Glu Leu Val Ser Leu Gln Arg Glu Thr Arg Lys Leu515 520 525CCC CCA GAC AAC AAC AAG GAA AGA GCC CAC AGC CCC GCC ACT AGA GAG 96Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu530 535 540TTA TGG GTT TCA GGA GGA GAA GAG CAC ACA GGG GAA GGA GAT GCA GGA144Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly545 550 555 560GAA CCA GGA GAG GAC AGA GAA CTC TCT GTA CCC ACC TTT AAC TTC CCT192Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro565 570 575CAG ATC ACT CTT TGG CAA CGA CCC GTC ATC ACA GTA AAA ATA GGG AAA240Gln Ile Thr Leu Trp Gln Arg Pro Val Ile Thr Val Lys Ile Gly Lys580 585 590GAA GTA AGA GAA GCT CTT TTA GAT ACA GGA GCT GAT GAT ACA GTA ATA288Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val Ile595 600 605GAA GAG CTA CAA TTA GAG GGA AAA TGG AAA CCA AAA ATG ATA GGA GGA336Glu Glu Leu Gln Leu Glu Gly Lys Trp Lys Pro Lys Met Ile Gly Gly610 615 620ATT GGA GGA TTT ATC AAA GTG AGA CAA TAT GAT AAT ATA ACA GTA GAC384Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Asn Ile Thr Val Asp625 630 635 640ATA CAG GGA AGA AAA GCA GTT GGT ACA GTA TTA GTA GGA CCA ACA CCT432Ile Gln Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro645 650 655GTT AAT ATT ATA GGA AGA AAT CTT TTA ACC CAG ATT GGC TGT ACT TTA480Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys Thr Leu660 665 670AAT TTT CCA ATA AGT CCT ATT GAA ACT GTA CCA GTA AAA TTA AAA CCA528Asn Phe Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro675 680 685GGA ATG GAT GGC CCA AAG GTA AAA CAA TGG CCT TTG ACA ACA GAA AAA576Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Thr Glu Lys690 695 700ATA GAG GCA TTA AGA GAA ATT TGT ACA GAA ATG GAA AAG GAA GGA AAA624Ile Glu Ala Leu Arg Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys705 710 715 720ATT TCT AGA ATA GGG CCT GAG AAT CCA TAT AAC ACT CCA ATT TTT GCT672Ile Ser Arg Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Ile Phe Ala725 730 735ATA AAA AAG AAA GAT AGC ACT AAA TGG AGA AAA TTA GTA GAT TTC AGG720Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg740 745 750GAA TTA AAT AAA AGG ACC CAA GAT TTT TGG GAA GTG CAG CTA GGA ATT768Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile755 760 765CCA CAT CCA GCA GGA TTA AAG CAG AAA AAA TCA GTG ACA GTT TTG GAT816Pro His Pro Ala Gly Leu Lys Gln Lys Lys Ser Val Thr Val Leu Asp770 775 780GTA GGA GAT GCT TAT TTT TCA TGT CCC TTG GAC AAA GAT TTT AGA AAG864Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys785 790 795 800TAT ACA GCT TTT ACC ATA CCT AGT ATA AAC AAT GAG ACA CCT GGT ATT912Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile
805 810 815AGA TAC CAG TAT AAT GTG CTG CCA CAA GGC TGG AAA GGG TCA CCA GCA960Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala820 825 830ATT TTT CAG AGT ACA ATG ACA AAA ATT CTA GAA CCA TTC AGA GAG AAA 1008Ile Phe Gln Ser Thr Met Thr Lys Ile Leu Glu Pro Phe Arg Glu Lys835 840 845CAT CCA GAG ATA ATC ATT TAC CAG TAC ATG GAT GAC CTC TAT GTG GGA 1056His Pro Glu Ile Ile Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly850 855 860TCT GAC TTA GAA CTA GCA CAA CAT AGA GAG GCA GTA GAA GAC CTC AGA 1104Ser Asp Leu Glu Leu Ala Gln His Arg Glu Ala Val Glu Asp Leu Arg865 870 875 880GAT CAT CTT TTG AAG TGG GGC TTT ACG ACC CCT GAC AAA AAA CAT CAG 1152Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gln885 890 895AAG GAG CCC CCG TTC CTC TGG ATG GGA TAT GAA CTC CAT CCA GAC AAA 1200Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys900 905 910TGG ACA GTC CAG CCA ATA AAG TTA CCA GAA AAG GAT GTA TGG ACT GTC 1248Trp Thr Val Gln Pro Ile Lys Leu Pro Glu Lys Asp Val Trp Thr Val915 920 925AAT GAT ATA CAG AAA TTA GTA GGA AAG TTA AAT TGG GCA AGT CAG ATC 1296Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile930 935 940TAT CCA GGA ATC AGA GTA AAA CAG CTC TGT AAA TTA ATC AGA GGA GCC 1344Tyr Pro Gly Ile Arg Val Lys Gln Leu Cys Lys Leu Ile Arg Gly Ala945 950 955 960AGA GCT TTG ACA GAA GTA GTC AAC TTT ACA GAA GAA GCA GAA TTA GAA 1392Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu965 970 975CTA GCA GAA AAC AGG GAG ATA TTA AAA GAA CCC CTG CAT GGA GTC TAT 1440Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Leu His Gly Val Tyr980 985 990TAT GAC CCA GGA AAA GAA TTA GTA GCA GAA ATT CAA AAG CAA GGA CAA 1488Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu Ile Gln Lys Gln Gly Gln995 10001005GGT CAG TGG ACA TAT CAG ATT TAT CAG GAG TTA CAT AAA AAT TTA AAA 1536Gly Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Leu His Lys Asn Leu Lys101010151020ACA GGA AAG TAT GCA AAA ATG AGA TCT GCC CAT ACT AAT GAT ATA AAA 1584Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp Ile Lys1025103010351040CAG TTA GTT GAA GTG GTA AGG AAA GTG GCA ACA GAA AGT ATA GTA ATT1632Gln Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser Ile Val Ile104510501055TGG GGA AAG ACT CCT AAA TTT AGA TTA CCA GTA CAA AAG GAA GTG TGG1680Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gln Lys Glu Val Trp106010651070GAG GCA TGG TGG ACC GAT CAT TGG CAA GCA ACT TGG ATT CCT GAG TGG1728Glu Ala Trp Trp Thr Asp His Trp Gln Ala Thr Trp Ile Pro Glu Trp107510801085GAA TTT GTC AAC ACT CCT CCC CTT GTA AAA TTA TGG TAT CAG TTA GAA1776Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu109010951100ACA GAG CCA ATC AGT GGG GCA GAA ACT TTC TAT GTA GAT GGA GCA GCT1824Thr Glu Pro Ile Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala1105111011151120AAT AGG GAA ACA AAA TTG GGA AAA GCA GGT TTT GTG ACA GAT AGG GGA1872Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly112511301135AGA CAG AAA GTG GTC TCT ATT GCA GAC ACC ACC AAT CAA AAG GCT GAG1920Arg Gln Lys Val Val Ser Ile Ala Asp Thr Thr Asn Gln Lys Ala Glu114011451150TTA CAA GCT ATC CTT ATG GCC TTA CAA GAG TCA GGA CGG GAT GTA AAC1968Leu Gln Ala Ile Leu Met Ala Leu Gln Glu Ser Gly Arg Asp Val Asn115511601165ATA GTC ACT GAC TCT CAG TAT GCT ATG GGA ATA ATT CAT TCA CAG CCA2016Ile Val Thr Asp Ser Gln Tyr Ala Met Gly Ile Ile His Ser Gln Pro117011751180GAT AAA AGT GAA TCA GAA TTG GTG AGC CAA ATA ATA GAA GAG CTC ATA2064Asp Lys Ser Glu Ser Glu Leu Val Ser Gln Ile Ile Glu Glu Leu Ile118511901195 1200AAA AAG GAA AGA GTT TAT CTC TCT TGG GTA CCT GCA CAT AAA GGT ATT2112Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly Ile120512101215GGA GGA AAT GAG CAG GTA GAC AAA TTA GTT AGC TCA GGA ATT AGA AAA2160Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly Ile Arg Lys122012251230ATA TTA TTC CTA GAT GGT ATA GAA AAA GCC CAA GAA GAT CAT GAC AGA2208Ile Leu Phe Leu Asp Gly Ile Glu Lys Ala Gln Glu Asp His Asp Arg123512401245TAT CAC AGC AAT TGG AAA GCA ATG GCC AGT GAT TTT AAC TTA CCC CCC2256Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro125012551260ATA GTG GCA AAA GAA ATA GTA GCC AGC TGT GAC AAA TGC CAG CTA AAA2304Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys1265127012751280GGG GAA GCC ATG CAT GGA CAG GTC AAT TGT AGT CCA GGA GTG TGG CAA2352Gly Glu Ala Met His Gly Gln Val Asn Cys Ser Pro Gly Val Trp Gln128512901295TTA GAT TGT ACA CAC TTA GAG GGA AAA ATC ATC CTT GTG GCG GTC CAT2400Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile Leu Val Ala Val His130013051310GTG GCC AGT GGC TAC TTA GAA GCA GAA GTT ATT CCT GCA GAG ACA GGA2448Val Ala Ser Gly Tyr Leu Glu Ala Glu Val Ile Pro Ala Glu Thr Gly131513201325CAG GAA ACA GCA TAT TTT ATT TTA AAG TTA GCT GGA AGA TGG CCA GTA2496Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala Gly Arg Trp Pro Val133013351340AAA GTT ATA CAC ACT GAT AAT GGA TCC AAT TTC ACT AGT GCC ACT GTA2544Lys Val Ile His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val1345 1350 13551360AAA GCA GCC TGT TGG TGG GCA AAT ATC AAA CAG GAA TTT GGG ATA CCC2592Lys Ala Ala Cys Trp Trp Ala Asn Ile Lys Gln Glu Phe Gly Ile Pro136513701375TAC AAT CCT CAA AGT CAG GGA GCA GTA GAG TCC ATG AAT AAA GAA TTA2640Tyr Asn Pro Gln Ser Gln Gly Ala Val Glu Ser Met Asn Lys Glu Leu138013851390AAG AAA ATT ATA GGA CAA ATC AGA GAT CAA GCA GAA CAT CTA AAG ACA2688Lys Lys Ile Ile Gly Gln Ile Arg Asp Gln Ala Glu His Leu Lys Thr139514001405GCA GTG CAA ATG GCG GTT TTC ATT CAC AAT TTT AAA AGA AAA GGG GGG2736Ala Val Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly141014151420ATT GGG GGG TAC ACT GCA GGG GAA AGA ATA ATA GAC ATA ATA GCA ACA2784Ile Gly Gly Tyr Thr Ala Gly Glu Arg Ile Ile Asp Ile Ile Ala Thr1425143014351440GAC ATA CAG ACA ACA AAT TTA CAA ACA CAA ATT TTA AAA GTT CAA AAT2832Asp Ile Gln Thr Thr Asn Leu Gln Thr Gln Ile Leu Lys Val Gln Asn144514501455TTT CGG GTT TAT TAC AGA GAC AGC AGA GAT CCC ATT TGG AAA GGA CCA2880Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro Ile Trp Lys Gly Pro146014651470GCC AAA CTT CTG TGG AAA GGA GAA GGG GCA GTG GTA ATT CAA GAT AAC2928Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn147514801485GGG GAT ATA AAA GTA GTC CCA CGT AGG AAA GCA AAA ATA ATT AGG GAT2976Gly Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp149014951500TAT GGA AAA CAG ATG GCA GGT GAT GGT TGT GTG GCA AGT GGA CAG GAT3024Tyr Gly Lys Gln Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gln Asp1505151015151520GAA AAT CAG GAA ATG GAA TAG3045Glu Asn Gln Glu Met Glu1525(2)SEQ ID NO6的信息(i)序列特征(A)长度1014个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO6的序列描述Phe Phe Arg Glu Glu Leu Val Ser Leu Gln Arg Glu Thr Arg Lys Leu1 5 10 15Pro Pro Asp Asn Asn Lys Glu Arg Ala His Ser Pro Ala Thr Arg Glu20 25 30Leu Trp Val Ser Gly Gly Glu Glu His Thr Gly Glu Gly Asp Ala Gly35 40 45Glu Pro Gly Glu Asp Arg Glu Leu Ser Val Pro Thr Phe Asn Phe Pro50 55 60Gln Ile Thr Leu Trp Gln Arg Pro Val Ile Thr Val Lys Ile Gly Lys65 70 75 80Glu Val Arg Glu Ala Leu Leu Asp Thr Gly Ala Asp Asp Thr Val Ile85 90 95Glu Glu Leu Gln Leu Glu Gly Lys Trp Lys Pro Lys Met Ile Gly Gly100 105 110Ile Gly Gly Phe Ile Lys Val Arg Gln Tyr Asp Asn Ile Thr Val Asp115 120 125Ile Gln Gly Arg Lys Ala Val Gly Thr Val Leu Val Gly Pro Thr Pro130 135 140Val Asn Ile Ile Gly Arg Asn Leu Leu Thr Gln Ile Gly Cys Thr Leu145 150 155 160Asn Phe Pro Ile Ser Pro Ile Glu Thr Val Pro Val Lys Leu Lys Pro165 170 175Gly Met Asp Gly Pro Lys Val Lys Gln Trp Pro Leu Thr Thr Glu Lys180 185 190Ile Glu Ala Leu Arg Glu Ile Cys Thr Glu Met Glu Lys Glu Gly Lys195 200 205Ile Ser Arg Ile Gly Pro Glu Asn Pro Tyr Asn Thr Pro Ile Phe Ala210 215 220Ile Lys Lys Lys Asp Ser Thr Lys Trp Arg Lys Leu Val Asp Phe Arg225 230 235 240Glu Leu Asn Lys Arg Thr Gln Asp Phe Trp Glu Val Gln Leu Gly Ile245 250 255Pro His Pro Ala Gly Leu Lys Gln Lys Lys Ser Val Thr Val Leu Asp260 265 270Val Gly Asp Ala Tyr Phe Ser Cys Pro Leu Asp Lys Asp Phe Arg Lys275 280 285Tyr Thr Ala Phe Thr Ile Pro Ser Ile Asn Asn Glu Thr Pro Gly Ile290 295 300Arg Tyr Gln Tyr Asn Val Leu Pro Gln Gly Trp Lys Gly Ser Pro Ala305 310 315 320Ile Phe Gln Ser Thr Met Thr Lys Ile Leu Glu Pro Phe Arg Glu Lys325 330 335His Pro Glu Ile Ile Ile Tyr Gln Tyr Met Asp Asp Leu Tyr Val Gly340 345 350Ser Asp Leu Glu Leu Ala Gln His Arg Glu Ala Val Glu Asp Leu Arg355 360 365Asp His Leu Leu Lys Trp Gly Phe Thr Thr Pro Asp Lys Lys His Gln370 375 380Lys Glu Pro Pro Phe Leu Trp Met Gly Tyr Glu Leu His Pro Asp Lys385 390 395 400Trp Thr Val Gln Pro Ile Lys Leu Pro Glu Lys Asp Val Trp Thr Val405 410 415Asn Asp Ile Gln Lys Leu Val Gly Lys Leu Asn Trp Ala Ser Gln Ile420 425 430Tyr Pro Gly Ile Arg Val Lys Gln Leu Cys Lys Leu Ile Arg Gly Ala
435 440 445Arg Ala Leu Thr Glu Val Val Asn Phe Thr Glu Glu Ala Glu Leu Glu450 455 460Leu Ala Glu Asn Arg Glu Ile Leu Lys Glu Pro Leu His Gly Val Tyr465 470 475 480Tyr Asp Pro Gly Lys Glu Leu Val Ala Glu Ile Gln Lys Gln Gly Gln485 490 495Gly Gln Trp Thr Tyr Gln Ile Tyr Gln Glu Leu His Lys Asn Leu Lys500 505 510Thr Gly Lys Tyr Ala Lys Met Arg Ser Ala His Thr Asn Asp Ile Lys515 520 525Gln Leu Val Glu Val Val Arg Lys Val Ala Thr Glu Ser Ile Val Ile530 535 540Trp Gly Lys Thr Pro Lys Phe Arg Leu Pro Val Gln Lys Glu Val Trp545 550 555 560Glu Ala Trp Trp Thr Asp His Trp Gln Ala Thr Trp Ile Pro Glu Trp565 570 575Glu Phe Val Asn Thr Pro Pro Leu Val Lys Leu Trp Tyr Gln Leu Glu580 585 590Thr Glu Pro Ile Ser Gly Ala Glu Thr Phe Tyr Val Asp Gly Ala Ala595 600 605Asn Arg Glu Thr Lys Leu Gly Lys Ala Gly Phe Val Thr Asp Arg Gly610 615 620Arg Gln Lys Val Val Ser Ile Ala Asp Thr Thr Asn Gln Lys Ala Glu625 630 635 640Leu Gln Ala Ile Leu Met Ala Leu Gln Glu Sar Gly Arg Asp Val Asn645 650 655Ile Val Thr Asp Ser Gln Tyr Ala Met Gly Ile Ile His Ser Gln Pro660 665 670Asp Lys Ser Glu Ser Glu Leu Val Ser Gln Ile Ile Glu Glu Leu Ile675 680 685Lys Lys Glu Arg Val Tyr Leu Ser Trp Val Pro Ala His Lys Gly Ile690 695 700Gly Gly Asn Glu Gln Val Asp Lys Leu Val Ser Ser Gly Ile Arg Lys705 710 715 720Ile Leu Phe Leu Asp Gly Ile Glu Lys Ala Gln Glu Asp His Asp Arg725 730 735Tyr His Ser Asn Trp Lys Ala Met Ala Ser Asp Phe Asn Leu Pro Pro740 745 750Ile Val Ala Lys Glu Ile Val Ala Ser Cys Asp Lys Cys Gln Leu Lys755 760 765Gly Glu Ala Met His Gly Gln Val Asn Cys Ser Pro Gly Val Trp Gln770 775 780Leu Asp Cys Thr His Leu Glu Gly Lys Ile Ile Leu Val Ala Val His785 790 795 800Val Ala Ser Gly Tyr Leu Glu Ala Glu Val Ile Pro Ala Glu Thr Gly805 810 815Gln Glu Thr Ala Tyr Phe Ile Leu Lys Leu Ala Gly Arg Trp Pro Val820 825 830Lys Val Ile His Thr Asp Asn Gly Ser Asn Phe Thr Ser Ala Thr Val835 840 845Lys Ala Ala Cys Trp Trp Ala Asn Ile Lys Gln Glu Phe Gly Ile Pro850 855 860Tyr Asn Pro Gln Ser Gln Gly Ala Val Glu Ser Met Asn Lys Glu Leu865 870 875 880Lys Lys Ile Ile Gly Gln Ile Arg Asp Gln Ala Glu His Leu Lys Thr885 890 895Ala Val Gln Met Ala Val Phe Ile His Asn Phe Lys Arg Lys Gly Gly900 905 910Ile Gly Gly Tyr Thr Ala Gly Glu Arg Ile Ile Asp Ile Ile Ala Thr915 920 925Asp Ile Gln Thr Thr Asn Leu Gln Thr Gln Ile Leu Lys Val Gln Asn930 935 940Phe Arg Val Tyr Tyr Arg Asp Ser Arg Asp Pro Ile Trp Lys Gly Pro945 950 955 960Ala Lys Leu Leu Trp Lys Gly Glu Gly Ala Val Val Ile Gln Asp Asn965 970 975Gly Asp Ile Lys Val Val Pro Arg Arg Lys Ala Lys Ile Ile Arg Asp980 985 990Tyr Gly Lys Gln Met Ala Gly Asp Gly Cys Val Ala Ser Gly Gln Asp995 10001005Glu Asn Gln Glu Met Glu1010(2)SEQ ID NO7的信息(i)序列特征(A)长度579个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..576(xi)SEQ ID NO7的序列描述ATG GAA AAC AGA TGG CAG GTG ATG GTT GTG TGG CAA GTG GAC AGG ATG 48Met Glu Asn Arg Trp Gln Val Met Val Val Trp Gln Val Asp Arg Met1015102010251030AAA ATC AGG AAA TGG AAT AGC TTA GTA AAA CAT CAT ATG TAT GTG TCA 96Lys Ile Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser103510401045AAA AAG GCA AAA GGA TGG TAT TAT AGA CAT CAT TAT GAA ACA CAT CAC 144Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His105010551060CCA AAA ATA AGT TCA GAA GTA CAT ATC CCA GTA GGT CAG GCA AGA TTA 192Pro Lys Ile Ser Ser Glu Val His Ile Pro Val Gly Gln Ala Arg Leu106510701075GTG ACA GTC ACT TAT TGG GGG CTA ACA ACA GGA GAA CAG TCT TGG CAT 240Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gln Ser Trp His108010851090CTA GGA CAT GGA GTA TCC ATA GAA TGG AGA CTA AGA AAA TAC AAG ACA 288Leu Gly His Gly Val Ser Ile Glu Trp Arg Leu Arg Lys Tyr Lys Thr1095110011051110CAA GTT GAT CCT GAA ATG GCA GAC AAG CTA ATA CAT CTT CAT TAT TTT 336Gln Val Asp Pro Glu Met Ala Asp Lys Leu Ile His Leu His Tyr Phe111511201125GAT TGT TTT ACA GCC TCT GCC ATA AGG CAA GCG GTC TTA GGG AGA CCA 384Asp Cys Phe Thr Ala Ser Ala Ile Arg Gln Ala Val Leu Gly Arg Pro113011351140GTA TTA CCT AGG TGT GAA TAT CCA GCA GGG CAC AAA CAG GTA GGC ACC 432Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gln Val Gly Thr114511501155CTA CAA TAT CTA GCA CTA ACA GCC TGG GTG GGA GCA AAG AAG AGA AAG 480Leu Gln Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys116011651170CCA CCC TTA CCT AGT GTG ACT AAG CTA ACA GAA GAT AGA TGG AAC GAG 528Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu1175118011851190CAC CAG AAG ATG CAG GGC CAC AGA GGG AAC CCT ATA ATG AAT GGG CAC 576His Gln Lys Met Gln Gly His Arg Gly Asn Pro Ile Met Asn Gly His119512001205TAG 579(2)SEQ ID NO8的信息(i)序列特征(A)长度192个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO8的序列描述Met Glu Asn Arg Trp Gln Val Met Val Val Trp Gln Val Asp Arg Met1 5 10 15Lys Ile Arg Lys Trp Asn Ser Leu Val Lys His His Met Tyr Val Ser20 25 30Lys Lys Ala Lys Gly Trp Tyr Tyr Arg His His Tyr Glu Thr His His35 40 45Pro Lys Ile Ser Ser Glu Val His Ile Pro Val Gly Gln Ala Arg Leu50 55 60Val Thr Val Thr Tyr Trp Gly Leu Thr Thr Gly Glu Gln Ser Trp His65 70 75 80Leu Gly His Gly Val Ser Ile Glu Trp Arg Leu Arg Lys Tyr Lys Thr85 90 95Gln Val Asp Pro Glu Met Ala Asp Lys Leu Ile His Leu His Tyr Phe100 105 110Asp Cys Phe Thr Ala Ser Ala Ile Arg Gln Ala Val Leu Gly Arg Pro115 120 125Val Leu Pro Arg Cys Glu Tyr Pro Ala Gly His Lys Gln Val Gly Thr130 135 140Leu Gln Tyr Leu Ala Leu Thr Ala Trp Val Gly Ala Lys Lys Arg Lys145 150 155 160Pro Pro Leu Pro Ser Val Thr Lys Leu Thr Glu Asp Arg Trp Asn Glu165 170 175His Gln Lys Met Gln Gly His Arg Gly Asn Pro Ile Met Asn Gly His180 185 190(2)SEQ ID NO9的信息(i)序列特征(A)长度288个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..285(xi)SEQ ID NO9的序列描述ATG GAA CGA GCA CCA GAA GAT GCA GGG CCA CAG AGG GAA CCC TAT AAT 48Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gln Arg Glu Pro Tyr Asn195 200 205GAA TGG GCA CTA GAA TTA TTA GAA GAA TTA AAA AAT GAA GCT GTG CGC 96Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg210 215 220CAT TTT CCA AGG ATT TGG CTA CAT GGG TTA GGA CAA CAC ATC TAT AAC 144His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Asn225 230 235 240ACA TAT GGA GAC ACC TGG GAG GGG GTA GAG GCA ATT ATC AGG ATA CTA 192Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala Ile Ile Arg Ile Leu245 250 255CAA CAA TTA CTG TTT ATC CAT TAT AGG ATT GGC TGC CAG CAC AGC AGA 240Gln Gln Leu Leu Phe Ile His Tyr Arg Ile Gly Cys Gln His Ser Arg260 265 270ATA GGG ATC ACT CCT CAA AGG AGA AGG AAT GGA ACC AGT AGA TCC 285Ile Gly Ile Thr Pro Gln Arg Arg Arg Asn Gly Thr Ser Arg Ser275 280 285TAG 288(2)SEQ ID NO10的信息(i)序列特征(A)长度95个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO10的序列描述Met Glu Arg Ala Pro Glu Asp Ala Gly Pro Gln Arg Glu Pro Tyr Asn1 5 10 15Glu Trp Ala Leu Glu Leu Leu Glu Glu Leu Lys Asn Glu Ala Val Arg20 25 30His Phe Pro Arg Ile Trp Leu His Gly Leu Gly Gln His Ile Tyr Asn35 40 45Thr Tyr Gly Asp Thr Trp Glu Gly Val Glu Ala Ile Ile Arg Ile Leu50 55 60Gln Gln Leu Leu Phe Ile His Tyr Arg Ile Gly Cys Gln His Ser Arg65 70 75 80Ile Gly Ile Thr Pro Gln Arg Arg Arg Asn Gly Thr Ser Arg Ser85 90 95(2)SEQ ID NO11的信息(i)序列特征(A)长度252个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..249(xi)SEQ ID NO11的序列描述ATG CTG TCA TTG GGA TTC ATA GCG TTA GGA GCA GCA GTT AGC ATA GCA48Met Leu Ser Leu Gly Phe Ile Ala Leu Gly Ala Ala Val Ser Ile Ala100 105 110GTA ATA GTC TGG GCA TTA CTA TAT AGA GAA TAT AAG AAA ATA AAA TTG96Val Ile Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys Ile Lys Leu115 120 125CAG GAA AAA ATA AAA CAC ATA AGA CAG AGA ATA AGA GAA AGA GAA GAA 144Gln Glu Lys Ile Lys His Ile Arg Gln Arg Ile Arg Glu Arg Glu Glu130 135 140GAT AGT GGC AAT GAA AGT GAT GGG GAT GCA GAG TGG TTG GAT GGG GAT 192Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp145 150 155GAA GAG TGG TTG GTT ACT CTT CTA TCT TCT AGT AAG CTT GAT CAA GGT 240Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gln Gly160 165 170 175AAT TGG GTC TGA 252Asn Trp Val(2)SEQ ID NO12的信息(i)序列特征(A)长度83个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO12的序列描述Met Leu Ser Leu Gly Phe Ile Ala Leu Gly Ala Ala Val Ser Ile Ala1 5 10 15Val Ile Val Trp Ala Leu Leu Tyr Arg Glu Tyr Lys Lys Ile Lys Leu20 25 30Gln Glu Lys Ile Lys His Ile Arg Gln Arg Ile Arg Glu Arg Glu Glu35 40 45Asp Ser Gly Asn Glu Ser Asp Gly Asp Ala Glu Trp Leu Asp Gly Asp50 55 60Glu Glu Trp Leu Val Thr Leu Leu Ser Ser Ser Lys Leu Asp Gln Gly65 70 75 80Asn Trp Val(2)SEQ ID NO13的信息(i)序列特征(A)长度306个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..303(xi)SEQ ID NO13的序列描述ATG GAA CCA GTA GAT CCT AGA TTA GAG CCC TGG AAT CAT CCA GGA AGC 48Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser85 90 95CAA CCT AAA ACA GCT TGC AAT AAT TGC TAT TGT AAA AGA TGT TGC TAT 96Gln Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr100 105 110 115CAC TGC TTA TAT TGC TTC ACA AAG AAA GGC TTA GGC ATC TCA TAT GGC 144His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly Ile Ser Tyr Gly120 125 130AGG AAG AAG CGG AGT CAA CGA CGA AGA ACT CCT CAG AGC AGT AAG AGT 192Arg Lys Lys Arg Ser Gln Arg Arg Arg Thr Pro Gln Ser Ser Lys Ser135 140 145CAT CAA GAT CTT ATA CCA GAG CAG CCC TTA TCC CAA CAG CAA GGG GAC 240His Gln Asp Leu Ile Pro Glu Gln Pro Leu Ser Gln Gln Gln Gly Asp150 155 160CAG ACA GGC CAG AAG AAA CAG AAG GAG GCG TTG GAG AGC AAG ACA GAG 288Gln Thr Gly Gln Lys Lys Gln Lys Glu Ala Leu Glu Ser Lys Thr Glu165 170 175GCA GAT CCG TGC GAT TAG 306Ala Asp Pro Cys Asp180(2)SEQ ID NO14的信息(i)序列特征(A)长度101个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO14的序列描述Met Glu Pro Val Asp Pro Arg Leu Glu Pro Trp Asn His Pro Gly Ser1 5 10 15Gln Pro Lys Thr Ala Cys Asn Asn Cys Tyr Cys Lys Arg Cys Cys Tyr20 25 30His Cys Leu Tyr Cys Phe Thr Lys Lys Gly Leu Gly Ile Ser Tyr Gly35 40 45Arg Lys Lys Arg Ser Gln Arg Arg Arg Thr Pro Gln Ser Ser Lys Ser50 55 60His Gln Asp Leu Ile Pro Glu Gln Pro Leu Ser Gln Gln Gln Gly Asp65 70 75 80Gln Thr Gly Gln Lys Lys Gln Lys Glu Ala Leu Glu Ser Lys Thr Glu85 90 95Ala Asp Pro Cys Asp100(2)SEQ ID NO15的信息(i)序列特征(A)长度369个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..366(xi)SEQ ID NO15的序列描述ATG GCA GGA AGA AGC GGA GTC AAC GAC GAA GAA CTC CTC AGA GCA GTA 48Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val105 110 115AGA GTC ATC AAG ATC TTA TAC CAG AGC AGT TAT CCC AAC AGC AAG GGG 96Arg Val Ile Lys Ile Leu Tyr Gln Ser Ser Tyr Pro Asn Ser Lys Gly120 125 130ACC AGA CAG GCC AGA AGA AAC AGA AGG AGG CGT TGG AGA GCA AGA CAG 144Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gln135 140 145AGG CAG ATC CGT GCG ATT AGT GAG CGG ATT CTC AGC TCT TGT CTG GGA 192Arg Gln Ile Arg Ala Ile Ser Glu Arg Ile Leu Ser Ser Cys Leu Gly150 155 160 165GGA CCT CCG GAA CCT GTT GAT CTT CCT CTA CCA CCG CTT GAC AGA CTC 240Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu170 175 180ACT CTT GAT ACT GAG GAG GAC TCT GGA ACT CCT GGG ACA GAG TCT CAG 288Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gln185 190 195CAG GGG ACT GCA ACT ACT GAA TGA ACT CAG AAC ACA CTT GTG GGG AAT 336Gln Gly Thr Ala Thr Thr Glu * Thr Gln Asn Thr Leu Val Gly Asn200 205 210ACT TGC ATA TTG GGG AAA AGA GTT AAG GGA TAG 369Thr Cys Ile Leu Gly Lys Arg Val Lys Gly215 220(2)SEQ ID NO16的信息(i)序列特征(A)长度122个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO16的序列描述Met Ala Gly Arg Ser Gly Val Asn Asp Glu Glu Leu Leu Arg Ala Val1 5 10 15Arg Val Ile Lys Ile Leu Tyr Gln Ser Ser Tyr Pro Asn Ser Lys Gly20 25 30Thr Arg Gln Ala Arg Arg Asn Arg Arg Arg Arg Trp Arg Ala Arg Gln35 40 45Arg Gln Ile Arg Ala Ile Ser Glu Arg Ile Leu Ser Ser Cys Leu Gly50 55 60Gly Pro Pro Glu Pro Val Asp Leu Pro Leu Pro Pro Leu Asp Arg Leu65 70 75 80Thr Leu Asp Thr Glu Glu Asp Ser Gly Thr Pro Gly Thr Glu Ser Gln85 90 95Gln Gly Thr Ala Thr Thr Glu * Thr Gln Asn Thr Leu Val Gly Asn100 105 110Thr Cys Ile Leu Gly Lys Arg Val Lys Gly115 120(2)SEQ ID NO17的信息(i)序列特征(A)长度2559个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..2556(xi)SEQ ID NO17的序列描述ATG AAA GTG ATG GGG ATG CAG AGT GGT TGG ATG GGG ATG AAG AGT GGT 48Met Lys Val Met Gly Met Gln Ser Gly Trp Met Gly Met Lys Ser Gly125 130 135TGG TTA CTC TTC TAT CTT CTA GTA AGC TTG ATC AAG GTA ATT GGG TCT 96Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu Ile Lys Val Ile Gly Ser140 145 150GAA CAA CAT TGG GTA ACA GTG TAC TAT GGG GTA CCA GTA TGG AGA GAA 144Glu Gln His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu155 160 165 170GCA GAG ACA ACT CTT TTC TGT GCT TCA GAT GCT AAA GCC CAT AGT ACA 192Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr175 180 185GAG GCT CAC AAC ATC TGG GCC ACA CAA GCA TGT GTT CCT ACT GAT CCC 240Glu Ala His Asn Ile Trp Ala Thr Gln Ala Cys Val Pro Thr Asp Pro190 195 200AAT CCA CAA GAA GTG CTA TTA CCC AAT GTA ACT GAA AAA TTT AAT ATG 288Asn Pro Gln Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met205 210 215TGG GAA AAT AAA ATG GCA GAC CAA ATG CAA GAG GAT ATT ATC AGT CTG 336Trp Glu Asn Lys Met Ala Asp Gln Met Gln Glu Asp Ile Ile Ser Leu220 225 230TGG GAA CAG AGC TTA AAG CCC TGT GTT AAA TTA ACC CCA TTA TGT GTA 384Trp Glu Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val235 240 245 250ACT ATG CTT TGT AAC GAT AGC TAT GGG GAG GAA AGG AAC AAT ACA AAT 432Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn255 260 265ATG ACA ACA AGA GAA CCA GAC ATA GGA TAC AAA CAA ATG AAA AAT TGC 480Met Thr Thr Arg Glu Pro Asp Ile Gly Tyr Lys Gln Met Lys Asn Cys270 275 280TCA TTC AAT GCA ACC ACT GAG CTA ACA GAT AAA AAG AAG CAA GTT TAC 528Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gln Val Tyr285 290 295TCT CTG TTT TAT GTA GAA GAT GTA GTA CCA ATC AAT GCC TAT AAT AAA 576Ser Leu Phe Tyr Val Glu Asp Val Val Pro Ile Asn Ala Tyr Asn Lys300 305 310ACA TAT AGG CTA ATA AAT TGT AAT ACC ACA GCT GTG ACA CAA GCT TGT 624Thr Tyr Arg Leu Ile Asn Cys Asn Thr Thr Ala Val Thr Gln Ala Cys315 320 325 330CCT AAG ACT TCC TTT GAG CCA ATT CCA ATA CAT TAC TGT GCA CCA CCA 672Pro Lys Thr Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Pro335 340 345GGC TTT GCC ATT ATG AAA TGT AAT GAA GGA AAC TTT AGT GGA AAT GGA 720Gly Phe Ala Ile Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly350 355 360AGC TGT ACA AAT GTG AGT ACT GTA CAA TGC ACA CAT GGA ATA AAG CCA 768Ser Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro365 370 375GTG ATA TCC ACT CAG TTA ATC CTA AAT GGA AGC TTA AAT ACA GAT GGA 816Val Ile Ser Thr Gln Leu Ile Leu Asn Gly Ser Leu Asn Thr Asp Gly380 385 390ATT GTT ATT AGA AAT GAT AGT CAC AGT AAT CTG TTG GTG CAA TGG AAT 864Ile Val Ile Arg Asn Asp Ser His Ser Asn Leu Leu Val Gln Trp Asn395 400 405 410GAG ACA GTG CCA ATA AAT TGT ACA AGG CCA GGA AAT AAT ACA GGA GGA 912Glu Thr Val Pro Ile Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly415 420 425CAG GTG CAG ATA GGA CCT GCT ATG ACA TTT TAT AAC ATA GAA AAA ATA 960Gln Val Gln Ile Gly Pro Ala Met Thr Phe Tyr Asn Ile Glu Lys Ile430 435 440GTA GGA GAC ATT AGA CAA GCA TAC TGT AAT GTC TCT AAA GAA CTA TGG 1008Val Gly Asp Ile Arg Gln Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp445 450 455GAA CCA ATG TGG AAT AGA ACA AGA GAG GAA ATA AAG AAA ATC CTG GGG 1056Glu Pro Met Trp Asn Arg Thr Arg Glu Glu Ile Lys Lys Ile Leu Gly460 465 470AAA AAC AAC ATA ACC TTC AGG GCT CGA GAG AGG AAT GAA GGA GAC CTA 1104Lys Asn Asn Ile Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu475 480 485 490GAA GTG ACA CAC TTA ATG TTC AAT TGT AGA GGA GAG TTT TTC TAT TGT 1152Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys495 500 505AAC ACT TCC AAA TTA TTT AAT GAG GAA TTA CTT AAC GAG ACA GGT GAG 1200Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu510 515 520CCT ATT ACT CTG CCT TGT AGA ATA AGA CAG ATT GTA AAT TTG TGG ACA 1248Pro Ile Thr Leu Pro Cys Arg Ile Arg Gln Ile Val Asn Leu Trp Thr525 530 535AGG GTA GGA AAA GGA ATT TAT GCA CCA CCA ATT CGG GGA GTT CTT AAC 1296Arg Val Gly Lys Gly Ile Tyr Ala Pro Pro Ile Arg Gly Val Leu Asn540 545 550TGT ACC TCC AAT ATT ACT GGA CTG GTT CTA GAA TAT AGT GGT GGG CCT 1344Cys Thr Ser Asn Ile Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro555 560 565 570GAC ACC AAG GAA ACA ATA GTA TAT CCC TCA GGA GGA AAC ATG GTT AAT 1392Asp Thr Lys Glu Thr Ile Val Tyr Pro Ser Gly Gly Asn Met Val Asn575 580 585CTC TGG AGA CAA GAG TTG TAT AAG TAC AAA GTA GTT AGC ATA GAA CCC 1440Leu Trp Arg Gln Glu Leu Tyr Lys Tyr Lys Val Val Ser Ile Glu Pro590 595 600ATA GGA GTA GCA CCA GGT AAA GCT AAA AGA CGC ACA GTG AGT AGA GAA 1488Ile Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu605 610 615AAA AGA GCA GCC TTT GGA CTA GGT GCG CTG TTT CTT GGG TTT CTT GGA 1536Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly620 625 630GCA GCA GGG AGC ACT ATG GGC GCA GCG TCA ATA ACG CTG ACG GTA CAG 1584Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln635 640 645 650GCC CGG ACA TTA TTA TCT GGG ATA GTG CAA CAG CAG AAT ATT CTG TTG 1632Ala Arg Thr Leu Leu Ser Gly Ile Val Gln Gln Gln Asn Ile Leu Leu655 660 665AGA GCA ATA GAG GCG CAA CAA CAT TTG TTG CAA CTC TCA ATC TGG GGC 1680Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Ser Ile Trp Gly670 675 680ATT AAA CAG CTC CAG GCA AAA GTC CTT GCT ATA GAA AGA TAC CTT AGG 1728Ile Lys Gln Leu Gln Ala Lys Val Leu Ala Ile Glu Arg Tyr Leu Arg685 690 695GAT CAG CAA ATC CTA AGT CTA TGG GGC TGC TCA GGA AAA ACA ATA TGC 1776Asp Gln Gln Ile Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr Ile Cys700 705 710TAT ACC ACT GTG CCT TGG AAT GAG ACT TGG AGC AAC AAT ACC TCT TAT 1824Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr715 720 725 730GAT ACA ATC TGG AAT AAT TTA ACC TGG CAA CAA TGG GAT GAG AAA GTA 1872Asp Thr Ile Trp Asn Asn Leu Thr Trp Gln Gln Trp Asp Glu Lys Val735 740 745AGA AAC TAT TCA GGT GTC ATT TTT GGA CTT ATA GAA CAG GCA CAA GAA 1920Arg Asn Tyr Ser Gly Val Ile Phe Gly Leu Ile Glu Gln Ala Gln Glu750 755 760CAA CAG AAC ACA AAT GAG AAA TCA CTC TTG GAA TTG GAT CAA TGG GAC 1968Gln Gln Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gln Trp Asp765 770 775AGT CTG TGG AGC TGG TTT GGT ATT ACA AAA TGG CTG TGG TAT ATA AAA 2016Ser Leu Trp Ser Trp Phe Gly Ile Thr Lys Trp Leu Trp Tyr Ile Lys780 785 790ATA GCT ATA ATG ATA GTA GCA GGC ATT GTA GGC ATA AGA ATC ATA AGT 2064Ile Ala Ile Met Ile Val Ala Gly Ile Val Gly Ile Arg Ile Ile Ser795 800 805 810ATA GTA ATA ACT ATA ATA GCA AGA GTT AGG CAG GGA TAT TCT CCC CTT 2112Ile Val Ile Thr Ile Ile Ala Arg Val Arg Gln Gly Tyr Ser Pro Leu815 820 825TCG TTG CAG ACC CTT ATC CCA ACA GCA AGG GGA CCA GAC AGG CCA GAA 2160Ser Leu Gln Thr Leu Ile Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu830 835 840GAA ACA GAA GGA GGC GTT GGA GAG CAA GAC AGA GGC AGA TCC GTG CGA 2208Glu Thr Glu Gly Gly Val Gly Glu Gln Asp Arg Gly Arg Ser Val Arg845 850 855TTA GTG AGC GGA TTC TCA GCT CTT GTC TGG GAG GAC CTC CGG AAC CTG 2256Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu860 865 870TTG ATC TTC CTC TAC CAC CGC TTG ACA GAC TCA CTC TTG ATA CTG AGG 2304Leu Ile Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu Ile Leu Arg875 880 885 890AGG ACT CTG GAA CTC CTG GGA CAG AGT CTC AGC AGG GGA CTG CAA CTA 2352Arg Thr Leu Glu Leu Leu Gly Gln Ser Leu Ser Arg Gly Leu Gln Leu895 900 905CTG AAT GAA CTC AGA ACA CAC TTG TGG GGA ATA CTT GCA TAT TGG GGA 2400Leu Asn Glu Leu Arg Thr His Leu Trp Gly Ile Leu Ala Tyr Trp Gly910 915 920AAA GAG TTA AGG GAT AGT GCT ATC AGC TTG CTT AAT ACA ACA GCT ATT 2448Lys Glu Leu Arg Asp Ser Ala Ile Ser Leu Leu Asn Thr Thr Ala Ile925 930 935GTA GTA GCA GAA GGA ACA GAT AGG ATT ATA GAA TTA GCA CAA AGA ATA 2496Val Val Ala Glu Gly Thr Asp Arg Ile Ile Glu Leu Ala Gln Arg Ile940 945 950GGA AGG GGA ATA TTA CAC ATA CCT AGA AGA ATC AGA CAA GGC CTA GAA 2544Gly Arg Gly Ile Leu His Ile Pro Arg Arg Ile Arg Gln Gly Leu Glu955 960 965 970
2559AGA GCA CTG ATA TAAArg Ala Leu Ile(2)SEQ ID NO18的信息(i)序列特征(A)长度852个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO18的序列描述Met Lys Val Met Gly Met Gln Ser Gly Trp Met Gly Met Lys Ser Gly1 5 10 15Trp Leu Leu Phe Tyr Leu Leu Val Ser Leu Ile Lys Val Ile Gly Ser20 25 30Glu Gln His Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Arg Glu35 40 45Ala Glu Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala His Ser Thr50 55 60Glu Ala His Asn Ile Trp Ala Thr Gln Ala Cys Val Pro Thr Asp Pro65 70 75 80Asn Pro Gln Glu Val Leu Leu Pro Asn Val Thr Glu Lys Phe Asn Met85 90 95Trp Glu Asn Lys Met Ala Asp Gln Met Gln Glu Asp Ile Ile Ser Leu100 105 110Trp Glu Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val115 120 125Thr Met Leu Cys Asn Asp Ser Tyr Gly Glu Glu Arg Asn Asn Thr Asn130 135 140Met Thr Thr Arg Glu Pro Asp Ile Gly Tyr Lys Gln Met Lys Asn Cys145 150 155 160Ser Phe Asn Ala Thr Thr Glu Leu Thr Asp Lys Lys Lys Gln Val Tyr165 170 175Ser Leu Phe Tyr Val Glu Asp Val Val Pro Ile Asn Ala Tyr Asn Lys180 185 190Thr Tyr Arg Leu Ile Asn Cys Asn Thr Thr Ala Val Thr Gln Ala Cys195 200 205Pro Lys Thr Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Pro210 215 220Gly Phe Ala Ile Met Lys Cys Asn Glu Gly Asn Phe Ser Gly Asn Gly225 230 235 240Ser Cys Thr Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Lys Pro245 250 255Val Ile Ser Thr Gln Leu Ile Leu Asn Gly Ser Leu Asn Thr Asp Gly260 265 270Ile Val Ile Arg Asn Asp Ser His Ser Asn Leu Leu Val Gln Trp Asn275 280 285Glu Thr Val Pro Ile Asn Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly290 295 300Gln Val Gln Ile Gly Pro Ala Met Thr Phe Tyr Asn Ile Glu Lys Ile305 310 315 320Val Gly Asp Ile Arg Gln Ala Tyr Cys Asn Val Ser Lys Glu Leu Trp325 330 335Glu Pro Met Trp Asn Arg Thr Arg Glu Glu Ile Lys Lys Ile Leu Gly340 345 350Lys Asn Asn Ile Thr Phe Arg Ala Arg Glu Arg Asn Glu Gly Asp Leu355 360 365Glu Val Thr His Leu Met Phe Asn Cys Arg Gly Glu Phe Phe Tyr Cys370 375 380Asn Thr Ser Lys Leu Phe Asn Glu Glu Leu Leu Asn Glu Thr Gly Glu385 390 395 400Pro Ile Thr Leu Pro Cys Arg Ile Arg Gln Ile Val Asn Leu Trp Thr405 410 415Arg Val Gly Lys Gly Ile Tyr Ala Pro Pro Ile Arg Gly Val Leu Asn420 425 430Cys Thr Ser Asn Ile Thr Gly Leu Val Leu Glu Tyr Ser Gly Gly Pro435 440 445Asp Thr Lys Glu Thr Ile Val Tyr Pro Ser Gly Gly Asn Met Val Asn450 455 460Leu Trp Arg Gln Glu Leu Tyr Lys Tyr Lys Val Val Ser Ile Glu Pro465 470 475 480Ile Gly Val Ala Pro Gly Lys Ala Lys Arg Arg Thr Val Ser Arg Glu485 490 495Lys Arg Ala Ala Phe Gly Leu Gly Ala Leu Phe Leu Gly Phe Leu Gly500 505 510Ala Ala Gly Ser Thr Met Gly Ala Ala Ser Ile Thr Leu Thr Val Gln515 520 525Ala Arg Thr Leu Leu Ser Gly Ile Val Gln Gln Gln Asn Ile Leu Leu530 535 540Arg Ala Ile Glu Ala Gln Gln His Leu Leu Gln Leu Ser Ile Trp Gly545 550 555 560Ile Lys Gln Leu Gln Ala Lys Val Leu Ala Ile Glu Arg Tyr Leu Arg565 570 575Asp Gln Gln Ile Leu Ser Leu Trp Gly Cys Ser Gly Lys Thr Ile Cys580 585 590Tyr Thr Thr Val Pro Trp Asn Glu Thr Trp Ser Asn Asn Thr Ser Tyr595 600 605Asp Thr Ile Trp Asn Asn Leu Thr Trp Gln Gln Trp Asp Glu Lys Val610 615 620Arg Asn Tyr Ser Gly Val Ile Phe Gly Leu Ile Glu Gln Ala Gln Glu625 630 635 640Gln Gln Asn Thr Asn Glu Lys Ser Leu Leu Glu Leu Asp Gln Trp Asp645 650 655Ser Leu Trp Ser Trp Phe Gly Ile Thr Lys Trp Leu Trp Tyr Ile Lys660 665 670Ile Ala Ile Met Ile Val Ala Gly Ile Val Gly Ile Arg Ile Ile Ser675 680 685Ile Val Ile Thr Ile Ile Ala Arg Val Arg Gln Gly Tyr Ser Pro Leu690 695 700Ser Leu Gln Thr Leu Ile Pro Thr Ala Arg Gly Pro Asp Arg Pro Glu705 710 715 720Glu Thr Glu Gly Gly Val Gly Glu Gln Asp Arg Gly Arg Ser Val Arg725 730 735Leu Val Ser Gly Phe Ser Ala Leu Val Trp Glu Asp Leu Arg Asn Leu740 745 750Leu Ile Phe Leu Tyr His Arg Leu Thr Asp Ser Leu Leu Ile Leu Arg755 760 765Arg Thr Leu Glu Leu Leu Gly Gln Ser Leu Ser Arg Gly Leu Gln Leu770 775 780Leu Asn Glu Leu Arg Thr His Leu Trp Gly Ile Leu Ala Tyr Trp Gly785 790 795 800Lys Glu Leu Arg Asp Ser Ala Ile Ser Leu Leu Asn Thr Thr Ala Ile805 810 815Val Val Ala Glu Gly Thr Asp Arg Ile Ile Glu Leu Ala Gln Arg Ile820 825 830Gly Arg Gly Ile Leu His Ile Pro Arg Arg Ile Arg Gln Gly Leu Glu835 840 845Arg Ala Leu Ile850(2)SEQ ID NO19的信息(i)序列特征(A)长度639个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..636(xi)SEQ ID NO19的序列描述ATG GGA AAG ATT TGG TCA AAG AGC AGC CTA GTA GGA TGG CCA GAA ATC48Met Gly Lys Ile Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu Ile855 860 865AGA GAA AGA ATG AGA AGA CAA ACG CAA GAA CCA GCA GTA GAG CCA GCA96Arg Glu Arg Met Arg Arg Gln Thr Gln Glu Pro Ala Val Glu Pro Ala870 875 880GTA GGA GCA GGA GCA GCT TCT CAA GAT CTA GCT AAT CGA GGG GCC ATC 144Val Gly Ala Gly Ala Ala Ser Gln Asp Leu Ala Asn Arg Gly Ala Ile885 890 895 900ACC ATA AGA AAT ACT AGA GAC AAT AAT GAA AGT ATA GCT TGG CTA GAA 192Thr Ile Arg Asn Thr Arg Asp Asn Asn Glu Ser Ile Ala Trp Leu Glu905 910 915GCA CAA GAA GAA GAA GAG GAA GTA GGC TTT CCA GTA CGC CCT CAG GTA 240Ala Gln Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val920 925 930CCA TTA AGG CCA ATA ACC TAT AAA CAG GCT TTT GAT CTT TCC TTC TTT 288Pro Leu Arg Pro Ile Thr Tyr Lys Gln Ala Phe Asp Leu Ser Phe Phe935 940 945TTA AAA GAT AAG GGG GGA CTG GAA GGG CTA GTT TGG TCC AGA AAA AGG 336Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg950 955 960CAA GAT ATT CTA GAC CTC TGG ATG TAT CAC ACA CAA GGC ATC CTC CCT 384Gln Asp Ile Leu Asp Leu Trp Met Tyr His Thr Gln Gly Ile Leu Pro965 970 975 980GAC TGG CAT AAC TAC ACA CCA GGG CCA GGA ATT AGA TAC CCC GTA ACC 432Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Ile Arg Tyr Pro Val Thr985 990 995TTT GGA TGG TGC TTC AAA CTA GTA CCA TTG TCA GCT GAA GAA GTA GAA 480Phe Gly Trp Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu100010051010GAG GCT AAT GAA GGA GAC AAC AAT GCC CTC TTA CAC CCC ATA TGT CAA 528Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro Ile Cys Gln101510201025CAT GGA GCA GAT GAT GAT CAT AAA GAA GTG TTG GTG TGG CGA TTT GAC 576His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp103010351040AGC TCC CTA GCA AGA AGA CAT GTA GCA AGA GAG CTG CAT CCG GAG TTT 624Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe1045105010551060TAC AAG AAC TGC TGA 639Tyr Lys Asn Cys(2)SEQ ID NO20的信息(i)序列特征(A)长度212个氨基酸(B)类型氨基酸(D)拓扑类型线性(ii)分子类型蛋白质(xi)SEQ ID NO20的序列描述Met Gly Lys Ile Trp Ser Lys Ser Ser Leu Val Gly Trp Pro Glu Ile1 5 10 15Arg Glu Arg Met Arg Arg Gln Thr Gln Glu Pro Ala Val Glu Pro Ala20 25 30Val Gly Ala Gly Ala Ala Ser Gln Asp Leu Ala Asn Arg Gly Ala Ile35 40 45Thr Ile Arg Asn Thr Arg Asp Asn Asn Glu Ser Ile Ala Trp Leu Glu50 55 60Ala Gln Glu Glu Glu Glu Glu Val Gly Phe Pro Val Arg Pro Gln Val65 70 75 80Pro Leu Arg Pro Ile Thr Tyr Lys Gln Ala Phe Asp Leu Ser Phe Phe85 90 95Leu Lys Asp Lys Gly Gly Leu Glu Gly Leu Val Trp Ser Arg Lys Arg100 105 110Gln Asp Ile Leu Asp Leu Trp Met Tyr His Thr Gln Gly Ile Leu Pro115 120 125Asp Trp His Asn Tyr Thr Pro Gly Pro Gly Ile Arg Tyr Pro Val Thr130 135 140Phe Gly Trp Cys Phe Lys Leu Val Pro Leu Ser Ala Glu Glu Val Glu145 150 155 160Glu Ala Asn Glu Gly Asp Asn Asn Ala Leu Leu His Pro Ile Cys Gln165 170 175His Gly Ala Asp Asp Asp His Lys Glu Val Leu Val Trp Arg Phe Asp180 185 190Ser Ser Leu Ala Arg Arg His Val Ala Arg Glu Leu His Pro Glu Phe195 200 205Tyr Lys Asn Cys210(2)SEQ ID NO21的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO21的序列描述ATTGCGTACT CACACTTCCG 20(2)SEQ ID NO22的信息(i)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO22的序列描述GGCAAGCAGG GAGCTGG 17(2)SEQ ID NO23的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链
(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO23的序列描述TCCTTGAGCA GTCTGGAC 18(2)SEQ ID NO24的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO24的序列描述GAACAGGAGG ATTAGCAG 18(2)SEQ ID NO25的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO25的序列描述AGCAGAGGCT ATGTCACA 18(2)SEQ ID NO26的信息(i)序列特征(A)长度19个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO26的序列描述TGTAAGGCCC CTAGAAGAG 19(2)SEQ ID NO27的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO27的序列描述ACAGAGAACT CTCTGTAC 18(2)SEQ ID NO28的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO28的序列描述AAGAAAAGCA GTTGGTAC 18(2)SEQ ID NO29的信息(i)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO29的序列描述TTTCTTCCCT GTATGTC 17(2)SEQ ID NO30的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO30的序列描述GTTATATGGA TTCTCAGG 18(2)SEQ ID NO31的信息(i)序列特征(A)长度19个碱基对(B)类型核酸
(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO31的序列描述TGGCAGCACA TTATACTGG 19(2)SEQ ID NO32的信息(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO32的序列描述ATCATTTACC AGTACATGGA CGA 23(2)SEQ ID NO33的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO33的序列描述TGTCAGGGGT CGTAAAGC18(2)SEQ ID NO34的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO34的序列描述TCCTCTGGAT GGGATATG 18(2)SEQ ID NO35的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO35的序列描述TCTATCCAGG AATCAGAG 18(2)SEQ ID NO36的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸
(A)描述/desc=“引物”(xi)SEQ ID NO36的序列描述AATGAGATCT GCCCATAC 18(2)SEQ ID NO37的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO37的序列描述TGACAGATAG GGGAAGAC 18(2)SEQ ID NO38的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO38的序列描述AACCGCCATT TGCACTGC 18(2)SEQ ID NO39的信息(i)序列特征(A)长度18个碱基对
(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO39的序列描述ACATGGACCG CCACAAGG 18(2)SEQ ID NO40的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO40的序列描述AGCAACAGAC ATACAGAC 18(2)SEQ ID NO41的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO41的序列描述
AAAGTAGTCC CACGTAGG18(2)SEQ ID NO42的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO42的序列描述ATATCCCAGT AGGTCAGG 18(2)SEQ ID NO43的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO43的序列描述TCTAGCACTA ACAGCCTG 18(2)SEQ ID NO44的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链
(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO44的序列描述ACTCTTACTG CTCTGAGG 18(2)SEQ ID NO45的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO45的序列描述CCATAGTACA CTGTTACC 18(2)SEQ ID NO46的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO46的序列描述CATAGCTATC GTTACAAAGC 20(2)SEQ ID NO47的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO47的序列描述TCATAATGGC AAAGCCTG 18(2)SEQ ID NO48的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO48的序列描述CTATTCCACA TTGGTTCC 18(2)SEQ ID NO49的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO49的序列描述ATTCTAGAAC CAGTCCAG 18(2)SEQ ID NO50的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO50的序列描述CCTTAGGGAT CAGCAAATCC 20(2)SEQ ID NO51的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO51的序列描述TGGGACAGTC TGTGGAGC 18(2)SEQ ID NO52的信息(i)序列特征(A)长度18个碱基对(B)类型核酸
(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO52的序列描述TTCTCAGCTC TTGTCTGG18(2)SEQ IDNO53的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO53的序列描述ATTAAGCAAG CTGATAGC 18(2)SEQ ID NO54的信息(i)序列特征(A)长度16个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO54的序列描述TGTGCTTCTA GCCAAG 16(2)SEQ ID NO55的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO55的序列描述GCTCCATGTT GACATATG18(2)SEQ ID NO56的信息(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸(A)描述/desc=“引物”(xi)SEQ ID NO56的序列描述AGAGAGACCC AGTACAAG18(2)SEQ ID NO57的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑类型线性(ii)分子类型其它核酸
(A)描述/desc=“引物”(xi)SEQ ID NO57的序列描述ATAAAAGCAG CCGCTTCTCG20(2)SEQ ID NO58的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑类型线性(ii)分子类型肽(xi)SEQ ID NO58的序列描述Cys Thr Arg Pro Gly Asn Asn Thr Gly Gly Gln Val Gln Ile Gly Pro1 5 10 15Ala Met Thr Phe Tyr Asn Ile Glu Lys Ile Val Gly Asp Ile Arg Gln20 25 30Ala Tyr Cys35(2)SEQ ID NO59的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑类型线性(ii)分子类型肽(xi)SEQ ID NO59的序列描述Cys His Arg Pro Gly Asn Asn Thr Arg Gly Glu Val Gln Ile Gly Pro1 5 10 15Gly Met Thr Phe Tyr Asn Ile Glu Asn Val Tyr Gly Asp Thr Arg Ser20 25 30Ala Tyr Cys35(2)SEQ ID NO60的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑类型线性(ii)分子类型肽(xi)SEQ ID NO60的序列描述Cys Ile Arg Pro Gly Asn Arg Thr Tyr Arg Asn Leu Gln Ile Gly Pro1 5 10 15Gly Met Thr Phe Tyr Asn Val Glu Ile Ala Thr Gly Asp Ile Arg Lys20 25 30Ala Phe Cys35(2)SEQ ID NO61的信息(i)序列特征(A)长度35个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑类型线性(ii)分子类型肽(xi)SEQ ID NO61的序列描述Cys Thr Arg Pro Asn Asn Asn Thr Arg Lys Ser Val Arg Ile Gly Pro1 5 10 15Gly Gln Ala Phe Tyr Ala Thr Gly Asp Ile Ile Gly Asp Ile Arg Gln20 25 30Ala His Cys3权利要求
1.非-M、非-O HIV-1毒株,其显示了一种逆转录病毒的形态学和免疫学特征,这种逆转录病毒于1996年7月2日保藏在国立微生物保藏中心,保藏号为I-1753(命名为YBF30),由巴斯德研究所保存。
2.核酸序列,其特征在于它们来源于根据权利要求1的毒株。
3.根据权利要求2的核酸序列,其特征在于它选自以下序列根据权利要求1的毒株的完整核苷酸序列(SEQ ID No.1)以及来源于该毒株的核酸片段(SEQ ID No.2)、(SEQ ID No.3)、(SEQ IDNo.5)、(SEQ ID No.7)、(SEQ ID No.9)、(SEQ ID No.11)、(SEQ ID No.13)、(SEQ ID No.15)、(SEQ ID No.17)、(SEQID No.19)及序列SEQ ID No.21-57,还有与上述核苷酸序列之一不相同的、或与这些序列之一不能互补的、但能够与来源于非-M、非-O HIV-1病毒的核酸序列杂交的任何序列。
4.寡核苷酸,其特征在于它是从序列SEQ ID No.21-57中选择出来的,特征在于它能够作为一种引物或探针用于检测根据权利要求1或权利要求5的HIV-1。
5.HIV-1病毒,其特征在于它们既不同于M族,也不同于O族,而且显示以下特征*与M族和O族的蛋白质几乎没有或没有血清学反应性,而与来源于根据权利要求1的YBF30毒株或CPZGAB SIV毒株的蛋白质却有很强的血清学反应性;*当应用来源于M族和O族HIV-1病毒env和gag区的引物时,无基因组扩增;*当来源于根据权利要求4的YBF30毒株的引物存在时,基因组扩增;以及*包膜基因产物的同源性与YBF30毒株相比大于70%。
6.通过杂交和/或基因扩增用于体外诊断非-M族、非-O族HIV-1病毒的方法,该方法是应用一种生物样本(血清或循环淋巴细胞)进行的,其特征在于它包括*提取属于病毒基因组的待测核酸的步骤,该病毒可能存在于生物样本中,及当适当的时候,应用一种逆转录酶处理核酸的步骤,如果这种核酸为RNA形式,*至少一个循环,其包括的步骤有变性核酸;与至少一个根据权利要求3或权利要求4的序列杂交;以及当适当的时候,在合适的试剂(聚合剂,如DNA聚合酶和dNTP)存在下,延伸已形成的杂交物,以及*检测属于非-M、非-O HIV-1族型病毒基因组的核酸之可能存在的步骤。
7.肽,其特征在于它能被一种根据权利要求1或权利要求5的非-M、非-O HIV-1毒株表达,或应用一种根据权利要求3的核苷酸序列而被表达,以及特征在于它能够(1)被根据权利要求1或权利要求5的非-M、非-O HIV-1病毒、或该病毒的变种诱导产生的抗体所识别,这些抗体存在于用非-M、非-O HIV-1毒株感染后采集的生物样本中,和/或(2)诱导抗非-M、非-O HIV-1抗体的产生。
8.根据权利要求7的肽,其特征在于它选自gag基因表达的肽(SEQ ID No.4)、pol基因表达的肽(SEQ ID No.6)、vif基因表达的肽(SEQ ID No.8)、vpr基因表达的肽(SEQ ID No.10)、vpu基因表达的肽(SEQ ID No.12)、tat基因表达的肽(SEQ ID No.14)、rev基因表达的肽(SEQ ID No.16)、env基因表达的肽(SEQ ID No.18)或其片段之一如V3环区的片段(SEQ ID No.58)、以及nef基因表达的肽(SEQ ID No.20),或者能够识别用根据权利要求1或权利要求5的HIV-1病毒感染的期间产生的抗体的这些肽的一个片段。
9.免疫原性组合物,其包括根据权利要求3的核苷酸序列的一种或多种翻译产物,和/或根据权利要求7或权利要求8的肽中的一种或多种翻译产物。
10.针对根据权利要求7或权利要求8的一种或多种肽的抗体。
11.用于非-M、非-O HIV-1病毒体外诊断的方法,其特征在于它包括将一种取自病人的生物样本与根据权利要求10的抗体接触,其中可能会结合抗-CPZGAB SIV抗体,以及检测可能存在于该生物样本中的HIV-1抗原与该抗体之间形成的免疫复合物。
12.用于诊断非-M、非-O HIV-1病毒的试剂,其特征在于它包括一个根据权利要求3、4、7或8中任何一个的序列。
13.用于筛选和分型非-M、非-O HIV-1病毒的方法,其特征在于它包括将根据权利要求3或权利要求4的核苷酸片段中的任何一个接触待分型的病毒的核酸,以及检测形成的杂交物。
14.用于诊断非-M、非-O HIV-1病毒的试剂盒,其特征在于它包括至少一种根据权利要求12的试剂。
全文摘要
本发明涉及HIV-1非-M族非-O族的逆转录病毒毒株,尤其涉及一种称为YBF30的毒株、其片段及其作为诊断和免疫原性制剂的应用。与M族和O族不同的HIV-2具有以下特征:对M族和O族的蛋白质几乎没有或没有血清学反应,而对源于YBF30毒株或SIVCPZGAB毒株的蛋白质具有强烈的血清学反应;无M族和O族HIV-1的env和gag区引物引发的基因组扩增;源于YBF30毒株的引物存在时的基因组扩增;与YBF30毒株相比,包膜基因产物的同源性大于70%。
文档编号C12N7/00GK1244896SQ97181380
公开日2000年2月16日 申请日期1997年12月8日 优先权日1996年12月9日
发明者P·莫克勒, I·洛瑟特-阿加卡, F·西蒙, S·萨拉高斯特, F·巴里-斯诺斯 申请人:国家健康科学研究所, 公共救济事业局-巴黎医院, 巴斯德研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1