专利名称:间日疟原虫和镰状疟原虫红细胞结合蛋白的结合区的制作方法
背景技术:
每年有200-400百万人感染疟疾,引起1-2百万人死亡,因此疟疾是世界上现存的最严重要的感染性疾病之一。在非洲乡村,年龄在一到四岁之间的儿童总死亡数中有大约25%由疟疾引起。由于该疾病作为一种世界研究性健康问题的严重性,人们花费了相当大的努力来鉴定和研究疟疾疫苗。
人类的疟疾由寄生疟原虫属的四个种引起镰状疟原虫,间日疟原虫,P.knowlesi和三日疟原虫。人类疟疾的主要起因是镰状疟原虫,它每年感染200百万到400百万人,导致1到4百万人死亡。
间日疟原虫(人类的四种感染性疟原虫之一)不能在体外培养,而P.knowlesi(在东半球猴中发现的疟疾品种,也侵入人红细胞)和镰状疟原虫能。尽管间日疟原虫与P.knowle-si在系统发育上基本相似,但两个品种在许多重要方面不同。例如间日疟原虫对许多猿猴种类不感染且在其它种类中不易形成感染,而P.knowlesi不易感染人类但容易感染许多猿猴种类。
抗疟疾的各种有效疫苗的基础鉴别是通过了解该寄生虫的生存周期来实现的。当幼龄疟疾寄生虫或“子孢子”被蚊注射进人的血液中时感染人类。注射后,寄生虫定位于肝细胞。大约一周后,寄生虫或“裂殖子”释放进血液中。寄生虫进入血液后开始“红细胞”期。每个寄生虫进入红血细胞以便生长和发育。当裂殖子在红血细胞中成熟时,将它称为滋养体,滋养体进行几轮核分裂(裂殖生殖)直到使红细胞破裂,释放6到24个裂殖子。经过几个无性裂殖生殖循环后,有些寄生虫发育成称为“配子母细胞”的形态学上明显不同的形式,其寿命长且进行有性发育以代替通过有性繁殖产生的裂殖体。
疟原虫的有性发育涉及雌性或“大配子母细胞”和雄性疟原虫或“小配子母细胞”。这些配子母细胞在人体内不进行进一步的发育。当配子母细胞摄入到蚊体内后,在蚊中肠开始复杂的有性循环。10到20分钟后红血细胞在纹中肠分裂。小配子母细胞通过小配子形成继续发育并释放8个鞭毛丰富的小配子母细胞。受精通过大配子母细胞和小配子母细胞的融合实现。受精的疟原虫称为受精卵,由它发育成“动合子”。动合子包埋于蚊中肠,在那里转化成卵母细胞,形成许多小孢子。在包埋于中肠之前,动合子必须首先穿透围食膜,围食膜明显充当摄入的疟原虫入侵的屏障。卵母细胞破裂成小孢子,经血淋巴迁移到蚊唾液腺。一旦进入蚊唾液,疟原虫可被注射进宿主体内。
疟原虫属生活史的红细胞期与疫苗发展特别相关,因为宿主疟疾的临床和病理特征归因于这一阶段。在间日疟原虫和P.knowlesi中,存在于Duffy阳性红细胞上的Duffy血型决定簇是侵入人红细胞所必需的(Miller et al.,Science 189561-563,(1975);Miller et al.,N.Engl.J.Med.295302-304,(1976))。在镰状疟原虫中,裂殖子侵入红细胞似乎取决红细胞上血型糖蛋白唾液酸的结合(Miller,et al.,J.Exp.Med.146277-281,(1971);Pasvol,et al.,Lancet.,ii947-950(1982);Pasvol,et al.,Nature,27964-66(1982);Perkins,J.Exp.Med.160788-798(1984))。以猴疟原虫P.knowlesi进行的研究使人们能更清楚地了解侵入过程中发生的多个事件。很可能尽管间日疟原虫和镰状疟原虫分别与Duffy抗原和唾液酸结合,但它们互相间及与P.knowlesi以相同的方式进行侵入。
对于P.knowlesi在侵入过程中,裂殖子首先以裂殖子的任一表面附着于红细胞上,然后重新调整方向以便其顶端与红细胞接触(Dvorak et al.,Science 187748-750(1975)。裂殖子的附着和重新取向在Duffy阳性和Duffy阴性细胞上能同等顺利地进行。然后在裂殖子顶端和Duffy阳性红细胞间形成连接,随后形成液泡,裂殖子进入液泡(Aikawa etal.,J.Cell Biol.7772-82(1978))。在Duffy阴性细胞上不发生连接形成和裂殖子进入红细胞(Miller et al.,J.Exp.Med.149172-184(1979),认为Duffy决定簇特异性受体与顶端连接形成而不是起始附着有关。
以3种细胞器的存在定义裂殖子的顶端rhopteries,密集颗粒和微丝体。在液泡形成时rhopteries和密集颗粒释放其内含物(Ladda et al.,1969;Aikawa et al.,J.Cell Biol.,7772-82(1978);Torn et al.,Infection and Immunity 573230-3233(1989);Bannister and Dluzewski,Blood Cell 16257-292(1990)。到目前为止微丝体的功能尚不清楚。然而,微丝体的位置表明它们与侵入过程有关。Duffy抗原结合蛋白(DABP)和唾液酸结合蛋白(SABP)已分别定位于P.knowlesi和镰状疟原虫的微丝体上(Adams et al.,cell63141-153(1990);sim et al.,Mol.Biochem.Parasitol.51157-160(1992))。
DABP和SABP是可溶蛋白质,在感染的红细胞释放裂殖子后它们出现在培养物上清液中。免疫化学资料表明DABP和SABP分别是间日疟原虫和镰状疟原虫在红细胞上Duffy和唾液酸受体的配体,在可溶或膜结合形式下具有同样的结合特异性。
DABP是135KDa的蛋白质,它与Duffy血型决定簇特异性地结合(Wertheimer et al.,Exp.Parasitol.69340-350(1989);Barnwell,et al.,J.Exp.Med.1691795-1805(1989))。因此,DABP与人Duffy阳性红细胞的结合是具有特异性的。人红细胞有4种主要Duffy表型Fy(a),Fy(b),Fy(ab)和Fy(阴性),以抗Fya和抗-Fyb血清来定义(Hadley et al.,In Red Cell A ntigens and Antibodies.G.Garrat-ty,ed.(Arlingten,VaAmerican Association of Blood Banks)PP.17-33(1986)。DABP同等地与Fy(a)和Fy(b)红细胞结合(两类红细胞对间日疟原虫的感染同样敏感)而不与Fy(阴性)红细胞结合。
至于SABP,它是175KDa的蛋白质,与红细胞上血型糖蛋白的唾液酸残基特异性地结合(Camus and Hadley,Science230553-556(1985);Orlandi,et al.,J.Cell Biol.116901-909(1992))。因此,神经氨酸苷酶处理(裂解唾液酸残基)使红细胞对镰状疟原虫的侵入具有免疫力。
结合的特异性和与疟原虫感染的相关性表明DABP和SABP是间日疟原虫和镰状疟原虫的与唾液酸和红细胞上的Duffy抗原相互作用的蛋白质。编码两种蛋白质的基因已被克隆、已测定了该DNA和预期的蛋白质序列(B.Kim Leesim,et al.,J.Cell Biol.1111877-1884(1990);Fang.X.,et al.,Mol.Biochem Parasitol,44125-132(1992))。
尽管全世界做出了相当大的研究努力,但由于疟原虫的复杂性和其与宿主的相互作用,还不可能发现用于阻止或抵抗疟疾血液阶段的令人满意的溶液。由于疟疾是一个巨大的世界性健康问题,因此需要抵抗该疾病影响的方法。本发明提供了抗疟原虫属感染的有效的防止和治疗措施。
本发明概述本发明提供了包含分离的DABP结合区多肽和/或分离的SABP结合区多肽的组合物。DABP结合区多肽优选包含在大约200到大约300之间的氨基酸残基,而SABP结合区多肽优选包含在大约200到大约600之间的氨基酸残基。优选的DABP结合区多肽具有SEQ ID NO2中所示的含有
图1所示的蛋白质的半胱氨酸富集部分的大约325个氨基酸残基。优选的SABP结合区多肽具有SEQ ID NO4的含有图1所示的蛋白质的半胱氨酸富集部分的大约616的氨基酸残基。
本发明还包括包含药用学上可接受的载体和以在生物体内足以诱导抗间日疟原虫裂殖子的保护性免疫反应的量的分离的DABP结合区多肽之药用组合物。而且以足以诱导抗镰状疟原虫保护性免疫反应的量的分离的SABP结合区多肽可加入药用组合物中。
还提供了包含药学上可接受的载体和分离的SABP结合区多肽的药用组合物,其中多肽的量是以在生物体内诱导抗镰状疟原虫的保护性免疫反应。另外,分离的DABP结合区多肽能以足以诱导抗间日疟原虫的保护性免疫反应的量加入药用组合物中。
还公开了编码DABP结合区多肽或SABP结合区多肽的分离的多聚核苷酸。另外,本发明包括含有编码DABP结合区多肽的多聚核苷酸的重组细胞。
本发明进一步包括在病人体内诱导抗疟原虫属裂殖子的保护性免疫反应的方法。该方法包括给病人施用免疫上有效量的药用组合物,该组合物包含药学上可接受的载体和分离的DABP结合区多肽,SABP结合区多肽或其组合。
本说明书还提供来自红细胞结合配体(EBL)家族其它镰状疟原虫基因的DNA序列。该家族具有与镰状原虫175KD和间日疟原虫135KD结合蛋白保守的区域。
定义本文所用的“DABP结合区多肽”或“SABP结合区多肽”是分别与来自Duffy抗原结合蛋白(DABP)富含半胱氨酸的氨基末端区域或唾液酸结合蛋白(SABP)的序列基本相同(定义如下)的多肽。该多肽能结合Duffy抗原或血型糖蛋白上的唾液酸残基。特别是DABP结合区多肽由与含有图1所示的蛋白质的半胱氨酸富集部分的SABP结合区内的序列基本相似的氨基酸残基组成。SABP结合区多肽由与含有图1所示的蛋白质的半胱氨酸富集部分的DABP结合区内的序列基本相似的残基组成。
由EBL家族基因编码的结合区多肽由与上面定义的DABP和SABP结合区的序列基本相同的那些残基组成。EBL家族包含与DABP和SABP保守区基本相似的序列。它们包括本文以EBL-e1(SEQ ID Nos 5和6),E31a(SEQ IDNos 7和8),EBL-e2(SEQ ID Nos 9和10)和Proj3(SEQ IDNos 11和12)报道的那些序列。
本发明的多肽可由结合区的全长或其片段组成。典型的DABP结合区多肽由以大约50到大约325的残基组成,优选在大约75和300之间,更优选的是在大约100到大约250之间的残基。SABP结合区多肽由从大约50到大约616的残基组成,优选大约75到300之间,更优选的是大约100到大约250之间的残基。
本发明特别优选的多肽是那些位于结合区内的多肽,该结合区在SABP和EBL家族之间保守。这些保守的区域内的残基如下面图1所示。
当进行最大相关性序列对比时,如果两个序列中的核苷酸或氨基酸残基序列相同时两个多聚核苷酸或多肽说成是“相同的”。可用局部同源性公式(Smith and Waterman,Adv.Appl.Math.2487(1981),同源性排列公式(Needleman andWunsch,J.Mol.Biol.48443(1970))相似性寻找方法(Pearson and Lipman,Proc Natl Acad.Sci(U.S.A)852444(1988),这些公式计算机化的程序(GAP,BESTFIT,FASTA,and TFASTA in the Wisconsin Genetics Software Packag,Genet-ics Computer Group,575 Science Dr.,Madison,WI)或经检查来进行序列比较的最佳排列。本文引用这些文献以供参考。
术语“基本上相同”指多肽包含的序列与对照序列相比(通过比较大约20个残基至大约600个残基,典型的是大约50到大约500个残基,通常是大约250到300个残基)具有至少80%的序列相同性,优选90%,更优选的是95%或更多。使用上面程序测定相同百分数的值。本发明特别优选的多肽包含的序列中至少存在在DABP和SABP中保守的半脱氨酸残基的70%。另外,该多肽包含的序列至少有在DABP和SABP保守的色氨酸残基的50%存在。考虑到在DABP,SABP和EBL家族的序列之间发现的那些保守的氨基酸残基,本文还具体定义了术语基本相似。这些保守的氨基酸主要由在本文报道的所有序列中保守的色氨酸和半脱氨酸残基组成。其它保守的氨基酸残基包括苯丙氨酸残基,它可用酪氨酸取代。本领域的技术人员使用上面所列方法进行序列对比后可测定这些氨基酸残基是保守的。
多肽序列基本相同的另一解释是一种蛋白质是否与产生的抗其它蛋白质的抗体发生免疫反应。因此,本发明的多肽包括与产生的抗SABP结合区,DABP结合区或产生的抗EBL家族保守区的抗体发生免疫反应的多肽。
核苷酸序列基本相同的另一解释是2种分子是否在严格条件下互相杂交。严格条件具有序列依赖性并在不同的环境下会有差别。一般来说,严格条件的选择是在限定离子强度和ph下列入下比特定序列的热熔点(Tm)大约约5℃。Tm是50%的靶序完全匹配的探针杂交的温度(在限定的离子强度和ph下)。典型的严格条件是在pH7下盐浓度至少为大约0.02摩尔,温度至少为大约60℃。
短语“分离的”或“生物学纯的”指物质基本上或必须没有在基天然状态下通常与其共存的成份。因此,本发明的结合区多肽不含正常情况下与其原位环境相联的物质,例如,裂殖子膜的其它蛋白质。然而,即使蛋白质经PAGE分离成均质或占优势的带,可能仍有5-10%范围的与所需蛋白质共同纯化的天然蛋白质的微量污染。本发明分离的多肽不含这类内源性共同纯化的蛋白质。
蛋白质的纯度或匀质性可用许多本领域公知的方法来表示,如蛋白质样品的聚丙烯酰胺凝胶电泳,接着经染色进行肉眼观察。对于某些用途需要高分辩率,可使用HPLC或相似的纯化方法。
术语“残基”指以酰胺键或酰胺键类似物掺入寡肽的氨基酸(D或L)或氨基酸类似物。本发明的酰胱键类似物包括本领域的技术人员公知的肽骨架修饰。
附图的简要描述图1显示了DABP结合区(间日疟原虫),2个同源SABP区(SABP F1和SABP F2)和EBL基因家族测序的成员(eb1-e1,E31a,EBL-e2和三个同源Proj3区)预期氨基酸序列的序列对比。
图2显示PRE4克隆载体的图示。
图3显示了在分离编码本发明保守区的序列中有用的引物。
优选实施例方案的描述裂殖子和裂殖体红细胞的结合是由裂殖子或裂殖体表面的特异性结合蛋白介导的,它对红细胞的感染是必需的。对于镰状疟原虫,这种结合涉及红细胞上唾液酸血型糖蛋白残基与裂殖子或裂殖体表面的唾液酸结合蛋白(SABP)之间特异性的相互作用。纯化的SABP结合具有化学或酶修饰的唾液酸残基的红细胞的能力与镰状疟原虫感染这些红细胞的能力相平行。而且,唾液酸缺陷型红细胞既不结合SABP,也不能被镰状疟原虫感染。还克隆和侧序了编码镰状疟原虫SABP的DNA。
在间日疟原虫中,与红细胞的特异性结合涉及红细胞上Duffy血型抗原与裂殖子上Duffy抗原结合蛋白(DABP)之间的相互作用。Duffy结合蛋白在生物学上定义为感染的红细胞释放裂殖子后在培养物上清液中出现的那些可溶性蛋白质,它与人Duffy阳性红细胞结合,而不与人Duffy阴性红细胞结合。显示了间日疟原虫DABP蛋白质与Duffy阴性红细胞的结合被抗Duffy血型决定簇的抗血清抑制。纯化的Duffy血型抗原也抑制与红细胞的结合。Western印迹也显示DABP与Duffy血型决定簇结合。
人红细胞上的Duffy阳性血型决空簇对间日疟原虫引起的人红细胞的感染是必需的。间日疟原虫裂殖子的附着和重新取向在Duffy阳性和阴性红细胞上同等顺利地发生。然后在裂殖子顶端和Duffy阳性红细胞之间形成联接,接着形成液泡且裂殖子进入液泡。在Duffy阴性细胞上不发生连接的形成和裂殖子进入红细胞,这表明Duffy决定簇特异性的受体与顶端连接的形成而不是与起始附着有关。克隆和侧序了编码间日疟原虫和P.knonlesi DABP的DNA序列。
间日疟原虫的红细胞感染绝对需要Duffy血型抗原。然而,镰状疟原虫分离物的感染对唾液酸的依赖性不同。建立了一些以正常频率感染唾液酸缺陷型红细胞的镰状疟原虫克隆。这表明镰状疟原虫的一些菌株能与红细胞上的其它配体相互作用,因此可能有多种具有不同特异性的红细胞结合蛋白。
本发明的基础是在DABP和SABP上发现了结合区。DABP和SABP预期的蛋白质序列比较揭示了在两种蛋白质之间具有高度相似性,在两种蛋白质中有一个氨基末端富含半胱氨酸的区域。DABP氨基末端的富含半胱氨酸的区域含大约325个氨基酸,而SABP氨基末端的富含半胱氨酸的区域含大约616个氨基酸。这是由于在SABP蛋白质的氨基末端半胱氨酸富集区有明显的重复。在SABP和DABP的2个区域之间半胱氨酸残基周围的氨基酸和许多芳香族氨基酸残基也一样。氨基末端的半胱氨酸富集区和靠近羧基末端的另一半胱氨酸富集区表明在DABP和SABP蛋白质之间最相似。这2个半胱氨酸富集区之间的氨基酸序列区域表明在DABP和SABP之间仅有有限的相似性。
鉴定了其它具有与SABP和DABP结合区基本相同的区域的镰状疟原虫开架阅读框和基因。这些序列在疟原虫基因组中存在多个拷贝表明它们在宿主—疟原虫的相互作用中具有重要活性。从染色体7的亚片段文库中克隆了这些序列的一个家族(EBL家族),该文库在氯奎抗性基因座的遗传研究中构建(Wellems et.al.,PNAS 883382-3386(1991))。EBL序列的对比鉴定了镰状疟原虫175KD蛋白质中高度保守的区域;这些保守区接着用于鉴定其中之一(eb1-e1)位于染色体13的基因(eb1-e1,eb1-e2)。连锁遗传研究将该基因定位在染色体13影响疟原虫感染人红血细胞的区域上(Wellems et al.,Cell 49633-642(1987))。
使用来自这些开架阅读框的探针进行的Southern杂交实验表明这些保守序列有额外的拷贝位于基因组的其它位置。染色体7上最大的开架阅读框是8千碱基,含4个与SABP和DABP N端半胱氨酸富集单位同源的串联重复。
图1代表EBL家族与DABP结合区和2个SABP同源在(F1和F2)的序列比较。将EBL家族分成2个亚家族以获得最佳序列比较。保守的半胱氨酸残基以黑体字显示,保守的芳香族残基下面划线。
本发明的多肽可用于产生SABP,DABP结合区域EBL基因家族保守区特异性的单克隆抗体。该抗体可用于疟疾感染的诊断或作为治疗试剂抑制裂殖子与红细胞的结合。抗所需抗原的单克隆抗体的生产对本领域的技术人员而言是公知的,在本文不再详细描述。
本领域的技术人员,可得到的用于生产和控制各种免疫球蛋白”和“抗体”,指由一种或多种基本上由免疫球蛋白分子的许多技术可轻易地用来控制结合。本文所用的术语“免疫球蛋白基因编码的多肽组成的蛋白质。除抗体外,免疫球蛋白能以各种形式存在,例如包括Fv,Fab,和F(ab)2以及以单链的形式存在。免疫球蛋白结构和功能的一般知识见基础免疫学(第二版,W.E.Paul编辑,Ravens出版,纽约(1989))。
与本发明的多肽结合的抗体可用各种方法来生产。非人类单克隆抗体(例如鼠、兔形目、马等)的生产是公知的并且可用(例如)以含该多肽的制品免疫动物来完成。使从免疫的动物获得的抗体生产细胞成为永生细胞并进行筛选,或者先筛选以生产控制裂殖子和红细胞结合的抗体,然后使成的永生细胞。单克隆抗体生产一般方法的讨论见Harlow和Lane的《抗体,实验室手册》Cold Spring Harbor出版,纽约(1988)。
因此,本发明能达到保护性免疫反应的目的或得到单克隆抗体以侧序在SABP、DABP和EBL基因家族编码区之间保守的结合区。这些蛋白质结合区的鉴定有助于形成疫苗,因为它使人们得以将精力集中在大分子的功能单元上。从结合区内特定序列优选出在进化中保守的关键区域的目标,于是优选用作抗疟原虫的疫苗。
EBL家族的基因(以前尚来侧序)可用作标记来检测病人中镰状疟原虫的存在。使用症状性病人的组织或血液与EBL家族基因片段互补的寡核酸进行PCR反应,以本领域的实践者熟知的方法可完成这种检测。而且,测序的EBL家族为熟练的实践者提供了生产在各种运用中用作遗传标记的限定的探针的一种方法。
另外,本发明定义了一个存在于(但不限于)参与宿主寄生作用的Apicomplexa亚门其它成员中的保守区。可使用图3所示的合成寡聚核苷酸引物以聚合酶链式反应在疟原虫种类和其它寄生的原生动物中鉴定该区域。PCR方法在下文中详细描述。从DABP,SABP和EBL家族中显示出最高保守程序的保守部位的区域设计这些引物。图3显示了这些区域和来自它们的相一致的氨基酸序列。
A.一般方法本申请中所需的许多命名法和一般实验程序可参见Sambrook等的《分子克隆实验手册》(第2版)(Vo.l 1-3)纽约、冷泉港,冷泉港实验室,1989),该手册下文称为“Sam-brook等”。
B.分离编码SABP、DABP和EBL结合区的方法本发明的核酸组合物,不论是RNA,cDAN,基因组DNA,还是各种组合的杂种,可从天然来源分离或在体外合成。要求保护的核酸可存在于转化的或转染的完整细胞中,在转化的或转染的细胞的溶胞产物中或以部分纯化或基本上纯的形式存在。
编码本发明结合区的基因的核酸操作技术,如将编码多肽的核酸序列亚克隆到表达载体上,标记探针,DNA杂交和类似操作一般在Sambrook等中已有描述,本文引用以供参考。
可使用重组DNA技术生产结合区多肽。一般来说,首先克隆编码SABP和DABP结合区的DNA或以适合物连热闹到表达载体上的形式分离。连接后,含DNA片段或插入物的载体导入合适的宿主细胞以表达重组结合区。然后从宿主细胞中分离多肽。
有许多方法分离编码SABP,DABP和EBL结合区的DNA序列。典型,使用DNA中序列特异性的标记的寡核苷酸探针从基因组或cDNA文库中分离DNA。限制性核酸内切酶消化含合适基因的基因组DNA或cDNA可用来分离编码这些蛋白质结合区的DNA。由于已知SABP和DABP基因的DNA序列,可设计一组限制性核酸内切酶在所需区域裂解该DNA。限制性核酸内切酶消化后,经过其与核酸探针杂交的能力(例如在Soutern印迹上)来鉴定编码SABP结合区域DABP结合区的DNA,使用本领域的技术人员熟悉的标准方法(见Sambrook,et al)分离这些DNA区域。
也可用聚合酶链式反应制备DABP,SABP和EBL结合区DNA。聚合酶链式反应技术(PCR)用于直接从mRNA,cD-NA基因组文库或cDNA文库中扩增DABP和SABP结合区的核酸序列。对这一方法而言,图3所示的引物是特别优选的。
用于扩增SABP和DABP结合区DNA的合适引物和探针从DNA序列分析中产生。简单地说,合成与所要扩增的DNA区域2个3′端互补的寡核苷酸引物。然后使用这2个引物进行聚合酶链式反应。见PCR Proto colsA Guide toMethods and Appeicarions Innis,M.Gelfand.D.,Sninsky,J.and White.T.,eds.,Academic Press,San Diego(1990)。根据需要,可选择引物来扩增全部DABP区域或扩增DABP和SABP结合区的小片段。
根据Beaucage,S.L和Caruthers.M.H.首先描述的固相phosphoramidite三酯方法(Tetrahedron Letts.,22(20)1859-1862,1981),使用自动合成仪化学合成用作探针的寡核苷酸,如Needham-VanDevanter,D.R.,et al.1984,NucleicAcids Res.,126159-6168中所述。寡核苷酸的纯化经过天然丙烯酰胺凝胶电泳或经过阴离子交换HPLC完成,如Pearson.J.D.and Regnier.F.E.,1983.J.Chrom.,255137-149中所述。
使用Maxam.A.M和Gilbert的化学降解方法(见W.,Grossman.L.and Moldave,D.,eds.Academic Press,NewYork,Methods in Enzymology,65499-560)可证实合成的寡核苷酸序列。
本领域的技术人员已知的其它方法也可用于分离编码SABP或DABP结合区的全部或部分的DNA。见Sambrook等。
C.DABP.SABP和EBL结合区多肽的表达一旦分离和克隆出结合区DNA,可在重组构建的细胞如细菌、酵母,昆虫(特别是使用杆状病毒载体)和哺乳动物细胞中表达所需的多肽。按期望本领域的技术人员知道许多可用于表达编码DABP和SABP结合区的DNA的表达系统。因此不再详细描述已知的在原核或真核细胞中用于表达蛋白质的各种方法。
作为简要的概述,编码结合区的天然或合成的核酸的表达典型地可经过将DNA或cDNA有效连接到启动子上(启动子可以是结构性的或是诱导性的),接着掺入表达载体中来实现。载体可适合于在原核生物或真核生物中复制和整合。典型的表达载体含有对调节编码结合区的DNA的表达有用的转录和翻译终止子,起始序列和启动子。为了获得克隆基因的高水平表达,所需构建的表达质粒最少含有一个指导转录的强启动子,一个用于翻译起始的核糖体结合位点和一个转录/翻译终止子。
1.在原核生物中的表达在E.coli中适于该目的的调节区例子是Yanofsky,C.,1984,J.Bacteriol.,1581018-1024中所述的E.coli色氨酸生物合成途径的启动子和操纵子区域和Herskowintz,I.and Hagen,D.,1980,Ann,Rev Genet.,14399-445所述的N噬菌体(PL)的左向启动子。转化进E.coli中的DNA载体包含有选择标记也是有用的。这类标记的例子包括编码氨苄青霉素,四环素或氯霉素抗性的基因。见Sambrook等关于在E.coli中使用的选择标记的详细描述。
载体的选择应使之能导入合适的宿主细胞。细菌载体是典型的质粒或噬菌体来源。用噬菌体载体颗粒感染或用裸露的噬菌体载体DNA转染合适的细菌细胞。如果使用质粒载体,用质粒载体DNA转染细菌细胞。
可使用E.coli.Bacillus sp.(Palva,I et al.,1983,Gene22229-235;Mosbach,K.et al.Nature,302543-545)和沙门氏菌优选E.coli系统。
原核细胞产生的结合区多肽可能不会正确地折叠。在从E.coli中纯化的过程中,表达的多肽可能光变性,然后再复性。这可经过将细菌产生的蛋白质溶于离液剂如盐酸胍中并用还原剂如β-巯基乙醇还原全部半胱氨酸残基来实现。然后经缓慢透折或凝胶过滤使多肽复性。见美国专利号4511503。
表达抗原的检测经过本领域已知的方法如放射免疫试验,Western印迹技术或免疫沉淀法来实现。从E.coli中的纯化可按美国专利号4511503所述的程序进行。
2.SABP,DABP和EBL结合区在真核生物中的合成本领域的技术人员已知各种真核表达系统,如酵母、昆虫细胞和哺乳动物细胞。正如下面所作的简要描述,DABP和SABP结合区也可在这些真核系统中表达。
a.在酵母中的表达异源蛋白质在酵母中的合成是人们所熟知的且有较好的描述。Methods in Yeast Genetics,Sherman,F.,et a1.,Coldspring Harbor Laboratory,(1982)是一部较好的论著,描述了在酵母中生产结合区可用的各种方法。
用于酵母的启动子例子包括GAL.,10(Johnson,M.,and Davies,R.W.,1984,Mol.and Cell,Biol.,41440-1448)ADH2(Russell,D.,et al.1983,J.Biol,Chem.,2582674-2682).PHO5(EMBO J.6675-680,1982)和MFal(Herskowitz,Iand Oshima,Y.,1982 in The Molecular Bi-ology of the Yeast Saccharomyces,(eds,Strathern,J.N.Jones,E.W.,and Broach,J.R.,Cold Spring Harbor Lab.,Cotd Sp[ring Harbor.N.Y.,PP 181-209).也可使用具有选择性标记的多拷贝质粒,如Leu-2,URA-3,Trp-1,和His-3。
许多酵母表达质粒(如YEp6,YEpb,YEp)可用作载体。可将目的基因与各种酵母载体中的任一启动子融合。上述质粒在文献中已做了充分描述(Botstein,et al.,1979,Gene,817-24;Broach,et al.,1979,Gene,8121-133)。
在转化酵母细胞中使用2种方法。在一种情况下,首先使用Zymolyase,溶细胞酶或glusulase将酵母细胞转化为原生质体,接着加入DNA和聚乙二醇(PEG)。然后在选择性条件下在3%的琼脂培养基中再生PEG处理的原生质体。在文章(J.D.Beggs,1978,Nature(London).275104-109;和Hinnen,A.,et al.,1978,Proc.Natl.Acad.Sci.USA,751929-1933)中给出了该方法的细节。第二种方法不涉及去掉细胞壁。而是将细胞用氯化锂或乙酸及PEG处理并涂布在选择性培养板上(Ito,H.,et al.,1983.J.Bact.,153163-168)。
经过溶融细胞并对溶胞产物运用标准蛋白质分离技术可以酵母中分离结合区。经过使用Western印迹技术或其它标准免疫测定技术的放免试验可实现对纯化过程的监测。
b.在哺乳动物和昆虫细胞培养物中的表达对生产结合区有用的细胞培养物的例子有昆虫或哺乳动物起源的细胞。哺乳动物细胞系统常以细胞单层的形式使用,尽管也可使用哺乳动物细胞悬液。哺乳动物细胞糸的例子包括VERO和Hela细胞,中国仓鼠卵巢(CHO)细胞系,W138,BHK.Cos-7或MDCK细胞糸。
如上面所述,用于转化宿主细胞的载体(例如质粒)优选含起动转录的DNA序列和控制抗原基因序列翻译的序列。这些序列称为表达控制序列。当宿主细胞是昆虫或哺乳动物起源的细胞时,表达控制序列的例子是得自SV-40启动子(Science,222524-527,1983),CMV I.E.启动子(Proc.Natl.Acad.Sci.81659-663,1984)或金属硫蛋白启动子(Nature 29639-42,1982)的序列。使用限制性酶裂解含表达控制序列的克隆载体,如果必要或需要的话调节其大小并以本领域熟知的方法与编码SABP或DABP多肽的DNA连接。
与酵母一样,当使用更高等动物的宿主细胞时,需要将已知哺乳动物基因的多聚腺苷化或转录终止子序列掺入载体中。终止子序列的例子是牛生长激素基因的多聚腺苷酸化序列。还应包括对转录子进行精确剪接的序列。剪接序列的例子是SV40的VP1内含子(sprague J.et al.,1983,J.Vi-rol.45773-781)。
另外,可向载体中掺入在宿主细胞中控制复制的基因序列,例如在牛乳头状瘤病毒类型载体中发现的序列(Saveria-Campo.M.,1985,“Bovine Papilloma viras DNA a EudargoticCloning Veitor”in DNA Cloniry Vol.II a praitical Approach Ed.D.M.Glover.IRL Press.Arlington.Virginia pp.213-238)。
为了进行转化,宿主细胞应是感受态或经过各种方法使其成为感受态。有一些熟知的方法诱导DNA进入动物细胞。这些磷酸钙沉淀法,将受体细胞含DNA的细菌原生质体融合,用含DAN的脂质体处理受体细胞,DEAE葡聚糖,电穿孔和将DNA直接显微注射进细胞。
以本领域,已知的方法培养转化的细胞(BiochenicalMethods in Cell Culture and Virologg,Kuchler,R.J.Dowden,Hutchinson and Ross.Inc.(1977)。从以悬液或单层生长的细胞中分离表达的DABP和SABP结合区多肽。对于单层的回收使用熟知的机械,化学或酶方法。
c.在重组牛痘病毒或腺病毒感染的细胞中表达除了在重组表达系统中使用外,分离的结合区DNA序列也可用于转化在病人中的转染宿主细胞的病毒。活的减毒病毒(如牛痘或腺病毒)是疫苗的常规选择,因为它们生产成本低且易于运输和施用。在免疫方法中有用的牛痘载体和方法已有描述,例如美国专利号422848,本文引用以供参考。
用于本发明的合适的病毒包括(但不限于)痘病毒(如金丝雀痘和牛痘病毒),牛痘病毒,α病毒,腺病毒和其它动物病毒。可使用本领域熟知的方法生产重组病毒,例如使用同源重组或连接工种质粒的方法。例如,重组金丝雀痘或奶牛痘病毒的制备可经过将编码DABP和SABP结合区多肽的DNA插入质粒,使其两端以病毒序列为侧翼。然后通过同源重组将编码结合区的DNA插入病基因组中。
例如,重组腺病毒的生产可经过将各含大约50%病毒序列的2种质粒与编码红细胞结合区多肽的DNA序列连接起来。重组RNA病毒(如α病毒)的制备可使用本领域已知的方法经CDNA介导制备。
到于牛痘病毒(例如WR株),经过包括同源重组的许多方法,使用转移载体pTKgpt-OFIS可将编码结合区的DNA序列插入基因组中,如Kaslow.et al.,Science 2521310-1313(1991)中所述,本文引用以供参考。
作为选择,编码SABPS和DABP结合区的DNA可插入另一设计的质粒(例如PGS62)中以生产重组中痘(Langford,C.L.,et al.,1980,Mol.Cell.Biol.63191-3199)。这种质粒由用于插入外源基因的克隆位点,指导插入基因合成的痘P7.5启动子和在外源基因两端侧翼的牛痘TK基因组成。
可使用编码DABP和SABP结合区多肽的cDNA经DNA杂交和使用表达结合区多肽特异性的抗体经免疫检测技术来进行重组病毒生产的证实。病毒种子的制备可经过感染细胞(例如HELA S3旋转细胞)并收获病毒子代实现。
本发明的重组病毒可用于哺乳动物(如小鼠或人类)中诱导抗-SABP和抗-DABP结合区抗体。另外,可经过体外感染宿主细胞,该宿主细胞随后表达多肽来将重组病毒用于生产SABP和DABP结合区(见上面SABP和DABP结合区在真核细胞中的表达部分)。
本发明还涉及用重组病毒感染的宿主细胞。本发明的宿主细胞优选哺乳动物,如BSC-1细胞。以重组病毒感染的宿主细胞在其细胞表面表达DABP和SABP结合区。另外,当用于接种或加强预先接种的哺乳动物时,感染细胞的膜提取物诱导保护性抗体。
D.SABP,DABP和EBL结合区多肽的纯化重组DNA技术产生的结合区多肽可使用本领域的技术人员熟知的标准技术来纯化。重组产生的结合区多肽可直接表达或以融合蛋白质的形式表达。然后将细胞溶合(例如声处理)和亲合色谱结合使用来纯化蛋白质。对于融全产物,随后用合适的蛋白裂解酶消化融合蛋白以释放所需的SABP和DABP结合区。
本发明的多肽可用本领域熟知的标准技术纯化成基本纯的产品,这些技术包括用诸如硫酸铵的物质进行选择性沉淀,柱色谱免疫纯化方法和其它方法。例如,见R.Scopes.Pro-tein PurifieationPrinciples and Practice,Springer-VelagNewYork(1982),本文引用以供参考。
E.以蛋白质化学技术生产结合区可用大量各种各样的方法结合成制备本发明的多肽。例如大小相当短的多肽可按常规技术在溶液中或在固体支持物上合成。各种自动合成仪可以商品的形式买到并根据已知的方法使用,例如见Stewart and Young,Solid Pharse PeptideSynthesis,2d.ed.,Pierce Chemical Co.(1984)。
作为选择,可蛋白裂解酶处理纯化的和分离的SABP,DABP或EBL家族蛋白质以生产结合区多肽。例如,重组DABP和SABP蛋白质可用于该目的。然后可分析DABP和SABP蛋白质的序列以选择蛋白裂解酶,用于生产含DABP和SABP结合区的所需区域的多肽。然后经过使用蛋白质和肽纯化的标准技术纯化所需多肽。至于标准技术,可见Meth-ods in Enzymology,″Guide to Protein Purification″M.Deutscher,ed.Vol.182(1990),Page619-626,本文引用以供参考。
F.核酸和多肽序列的修饰用于转染宿主细胞以生产重组结合区多肽的核苷酸序列可标准技术进行修饰以产生是有各种所需特征的结合区多肽。本发明的结合区多肽经使用本领域的技术人员熟知的各种重组DNA技术可较容易的设计和生产。例如可以氨基酸插入,取代,缺失和类似技术从天然存在的序列在一级结构水平上改变结合区多肽。可使用这些修饰的许多组合以生产最终的修饰的蛋白质链。
可据各种主观目的制备氨基酸序列的变异体,包括利于纯化和制备的重组多肽。修饰的多肽对于改变血桨半衰期,提高治疗效力和降低治疗使用中副作用的严重性或发生率也是有用的。氨基酸序列变异体通常是预先确定的变异体,它在自然是中不存在但与天然存在的多肽表现出相同的免疫活性。例如,可生产仅包含一级结构一部分(通常是至少大约60-80%,典型的是90-95%)的多肽片段。为用作疫苗,典型的多肽片段的长度应优选至少保留一个能诱导封闭抗体生产的抗原决定基。
一般来说编码结合区多肽序列的修饰应以各种熟知的技术易于完成,如用定点突变技术(见.Giliman and Smith,Gene 881-97(1979)and Roberts.S.et al.,Nature 328;731-734(1987))。一个普通技术人员将感到许多突变的效果难以预料。因此大多数修饰在争对所需特征的合适试验中经常规筛选来评价。例如,多肽免疫特征的改变可用合适的竞争性结合试验来检测。其它特征的修饰,如氧化还原或热稳定性,疏水性,对蛋白裂解的敏感性或凝集倾向性都可根据标准技术来测定。
G.诊断和筛选试验本发明的多肽可用于在生物样品中裂殖子检测的诊断学应用。使用一些较好识别的以免疫结果为基础的特异性结合试验可检测寄生物的存在(见美国专利436624143761104517288和4837168,本文引用以供参考)。例如,抗本发明多肽的标记的单克隆抗体可用于检测生物学样品中的裂殖子。作为选择,本发明标记的多肽可用于检测生物学样品中抗SABP或DABP抗体的存在。至于诊断性免疫试验中的一般方法,也见Basic and Clinical Immunology tth Edition(CD.Sti es and A.Terr edy)1991,本文引用以供参考。
另外,修饰的多肽,抗体或其它能抑制SABP或DABP与红细胞间相互作用的化合物可测定生物活性。例如,多肽可在细胞表面以重组形式进行表达且可按下面所述测定细胞结合红细胞的能力。作为选择,可试验肽或抗体抑制红细胞与裂殖子或SABP和DABP之间的结合的能力。
也可使用无细胞试验测定DABP和SABP多肽与分离的Duffy抗原或血型糖蛋白多肽的结合。例如,红细胞蛋白质可被固着于固体表面并可测定标记的SABP或DABP多肽的结合。
许多试验方法使用标记的试验成份。标记系统可以是各种形式。可根据本领域熟知的方法将标记物与试验所需的成份直接或间接偶联。可使用大范围的各种标记物。成份可用一些方法中的任意一种进行标记。最常用的检测方法是使用对3H,125I,35S,14C或32P标记的成份或类似物进行放射自显影。非放射活性标记包括与标记的抗体,荧光团,化学发光剂,酶和能用作标记配体的特异性结合对成员的抗体相结合的配体。标记的选择取决于所需的灵敏性,与化合物连接的容易程度,稳定性需要和可得到的仪器。
另外,本发明的多肽可使用本领域的技术人员熟知的动物模型来试验。用于镰状疟原虫的体内模型包括Aotus sp。猴或黑猩猩;用于间日疟原虫的体内模型Saimiri猴。
H.含有结合区多肽的药用组合物本发明的多肽在治疗疟疾的治疗学和预防学应用中有用。本发明的药用组合物适用于各种药品传递系统。用于本发明的合适配方见Remington′s Pharmaceutical Sciences,Mack Publishing Company,Philadelphia,PA,17th ed.(1985),本文引用以供参考。至于药品传递方法的简要描述见Langer,Science 2491527-1533(1990),本文引用以供参考。
本发明的多肽可以药用和疫苗组合物使用,它们在治疗哺乳动物,特别是人类中是有用的。多肽可在某些情况下一起施用(例如在很可能同时被镰状疟原虫和间日疟原虫感染的情况下)。因此,单个药用组合物就可用于或预防由两种疟原虫引起的疟疾。
组合物适用于一次施用或系列地施用。当以系列给药时,在起始用药后依次进行接种以加强免疫反应,典型地称为加强接种。
本发明的药用组合物打算用于肠胃外,局部,口服或定点用药。优选的是药用组合物经肠胃外施用,例如经静脉内,皮下,皮内或肌肉内用药。因此,本发明提供的经肠胃外施用的组合物包含上述试剂溶于或悬浮于一种可接受的载体(优选一种含水载体)中的溶液。可使用各种含水载体,例如,水,缓冲水,0.4%盐水,0.3%甘氨酸,透明质酸和类似物。这些组合物可用常规熟知的灭菌技术来灭菌或可过滤灭菌。所得水溶液可包装备用或经冻干。施用前将冻干制品与无溶液混合。按照挖近似生理条件的需要组合物可含药用上可接受的辅助物质,如pH调节和缓冲剂,张力调节剂,润湿剂和类似物。例如醋酸钠、乳酸钠、氯化钠、氯化钾、氯化钙、山梨聚糖单月桂酸酯,三乙醇胺油酸酯等。
至于固态组合物,可使用常规无毒固态载体,例如包括药用级的甘露醇、乳糖、淀粉、硬脂酸镁、糖精钠、滑石、纤维素、葡萄糖、蔗糖、碳酸镁和类似物。对于口服用药,药用上可接受的无毒组合物经掺入任意一种通常使用的赋形剂(如前面列出的那些载体)和通常10-95%的活性成份(更优选25%-75%的浓度)来形成。
对于以烟雾剂进行的用药,优选使用以细小的分离形式与表面活性剂和推进剂一起的多肽。当然,表面活性剂必须是无毒的并优选可溶于推进剂。这种试剂的代表是酯或部分含6到22个碳原子的脂肪酸酯,如己酸、辛酸、月桂酸、软脂酸、硬脂酸、亚油酸、亚麻酸、olesteric和油酸的脂肪族多羟基醇酯或其环酐。可使用混合的酯,如混合的或天然的甘油酯。如果需要,也可包括一种载体,例如以鼻内用药时可含卵磷脂。
在一些实施例中,可用SABP或DABP多肽或其它特异性抑制(例如单克隆抗体)治疗疟疾病人以阻止疟原虫属裂殖子和裂殖体与红细胞表面的结合。
病人用药量的范围取决于施用何种药物,病人的状态和用药方式。在治疗应用中,给已患有疟疾的病人施用的组合物的量应足以抑制疟原虫通过红细胞的传播并因此治愈或至少部分控制该疾病和其并发症的症状。是以实现该目的的量定义为“治疗有效量”。对这一用途有效的量取决于疾病的严重性和病人的体重和一般状态。但一般范围是每天大约1mg到大约5gm,对于70kg的病人,优选大约100mg。
作为选择,本发明的多肽可在预防上用作疫苗。本发明的疫苗含作为有效成份的免疫有效量的结合区多肽或本文所述的重组病毒。免疫应答可包括抗体的产生,抗存在来自本发明SABP、DABP或EBL序列编码肽的多肽的细胞之细胞毒T淋巴细胞(CFL)的激活,或本领域已知的其它机制。例如见Paul Funp damental Immunology Second Edition Pub-lished by Roven press New York(本文引用以供参考)关于免疫应答的描述。有用的载体是本领域所熟知的,例如它们包括甲状腺球蛋白,诸如人血清白蛋白的白蛋白,破伤风类毒素。多聚氨基酸如聚(D-赖氨酸D-谷氨酸),流感、肝炎B病毒核心蛋白质,肝炎B病毒重组疫苗。疫苗也可含有生理耐受性(可接受的)稀释剂,如水,磷酸盐缓冲液,或盐水,典型地还含有佐剂。诸如不完全Freund氏佐剂,磷酸铝,氢氧化铝,或明矾的佐剂是本领域熟知的物质。
编码SABP或DABP结合区和EBL基因家族基序的DNA或RNA可导入病人以获得对核酸编码的多肽的免疫应答。Wolff et,al.,Science2471465-1468(1990)(本文引用以供参考)描述了核酸在引起该核酸编码的基因表达中的使用。
含本发明的多肽,核酸或病毒的疫苗组合物施用给病人以诱导抗该多肽的保护性免疫应答。“保护性免疫应答”指阻止或抑制疟原虫通过红细胞的扩散,从而至少部分阻止该疾病和其并发疟的症状。是以达到这一目的的量定义的“免疫有效剂量”。在这一用途中有效的量取决于所用的组合物,用药方式,病人的体重和一般健康状态,以及处方医生的判断。对于多肽组合物,开始免疫的一般范围(治疗或预防用药)用于70kg的病人是从大约10μg到大约1gm的多肽,随后的加强剂量按照从几周到几月(取决于病人的反应和状态,例如,经测量病人血液中的疟原虫水平)的加强方式从大约100μg到大约1gm的多肽。对于核酸,典型地将30-1000μg的核酸注射入70kg的病人,更典型地将大约50-150μg的核酸注射入70kg的病人,接着如果合适就注射加强剂量。
下面以说明的方式而不是限制的方式提供实施例。
实施例作为红细胞结合区的SABP和DABP氨基末端,半脱氨酸富集区的鉴定1.SABP结合区多肽在Cos细胞表面的表达为了证实SABP蛋白质的氨基末端,半胱氨酸富集区是唾液酸结合区,在哺乳动物Cos细胞表面体外表达蛋白质的这一区域。这一DNA序列是SABP DNA序列(SEQ ID No3)上从位置1到位置1848。聚合酶链式反应技术(PCR)用于直接从克隆基因中扩增SABP DNA的这一区域。
将与Pvu II或Apa I的限制性内切酶位点相对应的序列掺入用于PCR扩增的寡核苻酸序列中以利于将PCR扩增区域插入pRE4载体中(见下面)。合成特异性的寡核苷酸5′-ATCGATCAGCTGGGAAGAAATACTTCATCT-3′。这些寡核甘酸用作PCR扩增编码SABP蛋白半胱氨酸富集的氨基末端区的DNA序列区的引物。
PCR条件以Saiki,et al.,Science239487-491(1988)描述的标准为基础。从经过剪接并以单个开架阅读框片段再克隆的编码SABP的基因克隆片段提供模板DNA。
用于在Cos细胞中表达的载体pRE4如图1所示。该载体有一个SV40复制起,一个氨苄青霉素抗性标记和在Rous肉瘤病毒长末端重复(RSV LTR)下游克隆的单纯疱疹病毒糖蛋白D基因(HSV glyd)。使用HSV glyd上的Pvu II和ApaI位点切除HSV glyd基因的部分细胞外区域。
如上面所述,PCR寡核苷酸引物含Pvu II或Apa I限制性位点,用限制性酶Pvu II和Apa I消化上面得到的PCR扩增的DNA片段并克隆到载体pRE4的Pvu II和Apa I位点上。设计这些构建体来表达以在N末端与HSV glyd信号序列及在C末端与HSV glyd跨膜和胞质区嵌合的蛋白质形式出现的SABP蛋白质区域。HSV glyd信号区将这些嵌合蛋白质定位于Cos细胞表面,HSV glyd跨膜片段将这些嵌合蛋白质锚着于Cos细胞表面。
根据标准技术以磷酸钙沉淀法用含PCR扩增的SABPDNA区域的pRE4构建体转染哺乳动物Cos细胞。
2.DABP结合区多肽在Cos细胞表面的表达为了证实DABP蛋白质的氨基末端半胱氨酸富集区是结合区,在Cos细胞表面表达这一区域。首先从位置1-975经PCR扩增DNA序列的这一区域(SEQ ID NO.1)。
将与Pvu II和Apa I的限制性核酸内切酶位点相对应的序列掺入用于PCR扩增的寡核苷酸探针中。以利于随后将扩增的DNA插入pRE4载体中,如上所述。合成寡核苷酸5′-TCTCGTCAGCTGACGATCTCTAGTGCTATT-3′和5′-ACGAGTGGGCCCTGTCACAACTTCCTGAGT-3′。这些寡核苷酸用作引物,使用与上面所述相同的条件直接从克隆的DABP基因中扩增编码DABP蛋白质半胱氨酸富集的氨基末端区的DABP DNA序列区域。
也使用与上面在Cos细胞表达SABP区域部分中所述相同的pRE4载体作为DABP DNA区域的载体。
3.与红细胞的结合试验为了证实它们与人红细胞结合的能力,将转染的表达DABP和SABP结合区的Cos细胞与红细胞在培养基(DMEM/10%FBS)中37℃下培养2小时。用磷酸盐缓冲液洗涤5次去掉未附着的红细胞用光学显微镜观察结合的细细胞。在其表面表达氨基末端半胱氨酸富集的SABP多肽的Cos细胞与未处理的人红细胞结合,但不与神经氨酸苷酶处理的红细胞(即在其表面缺乏唾液酸残基,资料未显示)结合。在其表面表达SABP蛋白质其它区域的Cos细胞不结合人红细胞(资料未显示)。这些结果将SABP的氨基末端半胱氨酸富集区鉴定为红细胞结合区,表明表达这些区域的Cos细胞与人红细胞的结合是特异性的。而且,表达区与红细胞的结合与在结合红细胞方面可信的SABP-175分子所见的结合方式相同。
同样地,在其表面表达DABP氨基末端半胱氨酸富集区的Cos细胞结合Duffy阳性人红细胞,但不结合Duffy阴性人红细胞(即缺乏Duffy血型抗原的红细胞,资料未显示)。在其表面表达DABP蛋白质其它区域的Cos细胞不结合人红细胞(资料未显示)。这些结果将DABP氨基末端半胱氨酸富集区鉴定为红细胞结合区并表明Cos细胞的结合是特异性的。
序列描述(1)一般资料(I)申请人(A)名称美国,国有健康与人类服务部(B)街道6011 Executive Blvd.,Suite 325(C)城市Rockville(D)州马里兰(E)国家美国(F)邮编20852(G)电话(301)496-7056(H)电传(301)402-0220(I)电信(II)发明题目间日疟原虫和镰状疟原虫红细胞结合蛋白的结合区(III)序列数16(IV)计算机可读形式(A)媒体类型Floppy盘(B)计算机IBM PC兼容性(C)操作系统PC-DOS/MS-DOS(D)软件Patent In Realease #1.0,Version #1.25(V)最近申请资料(A)申请号PCT/US94/10230(B)申请日1994年9月7日(C)分类(VI)优先权申请资料(A)申请号US 08/119,677(B)申请日1993年9月10日(2)SEQ ID NO1资料(I)序列特征(A)长度4084碱基对(B)类型核酸(C)链型单链(D)拓扑线型(II)分子类型DNA(基因组)(III)假定非(VI)原始来源(A)生物间日疟原虫(XI)序列描述SEQ ID NO1AAGCTTTTAA AAATAGCAAC AAAATTTCGA AACATTGCCA CAAAAATTTT ATGTTTTACA 60TATATTTAGA TTCATACAAT TTAGGTGTAC CCTGTTTTTT GATATATGCG CTTAAATTTT120TTTTTCGCTC ATATGTTTAG TTATATGTGT AGAACAACTT GCTGAATAAA TTACGTACAC180TTTCTGTTCT GAATAATATT ACCACATACA TTTAATTTTA AATACTATGA AAGGAAAAAA240CCGCTCTTTA TTTGTTCTCC TAGTTTTATT ATTGTTACAC AAGGTATCAT ATAAGGATGA300TTTTTCTATC ACACTAATAA ATTATCATGA AGGAAAAAAA TATTTAATTA TACTAAAAAG360AAAATTAGAA AAAGCTAATA ATCGTGATGT TTGCAATTTT TTTCTTCATT TCTCTCAGGT420AAATAATGTA TTATTAGAAC GAACAATTGA AACCCTTCTA GAATGCAAAA ATGAATATGT480GAAAGGTGAA AATGGTTATA AATTAGCTAA AGGACACCAC TGTGTTGAGG AAGATAACTT540AGAACGATGG TTACAAGGAA CCAATGAAAG AAGAAGTGAG GAAAATATAA AATATAAATA600TGGAGTAACG GAACTAAAAA TAAAGTATGC GCAAATGAAT GGAAAAAGAA GCAGCCGCAT660TTTGAAGGAA TCAATTTACG GGGCGCATAA CTTTGGAGGC AACAGTTACA TGGAGGGAAA720AGATGGAGGA GATAAAACTG GGGAGGAAAA AGATGGAGAA CATAAAACTG ATAGTAAAAC780TGATAACGGG AAAGGTGCAA ACAATTTGGT AATGTTAGAT TATGAGACAT CTAGCAATGG840CCAGCCAGCG GGAACCCTTG ATAATGTTCT TGAATTTGTG ACTGGGCATG AGGGAAATTC900TCGTAAAAAT TCCTCGAATG GTGGCAATCC TTACGATATT GATCATAAGA AAACGATCTC960TAGTGCTATT ATAAATCATG CTTTTCTTCA AAATACTGTA ATGAAAAACT GTAATTATAA 1020GAGAAAACGT CGGGAAAGAG ATTGGGACTG TAACACTAAG AAGGATGTTT GTATACCAGA 1080TCGAAGATAT CAATTATGTA TGAAGGAACT TACGAATTTG GTAAATAATA CAGACACAAA 1140TTTTCATAGG GATATAACAT TTCGAAAATT ATATTTGAAA AGGAAACTTA TTTATGATGC 1200TGCAGTAGAG GGCGATTTAT TACTTAAGTT GAATAACTAC AGATATAACA AAGACTTTTG 1260CAAGGATATA AGATGGAGTT TGGGAGATTT TGGAGATATA ATTATGGGAA CGGATATGGA 1320AGGCATCGGA TATTCCAAAG TAGTGGAAAA TAATTTGCGC AGCATCTTTG GAACTGATGA 1380AAAGGCCCAA CAGCGTCGTA AACAGTGGTG GAATGAATCT AAAGCACAAA TTTGGACAGC 1440AATGATGTAC TCAGTTAAAA AAAGATTAAA GGGGAATTTT ATATGGATTT GTAAATTAAA 1500TGTTGCGGTA AATATAGAAC CGCAGATATA TAGATGGATT CGAGAATGGG GAAGGGATTA 1560CGTGTCAGAA TTGCCCACAG AAGTGCAAAA ACTGAAAGAA AAATGTGATG GAAAAATCAA 1620TTATACTGAT AAAAAAGTAT GTAAGGTACC ACCATGTCAA AATGCGTGTA AATCATATGA 1680TCAATGGATA ACCAGAAAAA AAAATCAATG GGATGTTCTG TCAAATAAAT TCATAAGTGT 1740AAAAAACGCA GAAAAGGTTC AGACGGCAGG TATCGTAACT CCTTATGATA TACTAAAACA 1800GGAGTTAGAT GAATTTAACG AGGTGGCTTT TGAGAATGAA ATTAACAAAC GTGATGGTGC 1860ATATATTGAG TTATGCGTTT GTTCCGTTGA AGAGGCTAAA AAAAATACTC AGGAAGTTGT 1920GACAAATGTG GACAATGCTG CTAAATCTCA GGCCACCAAT TCAAATCCGA TAAGTCAGCC 1980TGTAGATAGT AGTAAAGCGG AGAAGGTTCC AGGAGATTCT ACGCATGGAA ATGTTAACAG 2040TGGCCAAGAT AGTTCTACCA CAGGTAAAGC TGTTACGGGG GATGGTCAAA ATGGAAATCA 2100GACACCTGCA GAAAGCGATG TACAGCGAAG TGATATTGCC GAAAGTGTAA GTGCTAAAAA 2160TGTTGATCCG CAGAAATCTG TAAGTAAAAG AAGTGACGAC ACTGCAAGCG TTACAGGTAT 2220TGCCGAAGCT GGAAAGGAAA ACTTAGGCGC ATCAAATAGT CGACCTTCTG AGTCCACCGT 2280TGAAGCAAAT AGCCCAGGTG ATGATACTGT GAACAGTGCA TCTATACCTG TAGTGAGTGG 2340TGAAAACCCA TTGGTAACCC CCTATAATGG TTTGAGGCAT TCGAAAGACA ATAGTGATAG 2400CGATGGACCT GCGGAATCAA TGGCGAATCC TGATTCAAAT AGTAAAGGTG AGACGGGAAA 2460GGGGCAAGAT AATGATATGG CGAAGGCTAC TAAAGATAGT AGTAATAGTT CAGATGGTAC 2520CAGCTCTGCT ACGGGTGATA CTACTGATGC AGTTGATAGG GAAATTAATA AAGGTGTTCC 2580TGAGGATAGG GATAAAACTG TAGGAAGTAA AGATGGAGGG GGGGAAGATA ACTCTGCAAA 2640TAAGGATGCA GCGACTGTAG TTGGTGAGGA TAGAATTCGT GAGAACAGCG CTGGTGGTAG 2700CACTAATGAT AGATCAAAAA ATGACACGGA AAAGAACGGG GCCTCTACCC CTGACAGTAA 2760ACAAAGTGAG GATGCAACTG CGCTAAGTAA AACCGAAAGT TTAGAATCAA CAGAAAGTGG 2820AGATAGAACT ACTAATGATA CAACTAACAG TTTAGAAAAT AAAAATGGAG GAAAAGAAAA 2880GGATTTACAA AAGCATGATT TTAAAAGTAA TGATACGCCG AATGAAGAAC CAAATTCTGA 2940TCAAACTACA GATGCAGAAG GACATGACAG GGATAGCATC AAAAATGATA AAGCAGAAAG 3000GAGAAAGCAT ATGAATAAAG ATACTTTTAC GAAAAATACA AATAGTCACC ATTTAAATAG 3060TAATAATAAT TTGAGTAATG GAAAATTAGA TATAAAAGAA TACAAATACA GAGATGTCAA 3120AGCAACAAGG GAAGATATTA TATTAATGTC TTCAGTACGC AAGTGCAACA ATAATATTTC 3180TTTAGAGTAC TGTAACTCTG TAGAGGACAA AATATCATCG AATACTTGTT CTAGAGAGAA 3240AAGTAAAAAT TTATGTTGCT CAATATCGGA TTTTTGTTTG AACTATTTTG ACGTGTATTC 3300TTATGAGTAT CTTAGCTGCA TGAAAAAGGA ATTTGAAGAT CCATCCTACA AGTGCTTTAC 3360GAAAGGGGGC TTTAAAGGTA TGCAGAAAAA GATGCTGAAT AGAGAAAGGT GTTGAGTAAA 3420TTAAAAAGGA ATTAATTTTA GGAATGTTAT AAACATTTTT GTACCCAAAA TTCTTTTTGC 3480AGACAAGACT TACTTTGCCG CGGCGGGAGC GTTGCTGATA CTGCTGTTGT TAATTGCTTC 3540AAGGAAGATG ATCAAAAATG AGTAACCAGA AAATAAAATA AAATAACATA AAATAAAATA 3600AAAACTAGAA TAACAATTAA AATAAAATAA AATGAGAAAT GCCTGTTAAT GCACAGTTAA 3660TTCTAACGAT TCCATTTGTG AAGTTTTAAA GAGAGCACAA ATGCATAGTC ATTATGTCCA 3720TGCATATATA CACATATATG TACGTATATA TAATAAACGC ACACTTTCTT GTTCGTACAG 3780TTCTGAAGAA GCTACATTTA ATGAGTTTGA AGAATACTCT GATAATATTC ACAGAATCCC 3840TCTGATGCCT AACAGTAATT CAAATTTCAA GAGCAAAATT CCATTTAAAA AGAAATGTTA 3900CATCATTTTG CGTTTTTCTT TTTTTCTTTT TTTTTTCTTT TTTAGATATT GAACACATGC 3960AGCCATCAAC CCCCCTGGAT TATTCATGAT GCTACTTTGG TAAGTAAAAG CAATTCTGAT 4020TGTAGTGCTG ATGTAATTTT AGTCATTTTG CTTGCTGCAA TAAACGAGAA AATATATCAA 4080GCTT4084(2)SEQ ID NO2资料(I)序列特征(A)长度1115氨基酸(B)类型氨基酸(C)链型单链(D)拓扑线型(II)分子类型蛋白质(III)假定的非(VI)原始来源(A)生物间日疟原虫(XI)序列描述SEQ ID NO2Met Lys Gly Lys Asn Arg Ser Leu Phe Val Leu Leu Val Leu Leu Leu1 5 10 15Leu His Lys Val Ser Tyr Lys Asp Asp Phe Ser Ile Thr Leu Ile Asn20 25 30Tyr His Glu Gly Lys Lys Tyr Leu Ile Ile Leu Lys Arg Lys Leu Glu35 40 45Lys Ala Asn Asn Arg Asp Val Cys Asn Phe Phe Leu His Phe Ser Gln50 55 60Val Asn Asn Val Leu Leu Glu Arg Thr Ile Glu Thr Leu Leu Glu Cys65 70 75 80Lys Asn Glu Tyr Val Lys Gly Glu Asn Gly Tyr Lys Leu Ala Lys Gly85 90 95His His Cys Val Glu Glu Asp Asn Leu Glu Arg Trp Leu Gln Gly Thr100 105 110Asn Glu Arg Arg Ser Glu Glu Asn Ile Lys Tyr Lys Tyr Gly Val Thr115 120 125Glu Leu Lys Ile Lys Tyr Ala Gln Met Asn Gly Lys Arg Ser Ser Arg130 135 140Ile Leu Lys Glu Ser Ile Tyr Gly Ala His Asn Phe Gly Gly Asn Ser145 150 155 160Tyr Met Glu Gly Lys Asp Gly Gly Asp Lys Thr Gly Glu Glu Lys Asp165 170175Gly Glu His Lys Thr Asp Ser Lys Thr Asp Asn Gly Lys Gly Ala Asn180 185 190Asn Leu Val Met Leu Asp Tyr Glu Thr Ser Ser Asn Gly Gln Pro Ala195 200 205Gly Thr Leu Asp Asn Val Leu Glu Phe Val Thr Gly His Glu Gly Asn210 215 220Ser Arg Lys Asn Ser Ser Asn Gly Gly Asn Pro Tyr Asp Ile Asp His225 230 235 240Lys Lys Thr Ile Ser Ser Ala Ile Ile Asn His Ala Phe Leu Gln Asn245 250 255Thr Val Met Lys Asn Cys Asn Tyr Lys Arg Lys Arg Arg Glu Arg Asp260 265 270Trp Asp Cys Asn Thr Lys Lys Asp Val Cys Ile Pro Asp Arg Arg Tyr275 280 285Gln Leu Cys Met Lys Glu Leu Thr Asn Leu Val Asn Asn Thr Asp Thr290 295 300Asn Phe His Arg Asp Ile Thr Phe Arg Lys Leu Tyr Leu Lys Arg Lys305 310 315 320Leu Ile Tyr Asp Ala Ala Val Glu Gly Asp Leu Leu Leu Lys Leu Asn325 330 335Asn Tyr Arg Tyr Asn Lys Asp Phe Cys Lys Asp Ile Arg Trp Ser Leu340 345 350Gly Asp Phe Gly Asp Ile Ile Met Gly Thr Asp Met Glu Gly Ile Gly355 360 365Tyr Ser Lys Val Val Glu Asn Asn Leu Arg Ser Ile Phe Gly Thr Asp370 375 380Glu Lys Ala Gln Gln Arg Arg Lys Gln Trp Trp Asn Glu Ser Lys Ala385 390 395 400Gln Ile Trp Thr Ala Met Met Tyr Ser Val Lys Lys Arg Leu Lys Gly405 410 415Asn Phe Ile Trp Ile Cys Lys Leu Asn Val Ala Val Asn Ile Glu Pro420 425 430Gln Ile Tyr Arg Trp Ile Arg Glu Trp Gly Arg Asp Tyr Val Ser Glu435 440 445Leu Pro Thr Glu Val Gln Lys Leu Lys Glu Lys Cys Asp Gly Lys Ile450 455 460Asn Tyr Thr Asp Lys Lys Val Cys Lys Val Pro Pro Cys Gln Asn Ala465 470 475 480Cys Lys Ser Tyr Asp Gln Trp Ile Thr Arg Lys Lys Asn Gln Trp Asp485 490 495Val Leu Ser Asn Lys Phe Ile Ser Val Lys Asn Ala Glu Lys Val Gln500 505 510Thr Ala Gly Ile Val Thr Pro Tyr Asp Ile Leu Lys Gln Glu Leu Asp515 520 525Glu Phe Asn Glu Val Ala Phe Glu Asn Glu Ile Asn Lys Arg Asp Gly
530 535 540Ala Tyr Ile Glu Leu Cys Val Cys Ser Val Glu Glu Ala Lys Lys Asn545 550 555 560Thr Gln Glu Val Val Thr Asn Val Asp Asn Ala Ala Lys Ser Gln Ala565 570 575Thr Asn Ser Asn Pro Ile Ser Gln Pro Val Asp Ser Ser Lys Ala Glu580 585 590Lys Val Pro Gly Asp Ser Thr His Gly Asn Val Asn Ser Gly Gln Asp595 600 605Ser Ser Thr Thr Gly Lys Ala Val Thr Gly Asp Gly Gln Asn Gly Asn610 615 620Gln Thr Pro Ala Glu Ser Asp Val Gln Arg Ser Asp Ile Ala Glu Ser625 630 635 640Val Ser Ala Lys Asn Val Asp Pro Gln Lys Ser Val Ser Lys Arg Ser645 650 655Asp Asp Thr Ala Ser Val Thr Gly Ile Ala Glu Ala Gly Lys Glu Asn660 665 670Leu Gly Ala Ser Asn Ser Arg Pro Ser Glu Ser Thr Val Glu Ala Asn675 680 685Ser Pro Gly Asp Asp Thr Val Asn Ser Ala Ser Ile Pro Val Val Ser690 695 700Gly Glu Asn Pro Leu Val Thr Pro Tyr Asn Gly Leu Arg His Ser Lys705 710 715 720Asp Asn Ser Asp Ser Asp Gly Pro Ala Glu Ser Met Ala Asn Pro Asp725 730 735Ser Asn Ser Lys Gly Glu Thr Gly Lys Gly Gln Asp Asn Asp Met Ala740 745 750Lys Ala Thr Lys Asp Ser Ser Asn Ser Ser Asp Gly Thr Ser Ser Ala755 760 765Thr Gly Asp Thr Thr Asp Ala Val Asp Arg Glu Ile Asn Lys Gly Val770 775 780Pro Glu Asp Arg Asp Lys Thr Val Gly Ser Lys Asp Gly Gly Gly Glu785 790 795 800Asp Asn Ser Ala Asn Lys Asp Ala Ala Thr Val Val Gly Glu Asp Arg805 810 815Ile Arg Glu Asn Ser Ala Gly Gly Ser Thr Asn Asp Arg Ser Lys Asn820 825 830Asp Thr Glu Lys Asn Gly Ala Ser Thr Pro Asp Ser Lys Gln Ser Glu835 840 845Asp Ala Thr Ala Leu Ser Lys Thr Glu Ser Leu Glu Ser Thr Glu Ser850 855 860Gly Asp Arg Thr Thr Asn Asp Thr Thr Asn Ser Leu Glu Asn Lys Asn865 870 875 880Gly Gly Lys Glu Lys Asp Leu Gln Lys His Asp Phe Lys Ser Asn Asp885 890 895Thr Pro Asn Glu Glu Pro Asn Ser Asp Gln Thr Thr Asp Ala Glu Gly900 905 910His Asp Arg Asp Ser Ile Lys Asn Asp Lys Ala Glu Arg Arg Lys His915 920 925Met Asn Lys Asp Thr Phe Thr Lys Asn Thr Asn Ser His His Leu Asn930 935 940Ser Asn Asn Asn Leu Ser Asn Gly Lys Leu Asp Ile Lys Glu Tyr Lys945 950 955 960Tyr Arg Asp Val Lys Ala Thr Arg Glu Asp Ile Ile Leu Met Ser Ser965 970 975Val Arg Lys Cys Asn Asn Asn Ile Ser Leu Glu Tyr Cys Asn Ser Val980 985 990Glu Asp Lys Ile Ser Ser Asn Thr Cys Ser Arg Glu Lys Ser Lys Asn995 10001005Leu Cys Cys Ser Ile Ser Asp Phe Cys Leu Asn Tyr Phe Asp Val Tyr101010151020Ser Tyr Glu Tyr Leu Ser Cys Met Lys Lys Glu Phe Glu Asp Pro Ser1025103010351040Tyr Lys Cys Phe Thr Lys Gly Gly Phe Lys Ile Asp Lys Thr Tyr Phe104510501055Ala Ala Ala Gly Ala Leu Leu Ile Leu Leu Leu Ile Ala Ser Arg Lys106010651070Met Ile Lys Asn Asp Ser Glu Glu Ala Thr Phe Asn Glu Phe Glu Glu107510801085Tyr Cys Asp Asn Ile His Arg Ile Pro Leu Met Pro Asn Asn Ile Glu109010951100His Met Gln Pro Ser Thr Pro Leu Asp Tyr Ser110511101115(2)SEQ ID NO3资料(I)序列特征(A)长度4507碱基对(B)类型核酸(C)链型单链(D)拓扑线型(II)分子类型DNA(基因组)(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO3TATATATATA TATATATATA GATAATAACA TATAAATATA TTCAATGTGC ATACAATGAA 60ATGTAATATT AGTATATATT TTTTTGCTTC CTTCTTTGTG TTATATTTTG CAAAAGCTAG120GAATGAATAT GATATAAAAG AGAATGAAAA ATTTTTAGAC GTGTATAAAG AAAAATTTAA180TGAATTAGAT AAAAAGAAAT ATGGAAATGT TCAAAAAACT GATAAGAAAA TATTTACTTT240TATAGAAAAT AAATTAGATA TTTTAAATAA TTCAAAATTT AATAAAAGAT GGAAGAGTTA300TGGAACTCCA GATAATATAG ATAAAAATAT GTCTTTAATA AATAAACATA ATAATGAAGA360AATGTTTAAC AACAATTATC AATCATTTTT ATCGACAAGT TCATTAATAA AGCAAAATAA420ATATGTTCCT ATTAACGCTG TACGTGTGTC TAGGATATTA AGTTTCCTGG ATTCTAGAAT480TAATAATGGA AGAAATACTT CATCTAATAA CGAAGTTTTA AGTAATTGTA GGGAAAAAAG540GAAAGGAATG AAATGGGATT GTAAAAAGAA AAATGATAGA AGCAACTATG TATGTATTCC600TGATCGTAGA ATCCAATTAT GCATTGTTAA TCTTAGCATT ATTAAAACAT ATACAAAAGA660GACCATGAAG GATCATTTCA TTGAAGCCTC TAAAAAAGAA TCTCAACTTT TGCTTAAAAA720AAATGATAAC AAATATAATT CTAAATTTTG TAATGATTTG AAGAATAGTT TTTTAGATTA780TGGACATCTT GCTATGGGAA ATGATATGGA TTTTGGAGGT TATTCAACTA AGGCAGAAAA840CAAAATTCAA GAAGTTTTTA AAGGGGCTCA TGGGGAAATA AGTGAACATA AAATTAAAAA900TTTTAGAAAA GAATGGTGGA ATGAATTTAG AGAGAAACTT TGGGAAGCTA TGTTATCTGA960GCATAAAAAT AATATAAATA ATTGTAAAAA TATTCCCCAA GAAGAATTAC AAATTACTCA1020ATGGATAAAA GAATGGCATG GAGAATTTTT GCTTGAAAGA GATAATAGAT CAAAATTGCC1080AAAAAGTAAA TGTAAAAATA ATACATTATA TGAAGCATGT GAGAAGGAAT GTATTGATCC1140ATGTATGAAA TATAGAGATT GGATTATTAG AAGTAAATTT GAATGGCATA CGTTATCGAA1200AGAATATGAA ACTCAAAAAG TTCCAAAGGA AAATGCGGAA AATTATTTAA TCAAAATTTC1260AGAAAACAAG AATGATGCTA AAGTAAGTTT ATTATTGAAT AATTGTGATG CTGAATATTC1320AAAATATTGT GATTGTAAAC ATACTACTAC TCTCGTTAAA AGCGTTTTAA ATGGTAACGA1380CAATACAATT AAGGAAAAGC GTGAACATAT TGATTTAGAT GATTTTTCTA AATTTGGATG1440TGATAAAAAT TCCGTTGATA CAAACACAAA GGTGTGGGAA TGTAAAAACC CTTATATATT1500ATCCACTAAA GATGTATGTG TACCTCCGAG GAGGCAAGAA TTATGTCTTG GAAACATTGA1560TAGAATATAC GATAAAAACC TATTAATGAT AAAAGAGCAT ATTCTTGCTA TTGCAATATA1620TGAATCAAGA ATATTGAAAC GAAAATATAA GAATAAAGAT GATAAAGAAG TTTGTAAAAT1680CATAAATAAA ACTTTCGCTG ATATAAGAGA TATTATAGGA GGTACTGATT ATTGGAATGA1740TTTGAGCAAT AGAAAATTAG TAGGAAAAAT TAACACAAAT TCAAAATATG TTCACAGGAA1800TAAAAAAAAT GATAAGCTTT TTCGTGATGA GTGGTGGAAA GTTATTAAAA AAGATGTATG1860GAATGTGATA TCATGGGTAT TCAAGGATAA AACTGTTTGT AAAGAAGATG ATATTGAAAA1920TATACCACAA TTCTTCAGAT GGTTTAGTGA ATGGGGTGAT GATTATTGCC AGGATAAAAC1980AAAAATGATA GAGACTCTGA AGGTTGAATG CAAAGAAAAA CCTTGTGAAG ATGACAATTG2040TAAAAGTAAA TGTAATTCAT ATAAAGAATG GATATCAAAA AAAAAAGAAG AGTATAATAA2100ACAAGCCAAA CAATACCAAG AATATCAAAA AGGAAATAAT TACAAAATGT ATTCTGAATT2160TAAATCTATA AAACCAGAAG TTTATTTAAA GAAATACTCG GAAAAATGTT CTAACCTAAA2220TTTCGAAGAT GAATTTAAGG AAGAATTACA TTCAGATTAT AAAAATAAAT GTACGATGTG2280TCCAGAAGTA AAGGATGTAC CAATTTCTAT AATAAGAAAT AATGAACAAA CTTCGCAAGA2340AGCAGTTCCT GAGGAAAACA CTGAAATAGC ACACAGAACG GAAACTCCAT CTATCTCTGA2400AGGACCAAAA GGAAATGAAC AAAAAGAACG TGATGACGAT AGTTTGAGTA AAATAAGTGT2460ATCACCAGAA AATTCAAGAC CTGAAACTGA TGCTAAAGAT ACTTCTAACT TGTTAAAATT2520AAAAGGAGAT GTTGATATTA GTATGCCTAA AGCAGTTATT GGGAGCAGTC CTAATGATAA2580TATAAATGTT ACTGAACAAG GGGATAATAT TTCCGGGGTG AATTCTAAAC CTTTATCTGA2640TGATGTACGT CCAGATAAAA AGGAATTAGA AGATCAAAAT AGTGATGAAT CGGAAGAAAC2700TGTAGTAAAT CATATATCAA AAAGTCCATC TATAAATAAT GGAGATGATT CAGGCAGTGG2760AAGTGCAACA GTGAGTGAAT CTAGTAGTTC AAATACTGGA TTGTCTATTG ATGATGATAG2820AAATGGTGAT ACATTTGTTC GAACACAAGA TACAGCAAAT ACTGAAGATG TTATTAGAAA2880AGAAAATGCT GACAAGGATG AAGATGAAAA AGGCGCAGAT GAAGAAAGAC ATAGTACTTC2940TGAAAGCTTA AGTTCACCTG AAGAAAAAAT GTTAACTGAT AATGAAGGAG GAAATAGTTT3000AAATCATGAA GAGGTGAAAG AACATACTAG TAATTCTGAT AATGTTCAAC AGTCTGGAGG3060AATTGTTAAT ATGAATGTTG AGAAAGAACT AAAAGATACT TTAGAAAATC CTTCTAGTAG3120CTTGGATGAA GGAAAAGCAC ATGAAGAATT ATCAGAACCA AATCTAAGCA GTGACCAAGA3180TATGTCTAAT ACACCTGGAC CTTTGGATAA CACCAGTGAA GAAACTACAG AAAGAATTAG3240TAATAATGAA TATAAAGTTA ACGAGAGGGA AGATGAGAGA ACGCTTACTA AGGAATATGA3300AGATATTGTT TTGAAAAGTC ATATGAATAG AGAATCAGAC GATGGTGAAT TATATGACGA3360AAATTCAGAC TTATCTACTG TAAATGATGA ATCAGAAGAC GCTGAAGCAA AAATGAAAGG3420AAATGATACA TCTGAAATGT CGCATAATAG TAGTCAACAT ATTGAGAGTG ATCAACAGAA3480AAACGATATG AAAACTGTTG GTGATTTGGG AACCACACAT GTACAAAACG AAATTAGTGT3540TCCTGTTACA GGAGAAATTG ATGAAAAATT AAGGGAAAGT AAAGAATCAA AAATTCATAA3600GGCTGAAGAG GAAAGATTAA GTCATACAGA TATACATAAA ATTAATCCTG AAGATAGAAA3660TAGTAATACA TTACATTTAA AAGATATAAG AAATGAGGAA AACGAAAGAC ACTTAACTAA3720TCAAAACATT AATATTAGTC AAGAAAGGGA TTTGCAAAAA CATGGATTCC ATACCATGAA3780TAATCTACAT GGAGATGGAG TTTCCGAAAG AAGTCAAATT AATCATAGTC ATCATGGAAA3840CAGACAAGAT CGGGGGGGAA ATTCTGGGAA TGTTTTAAAT ATGAGATCTA ATAATAATAA3900TTTTAATAAT ATTCCAAGTA GATATAATTT ATATGATAAA AAATTAGATT TAGATCTTTA3960TGAAAACAGA AATGATAGTA CAACAAAAGA ATTAATAAAG AAATTAGCAG AAATAAATAA4020ATGTGAGAAC GAAATTTCTG TAAAATATTG TGACCATATG ATTCATGAAG AAATCCCATT4080AAAAACATGC ACTAAAGAAA AAACAAGAAA TCTGTGTTGT GCAGTATCAG ATTACTGTAT4140GAGCTATTTT ACATATGATT CAGAGGAATA TTATAATTGT ACGAAAAGGG AATTTGATGA4200TCCATCTTAT ACATGTTTCA GAAAGGAGGC TTTTTCAAGT ATGATATTCA AATTTTTAAT4260AACAAATAAA ATATATTATT ATTTTTATAC TTACAAAACT GCAAAAGTAA CAATAAAAAA4320AATTAATTTC TCATTAATTT TTTTTTTCTT TTTTTCTTTT TAGGTATGCC ATATTATGCA4380GGAGCAGGTG TGTTATTTAT TATATTGGTT ATTTTAGGTG CTTCACAAGC CAAATATCAA4440AGGTTAGAAA AAATAAATAA AAATAAAATT GAGAAGAATG TAAATTAAAT ATAGAATTCG4500AGCTCGG 4507(2)SEQ ID NO4资料(I)序列特征(A)长度1435个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑线型(II)分子类型蛋白质(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO4Met Lys Cys Asn Ile Ser Ile Tyr Phe Phe Ala Ser Phe Phe Val Leu1 5 10 15Tyr Phe Ala Lys Ala Arg Asn Glu Tyr Asp Ile Lys Glu Asn Glu Lys20 25 30Phe Leu Asp Val Tyr Lys Glu Lys Phe Asn Glu Leu Asp Lys Lys Lys35 40 45Tyr Gly Asn Val Gln Lys Thr Asp Lys Lys Ile Phe Thr Phe Ile Glu50 55 60Asn Lys Leu Asp Ile Leu Asn Asn Ser Lys Phe Asn Lys Arg Trp Lys65 70 75 80Ser Tyr Gly Thr Pro Asp Asn Ile Asp Lys Asn Met Ser Leu Ile Asn85 90 95Lys His Asn Asn Glu Glu Met Phe Asn Asn Asn Tyr Gln Ser Phe Leu100 105110Ser Thr Ser Ser Leu Ile Lys Gln Asn Lys Tyr Val Pro Ile Asn Ala115 120 125Val Arg Val Ser Arg Ile Leu Ser Phe Leu Asp Ser Arg Ile Asn Asn130 135 140G1y Arg Asn Thr Ser Ser Asn Asn Glu Val Leu Ser Asn Cys Arg Glu145 150 155 160Lys Arg Lys Gly Met Lys Trp Asp Cys Lys Lys Lys Asn Asp Arg Ser165 170 175Asn Tyr Val Cys Ile Pro Asp Arg Arg Ile Gln Leu Cys Ile Val Asn180 185 190Leu Ser Ile Ile Lys Thr Tyr Thr Lys Glu Thr Met Lys Asp His Phe195 200 205Ile Glu Ala Ser Lys Lys Glu Ser Gln Leu Leu Leu Lys Lys Asn Asp210 215 220Asn Lys Tyr Asn Ser Lys Phe Cys Asn Asp Leu Lys Asn Ser Phe Leu225 230 235 240Asp Tyr Gly His Leu Ala Met Gly Asn Asp Met Asp Phe Gly Gly Tyr245 250 255Ser Thr Lys Ala Glu Asn Lys Ile Gln Glu Val Phe Lys Gly Ala His260 265 270Gly Glu Ile Ser Glu His Lys Ile Lys Asn Phe Arg Lys Glu Trp Trp275 280 285Asn Glu Phe Arg Glu Lys Leu Trp Glu Ala Met Leu Ser Glu His Lys
290 295 300Asn Asn Ile Asn Asn Cys Lys Asn Ile Pro Gln Glu Glu Leu Gln Ile305 310 315 320Thr Gln Trp Ile Lys Glu Trp His Gly Glu Phe Leu Leu Glu Arg Asp325 330 335Asn Arg Ser Lys Leu Pro Lys Ser Lys Cys Lys Asn Asn Thr Leu Tyr340 345 350Glu Ala Cys Glu Lys Glu Cys Ile Asp Pro Cys Met Lys Tyr Arg Asp355 360 365Trp Ile Ile Arg Ser Lys Phe Glu Trp His Thr Leu Ser Lys Glu Tyr370 375 380Glu Thr Gln Lys Val Pro Lys Glu Asn Ala Glu Asn Tyr Leu Ile Lys385 390 395 400Ile Ser Glu Asn Lys Asn Asp Ala Lys Val Ser Leu Leu Leu Asn Asn405 410 415Cys Asp Ala Glu Tyr Ser Lys Tyr Cys Asp Cys Lys His Thr Thr Thr420 425 430Leu Val Lys Ser Val Leu Asn Gly Asn Asp Asn Thr Ile Lys Glu Lys435 440 445Arg Glu His Ile Asp Leu Asp Asp Phe Ser Lys Phe Gly Cys Asp Lys450 455 460Asn Ser Val Asp Thr Asn Thr Lys Val Trp Glu Cys Lys Asn Pro Tyr465 470 475 480Ile Leu Ser Thr Lys Asp Val Cys Val Pro Pro Arg Arg Gln Glu Leu485 490 495Cys Leu Gly Asn Ile Asp Arg Ile Tyr Asp Lys Asn Leu Leu Met Ile500 505 510Lys Glu His Ile Leu Ala Ile Ala Ile Tyr Glu Ser Arg Ile Leu Lys515 520 525Arg Lys Tyr Lys Asn Lys Asp Asp Lys Glu Val Cys Lys Ile Ile Asn530 535 540Lys Thr Phe Ala Asp Ile Arg Asp Ile Ile Gly GIy Thr Asp Tyr Trp545 550 555 560Asn Asp Leu Ser Asn Arg Lys Leu Val Gly Lys Ile Asn Thr Asn Ser565 570 575Lys Tyr Val His Arg Asn Lys Lys Asn Asp Lys Leu Phe Arg Asp Glu580 585 590Trp Trp Lys Val Ile Lys Lys Asp Val Trp Asn Val Ile Ser Trp Val595 600 605Phe Lys Asp Lys Thr Val Cys Lys Glu Asp Asp Ile Glu Asn Ile Pro610 615 620Gln Phe Phe Arg Trp Phe Ser Glu Trp Gly Asp Asp Tyr Cys Gln Asp625 630 635 640Lys Thr Lys Met Ile Glu Thr Leu Lys Val Glu Cys Lys Glu Lys Pro645 650 655Cys Glu Asp Asp Asn Cys Lys Ser Lys Cys Asn Ser Tyr Lys Glu Trp660 665 670Ile Ser Lys Lys Lys Glu Glu Tyr Asn Lys Gln Ala Lys Gln Tyr Gln675 680 685Glu Tyr Gln Lys Gly Asn Asn Tyr Lys Met Tyr Ser Glu Phe Lys Ser690 695 700Ile Lys Pro Glu Val Tyr Leu Lys Lys Tyr Ser Glu Lys Cys Ser Asn705 710 715 720Leu Asn Phe Glu Asp Glu Phe Lys Glu Glu Leu His Ser Asp Tyr Lys725 730 735Asn Lys Cys Thr Met Cys Pro Glu Val Lys Asp Val Pro Ile Ser Ile740 745 750Ile Arg Asn Asn Glu Gln Thr Ser Gln Glu Ala Val Pro Glu Glu Asn755 760 765Thr Glu Ile Ala His Arg Thr Glu Thr Pro Ser Ile Ser Glu Gly Pro770 775 780Lys Gly Asn Glu Gln Lys Glu Arg Asp Asp Asp Ser Leu Ser Lys Ile785 790 795 800Ser Val Ser Pro Glu Asn Ser Arg Pro Glu Thr Asp Ala Lys Asp Thr805 810 815Ser Asn Leu Leu Lys Leu Lys Gly Asp Val Asp Ile Ser Met Pro Lys820 825 830Ala Val Ile Gly Ser Ser Pro Asn Asp Asn Ile Asn Val Thr Glu Gln835 840 845Gly Asp Asn Ile Ser Gly Val Asn Ser Lys Pro Leu Ser Asp Asp Val850 855 860Arg Pro Asp Lys Lys Glu Leu Glu Asp Gln Asn Ser Asp Glu Ser Glu865 870 875 880Glu Thr Val Val Asn His Ile Ser Lys Ser Pro Ser Ile Asn Asn Gly885 890 895Asp Asp Ser Gly Ser Gly Ser Ala Thr Val Ser Glu Ser Ser Ser Ser900 905 910Asn Thr Gly Leu Ser Ile Asp Asp Asp Arg Asn Gly Asp Thr Phe Val915 920 925Arg Thr Gln Asp Thr Ala Asn Thr Glu Asp Val Ile Arg Lys Glu Asn930 935 940Ala Asp Lys Asp Glu Asp Glu Lys Gly Ala Asp Glu Glu Arg His Ser945 950 955 960Thr Ser Glu Ser Leu Ser Ser Pro Glu Glu Lys Met Leu Thr Asp Asn965 970 975Glu Gly Gly Asn Ser Leu Asn His Glu Glu Val Lys Glu His Thr Ser980 985 990Asn Ser Asp Asn Val Gln Gln Ser Gly Gly Ile Val Asn Met Asn Val99510001005Glu Lys Glu Leu Lys Asp Thr Leu Glu Asn Pro Ser Sar Ser Leu Asp101010151020Glu Gly Lys Ala His Glu Glu Leu Ser Glu Pro Asn Leu Ser Ser Asp1025103010351040Gln Asp Met Ser Asn Thr Pro Gly Pro Leu Asp Asn Thr Ser Glu Glu104510501055Thr Thr Glu Arg Ile Ser Asn Asn Glu Tyr Lys Val Asn Glu Arg Glu106010651070Asp Glu Arg Thr Leu Thr Lys Glu Tyr Glu Asp Ile Val Leu Lys Ser107510801085His Met Asn Arg Glu Ser Asp Asp Gly Glu Leu Tyr Asp Glu Asn Ser109010951100Asp Leu Ser Thr Val Asn Asp Glu Sar Glu Asp Ala Glu Ala Lys Met1105111011151120Lys Gly Asn Asp Thr Ser Glu Met Ser His Asn Ser Ser Gln His Ile112511301135Glu Ser Asp Gln Gln Lys Asn Asp Met Lys Thr Val Gly Asp Leu Gly114011451150Thr Thr His Val Gln Asn Glu Ile Sar Val Pro Val Thr Gly Glu Ile115511601165Asp Glu Lys Leu Arg Glu Ser Lys Glu Ser Lys Ile His Lys Ala Glu117011751180Glu Glu Arg Leu Ser His Thr Asp Ile His Lys Ile Asn Pro Glu Asp1185119011951200Arg Asn Ser Asn Thr Leu His Leu Lys Asp Ile Arg Asn Glu Glu Asn120512101215Glu Arg His Leu Thr Asn Gln Asn Ile Asn Ile Ser Gln Glu Arg Asp122012251230Leu Gln Lys His Gly Phe His Thr Met Asn Asn Leu His Gly Asp Gly123512401245Val Ser Glu Arg Ser Gln Ile Asn His Ser His His Gly Asn Arg Gln125012551260Asp Arg Gly Gly Asn Ser Gly Asn Val Leu Asn Met Arg Ser Asn Asn1265127012751280Asn Asn phe Asn Asn Ile Pro Ser Arg Tyr Asn Leu Tyr Asp Lys Lys128512901295Leu Asp Leu Asp Leu Tyr Glu Asn Arg Asn Asp Ser Thr Thr Lys Glu130013051310Leu Ile Lys Lys Leu Ala Glu Ile Asn Lys Cys Glu Asn Glu Ile Ser131513201325Val Lys Tyr Cys Asp His Met Ile His Glu Glu Ile Pro Leu Lys Thr133013351340Cys Thr Lys Glu Lys Thr Arg Asn Leu Cys Cys Ala Val Ser Asp Tyr1345135013551360Cys Met Ser Tyr Phe Thr Tyr Asp Ser Glu Glu Tyr Tyr Asn Cys Thr136513701375Lys Arg Glu Phe Asp Asp Pro Ser Tyr Thr Cys Phe Arg Lys Glu Ala138013851390Phe Ser Ser Met Ile Phe Lys Phe Leu Ile Thr Asn Lys Ile Tyr Tyr139514001405Tyr Phe Tyr Thr Tyr Lys Thr Ala Lys Val Thr Ile Lys Lys Ile Asn141014151420Phe Ser Leu Ile Phe Phe Phe Phe Phe Ser Phe142514301435(2)SEQ ID NO5资料(I)序列特征(A)长度2288个碱基对(B)类型核酸(C)链型单链(D)拓扑线型(II)分子类型DNA(基因组)(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO5CACTTTATGC TTCCGGCTCG TATGTTGTGT GGAATTGTGA GCGGATAACA ATTTCACACA 60GGAAACAGCT ATGACCATGA TTACGCCAAG CTCTAATACG ACTCACTATA GGGAAAGCTG120GTACGCCTGC AGGTCCGGTC CGGAATTCAA TAAAATATTT CCAGAAAGGA ATGTGCAAAT180TCACATATCC AATATATTCA AGGAATATAA AGAAAATAAT GTAGATATCA TATTTGGAAC240GTTGAATTAT GAATATAATA ATTTCTGTAA AGAAAAACCT GAATTAGTAT CTGCTGCCAA300GTATAATCTG AAAGCTCCAA ATGCTAAATC CCCTAGAATA TACAAATCTA AGGAGCATGA360AGAATCAAGT GTGTTTGGTT GCAAAACGAA AATCAGTAAA GTTAAAAAAA AATGGAATTG420TTATAGTAAT AATAAAGTAA CTAAACCTGA AGGTGTATGT GGACCACCAA GAAGGCAACA480ATTATGTCTT GGATATATAT TTTTGATTCG CGACGGTAAC GAGGAAGGAT TAAAAGATCA540TATTAATAAG GCAGCTAATT ATGAGGCAAT GCATTTAAAA GAGAAATATG AGAATGCTGG600TGGTGATAAA ATTTGCAATG CTATATTGGG AAGTTATGCA GATATTGGAG ATATTGTAAG660AGGTTTGGAT GTTTGGAGGG ATATAAATAC TAATAAATTA TCAGAAAAAT TCCAAAAAAT720TTTTATGGGT GGTGGTAATT CTAGGAAAAA ACAAAACGAT AATAATGAAC GTAATAAATG780GTGGGAAAAA CAAAGGAATT TAATATGGTC TAGTATGGTA AAACACATTC CAAAAGGAAA840AACATGTAAA CGTCATAATA ATTTTGAGAA AATTCCTCAA TTTTTGAGAT GGTTAAAAGA900ATGGGGTGAT GAATTTTGTG AGGAAATGGG TACGGAAGTC AAGCAATTAG AGAAAATATG960TGAAAATAAA AATTGTTCGG AAAAAAAATG TAAAAATGCA TGTAGTTCCT ATGAAAAATG 1020GATAAAGGAA CGAAAAAATG AATATAATTT GCAATCAAAG AAATTTGATA GTGATAAAAA 1080ATTAAATAAA AAAAACAATC TTTATAATAA ATTTGAGGAT TCTAAAGCTT ATTTAAGGAG 1140TGAATCAAAA CAGTGCTCAA ATATAGAATT TAATGATGAA ACATTTACAT TTCCTAATAA 1200ATATAAAGAG GCTTGTATGG TATGTGAAAA TCCTTCATCT TCGAAAGCTC TTAAACCTAT 1260AAAAACGAAT GTGTTTCCTA TAGAGGAATC AAAAAAATCT GAGTTATCAA GTTTAACAGA 1320TAAATCTAAG AATACTCCTA ATAGTTCTGG TGGGGGAAAT TATGGAGATA GACAAATATC 1380AAAAAGAGAC GATGTTCATC ATGATGGTCC TAAGGAAGTG AAATCCGGAG AAAAAGAGGT 1440ACCAAAAATA GATGCAGCTG TTAAAACAGA AAATGAATTT ACCTCTAATC GAAACGATAT 1500TGAAGGAAAG GAAAAAAGTA AAGGTGATCA TTCTTCTCCT GTTCATTCTA AAGATATAAA 1560AAATGAGGAA CCACAAAGGG TGGTGTCTGA AAATTTACCT AAAATTGAAG AGAAAATGGA 1620ATCTTCTGAT TCTATACCAA TTACTCATAT AGAAGCTGAA AAGGGTCAGT CTTCTAATTC 1680TAGCGATAAT GATCCTGCAG TAGTAAGTGG TAGAGAATCT AAAGATGTAA ATCTTCATAC 1740TTCTGAAAGG ATTAAAGAAA ATGAAGAAGG TGTGATTAAA ACAGATGATA GTTCAAAAAG 1800TATTGAAATT TCTAAAATAC CATCTGACCA AAATAATCAT AGTGATTTAT CACAGAATGC 1860AAATGAGGAC TCTAATCAAG GGAATAAGGA AACAATAAAT CCTCCTTCTA CAGAAAAAAA 1920TCTCAAAGAA ATTCATTATA AAACATCTGA TTCTGATGAT CATGGTTCTA AAATTAAAAG 1980TGAAATTGAA CCAAAGGAGT TAACGGAGGA ATCACCTCTT ACTGATAAAA AAACTGAAAG 2040TGCAGCGATT GGTGATAAAA ATCATGAATC AGTAAAAAGC GCTGATATTT TTCAATCTGA 2100GATTCATAAT TCTGATAATA GAGATAGAAT TGTTTCTGAA AGTGTAGTTC AGGATTCTTC 2160AGGAAGCTCT ATGAGTACTG AATCTATACG TACTGATAAC AAGGATTTTA AAACAAGTGA 2220GGATATTGCA CCTTCTATTA ATGGTCGGAA TTCCCGGGTC GACGAGCTCA CTAGTCGGCG 2280GCCGCTCT2288(2)SEQ ID NO6资料(I)序列特征(A)长度749个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑线型(II)分子类型蛋白质(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO6Ala Asp Asn Asn Phe Thr Gln Glu Thr Ala Met Thr Met Ile Thr Pro1 5 10 15Ser Ser Asn Thr Thr His Tyr Arg Glu Ser Trp Tyr Ala Cys Arg Ser20 25 30Gly Pro Glu Phe Asn Lys Ile Phe Pro Glu Arg Asn Val Gln Ile His35 40 45Ile Ser Asn Ile Phe Lys Glu Tyr Lys Glu Asn Asn Val Asp Ile Ile50 55 60Phe Gly Thr Leu Asn Tyr Glu Tyr Asn Asn Phe Cys Lys Glu Lys Pro65 70 75 80Glu Leu Val Ser Ala Ala Lys Tyr Asn Leu Lys Ala Pro Asn Ala Lys85 90 95Ser Pro Arg Ile Tyr Lys Ser Lys Glu His Glu Glu Ser Ser Val Phe100 105 110Gly Cys Lys Thr Lys Ile Ser Lys Val Lys Lys Lys Trp Asn Cys Tyr115 120 125Ser Asn Asn Lys Val Thr Lys Pro Glu Gly Val Cys Gly Pro Pro Arg130 135 140Arg Gln Gln Leu Cys Leu Gly Tyr Ile Phe Leu Ile Arg Asp Gly Asn145 150 155 160Glu Glu Gly Leu Lys Asp His Ile Asn Lys Ala Ala Asn Tyr Glu Ala165 170 175Met His Leu Lys Glu Lys Tyr Glu Asn Ala Gly Gly Asp Lys Ile Cys180 185 190Asn Ala Ile Leu Gly Ser Tyr Ala Asp Ile Gly Asp Ile Val Arg Gly195 200 205Leu Asp Val Trp Arg Asp Ile Asn Thr Asn Lys Leu Ser Glu Lys Phe210 215 220Gln Lys Ile Phe Met Gly Gly Gly Asn Ser Arg Lys Lys Gln Asn Asp225 230 235 240Asn Asn Glu Arg Asn Lys Trp Trp Glu Lys Gln Arg Asn Leu Ile Trp245 250 255Ser Ser Met Val Lys His Ile Pro Lys Gly Lys Thr Cys Lys Arg His260 265 270Asn Asn Phe Glu Lys Ile Pro Gln Phe Leu Arg Trp Leu Lys Glu Trp275 280 285Gly Asp Glu Phe Cys Glu Glu Met Gly Thr Glu Val Lys Gln Leu Glu290 295 300Lys Ile Cys Glu Asn Lys Asn Cys Ser Glu Lys Lys Cys Lys Asn Ala305 310 315 320Cys Ser Ser Tyr Glu Lys Trp Ile Lys Glu Arg Lys Asn Glu Tyr Asn325 330 335Leu Gln Ser Lys Lys Phe Asp Ser Asp Lys Lys Leu Asn Lys Lys Asn340 345 350Asn Leu Tyr Asn Lys Phe Glu Asp Ser Lys Ala Tyr Leu Arg Ser Glu355 360 365Ser Lys Gln Cys Ser Asn Ile Glu Phe Asn Asp Glu Thr Phe Thr Phe370 375 380Pro Asn Lys Tyr Lys Glu Ala Cys Met Val Cys Glu Asn Pro Ser Ser385 390 395 400Ser Lys Ala Leu Lys Pro Ile Lys Thr Asn Val Phe Pro Ile Glu Glu405 410 415Ser Lys Lys Ser Glu Leu Ser Ser Leu Thr Asp Lys Ser Lys Asn Thr420 425 430Pro Asn Sar Sar Gly Gly Gly Asn Tyr Gly Asp Arg Gln Ile Ser Lys435 440 445Arg Asp Asp Val His His Asp Gly Pro Lys Glu Val Lys Ser Gly Glu450 455 460Lys Glu Val Pro Lys Ile Asp Ala Ala Val Lys Thr Glu Asn Glu Phe465 470 475 480Thr Ser Asn Arg Asn Asp Ile Glu Gly Lys Glu Lys Ser Lys Gly Asp485 490 495His Ser Ser Pro Val His Ser Lys Asp Ile Lys Asn Glu Glu Pro Gln500 505 510Arg Val Val Ser Glu Asn Leu Pro Lys Ile Glu Glu Lys Met Glu Ser515 520 525Ser Asp Ser Ile Pro Ile Thr His Ile Glu Ala Glu Lys Gly Gln Ser530 535 540Ser Asn Ser Ser Asp Asn Asp Pro Ala Val Val Ser Gly Arg Glu Ser545 550 555 560Lys Asp Val Asn Leu His Thr Ser Glu Arg Ile Lys Glu Asn Glu Glu565 570 575Gly Val Ile Lys Thr Asp Asp Ser Ser Lys Ser Ile Glu Ila Ser Lys580 585 590Ile Pro Ser Asp Gln Asn Asn His Ser Asp Leu Ser Gln Asn Ala Asn595 600 605Glu Asp Ser Asn Gln Gly Asn Lys Glu Thr Ile Asn Pro Pro Ser Thr610 615 620Glu Lys Asn Leu Lys Glu Ile His Tyr Lys Thr Ser Asp Ser Asp Asp625 630 635 640His Gly Ser Lys Ile Lys Ser Glu Ile Glu Pro Lys Glu Leu Thr Glu645 650 655Glu Ser Pro Leu Thr Asp Lys Lys Thr Glu Ser Ala Ala Ile Gly Asp660 665 670Lys Asn His Glu Ser Val Lys Ser Ala Asp Ile Phe Gln Ser Glu Ile675 680 685His Asn Ser Asp Asn Arg Asp Arg Ile Val Ser Glu Ser Val Val Gln690 695700Asp Ser Ser Gly Ser Ser Met Ser Thr Glu Ser Ile Arg Thr Asp Asn705 710 715 720Lys Asp Phe Lys Thr Ser Glu Asp Ile Ala Pro Ser Ile Asn Gly Arg725 730 735Asn Ser Arg Val Asp Glu Leu Thr Ser Arg Arg Pro Leu740 745(2)SEQ ID NO7资料(I)序列特征(A)长度2606个碱基对(B)类型核酸(C)链型单链(D)拓扑线型(II)分子类型DNA(基因组)(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO7AGCTCTATTA CGACTCACTA TAGGGAAAGC TGGTACGCCT GCAGGTACCG GTCCGGAATT 60CCCGGGTCGA CGAGCTCACT AGTCGGCGGC CGCTCTAGAG GATCCAAGCT TAATAGTGTT120TATACGTCTA TTGGCTTATT TTTAAATAGC TTAAAAAGCG GACCATGTAA AAAGGATAAT180GATAATGCAG AGGATAATAT AGATTTTGGT GATGAAGGTA AAACATTTAA AGAGGCAGAT240AATTGTAAAC CATGTTCTCA ATTTACTGTT GATTGTAAAA ATTGTAATGG TGGTGATACA300AAAGGGAAGT GCAATGGCAG CAATGGCAAA AAGAATGGAA ATGATTATAT TACTGCAAGT360GATATTGAAA ATGGAGGGAA TTCTATTGGA AATATAGATA TGGTTGTTAG TGATAAGGAT420GCAAATGGAT TTAATGGTTT AGACGCTTGT GGAAGTGCAA ATATCTTTAA AGGTATTAGA480AAAGAACAAT GGAAATGTGC TAAAGTATGT GGTTTAGATG TATGTGGTCT TAAAAATGGT540AATGGTAGTA TAGATAAAGA TCAAAAACAA ATTATAATTA TTAGAGCATT GCTTAAACGT600TGGGTAGAAT ATTTTTTAGA AGATTATAAT AAAATTAATG CCAAAATTTC ACATTGTACG660AAAAAGGATA ATGAATCCAC ATGTACAAAT GATTGTCCAA ATAAATGTAC ATGTGTAGAA720GAGTGGATAA ATCAGAAAAG GACAGAATGG AAAAATATAA AAAAACATTA CAAAACACAA780AATGAAAATG GTGACAATAA CATGAAATCT TTGGTTACAG ATATTTTGGG TGCCTTGCAA840CCCCAAAGTG ATGTTAACAA AGCTATAAAA CCTTGTAGTG GTTTAACTGC GTTCGAGAGT900TTTTGTGGTC TTAATGGCGC TGATAACTCA GAAAAAAAAG AAGGTGAAGA TTACGATCTT960GTTCTATGTA TGCTTAAAAA TCTTGAAAAA CAAATTCAGG AGTGCAAAAA GAAACATGGC 1020GAAACTAGTG TCGAAAATGG TGGCAAATCA TGTACCCCCC TTGACAACAC CACCCTTGAG 1080GAGGAACCCA TAGAAGAGGA AAACCAAGTG GAAGCGCCGA ACATTTGTCC AAAACAAACA 1140GTGGAAGATA AAAAAAAAGA GGAAGAAGAA GAAACTTGTA CACCGGCATC ACCAGTACCA 1200GAAAAACCGG TACCTCATGT GGCACGTTGG CGAACATTTA CACCACCTGA GGTATTCAAG 1260ATATGGAGGG GAAGGAGAAA TAAAACTACG TGCGAAATAG TGGCAGAAAT GCTTAAAGAT 1320AAGAATGGAA GGACTACAGT AGGTGAATGT TATAGAAAAG AAACTTATTC TGAATGGACG 1380TGTGATGAAA GTAAGATTAA AATGGGACAG CATGGAGCAT GTATTCCTCC AAGAAGACAA 1440AAATTATGTT TACATTATTT AGAAAAAATA ATGACAAATA CAAATGAATT GAAATACGCA 1500TTTATTAAAT GTGCTGCAGC AGAAACTTTT TTGTTATGGC AAAACTACAA AAAAGATAAG 1560AATGGTAATG CAGAAGATCT CGATGAAAAA TTAAAAGGTG GTATTATCCC CGAAGATTTT 1620AAACGGCAAA TGTTCTATAC GTTTGCAGAT TATAGAGATA TATGTTTGGG TACGGATATA 1680TCATCAAAAA AAGATACAAG TAAAGGTGTA GGTAAAGTAA AATGCAATAT TGATGATGTT 1740TTTTATAAAA TTAGCAATAG TATTCGTTAC CGTAAAAGTT GGTGGGAAAC AAATGGTCCA 1800GTTATATGGG AAGGAATGTT ATGCGCTTTA AGTTATGATA CGAGCCTAAA TAATGTTAAT 1860CCGGAAACTC ACAAAAAACT TACCGAAGGC AATAACAACT TTGAGAAAGT CATATTTGGT 1920AGTGATAGTA GCACTACTTT GTCCAAATTT TCTGAAAGAC CTCAATTTCT AAGATGGTTG 1980ACTGAATGGG GAGAAAATTT CTGCAAAGAA CAAAAAAAGG AGTATAAGGT GTTGTTGGCA 2040AAATGTAAGG ATTGTGATGT TGATGGTGAT GGTAAATGTA ATGGAAAATG TGTTGCGTGC 2100AAAGATCAAT GTAAACAATA TCATAGTTGG ATTGGAATAT GGATAGATAA TTATAAAAAA 2160CAAAAAGGAA GATATACTGA GGTTAAAAAA ATACCTCTGT ATAAAGAAGA TAAAGACGTG 2220AAAAACTCAG ATGATGCTCG CGATTATTTA AAAACACAAT TACAAAATAT GAAATGTGTA 2280AATGGAACTA CTGATGAAAA TTGTGAGTAT AAGTGTATGC ATAAAACCTC ATCCACAAAT 2340AGTGATATGC CCGAATCGTT GGACGAAAAG CCGGAAAAGG TCAAAGACAA GTGTAATTGT 2400GTACCTAATG AATGCAATGC ATTGAGTGTA AGTGGTAGCG GTTTTCCTGA TGGTCAAGCT 2460TACGTACGCG TGCATGCGAC GTCATAGCTC TTCTATAGTG TCACCTAAAT TCAATTCACT 2520GGCCGTCGTT TTACAACGTC GTGACTGGGA AAACCTGGCG TTACCCAACT TAATCGCCTT 2580GCAGCACATC CCCCTTTCGC CAGCTG2606(2)SEQ ID NO8资料(I)序列特征(A)长度921个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑线型(II)分子类型蛋白质(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO8Lys Leu Asn Ser Val Tyr Thr Ser Ile Gly Leu Phe Leu Asn Ser Leu1 5 10 15Lys Ser Gly Pro Cys Lys Lys Asp Asn Asp Asn Ala Glu Asp Asn Ile20 25 30Asp Phe Gly Asp Glu Gly Lys Thr Phe Lys Glu Ala Asp Asn Cys Lys35 40 45Pro Cys Ser Gln Phe Thr Val Asp Cys Lys Asn Cys Asn Gly Gly Asp50 55 60Thr Lys Gly Lys Cys Asn Gly Ser Asn Gly Lys Lys Asn Gly Asn Asp65 70 75 80Tyr Ile Thr Ala Ser Asp Ile Glu Asn Gly Gly Asn Sar Ile Gly Asn85 90 95Ile Asp Met Val Val Ser Asp Lys Asp Ala Asn Gly Phe Asn Gly Leu100 105 110Asp Ala Cys Gly Ser Ala Asn Ile Phe Lys Gly Ile Arg Lys Glu Gln115 120 125Trp Lys Cys Ala Lys Val Cys Gly Leu Asp Val Cys Gly Leu Lys Asn130 135 140Gly Asn Gly Ser Ile Asp Lys Asp Gln Lys Gln Ile Ile Ile Ile Arg145 150 155 160Ala Leu Leu Lys Arg Trp Val Glu Tyr Phe Leu Glu Asp Tyr Asn Lys
165 170 175Ile Asn Ala Lys Ile Ser His Cys Thr Lys Lys Asp Asn Glu Ser Thr180 185 190Cys Thr Asn Asp Cys Pro Asn Lys Cys Thr Cys Val Glu Glu Trp Ile195 200 205Asn Gln Lys Arg Thr Glu Trp Lys Asn Ile Lys Lys His Tyr Lys Thr210 215 220Gln Asn Glu Asn Gly Asp Asn Asn Met Lys Ser Leu Val Thr Asp Ile225 230 235 240Leu Gly Ala Leu Gln Pro Gln Ser Asp Val Asn Lys Ala Ile Lys Pro245 250 255Cys Ser Gly Leu Thr Ala Phe Glu Ser Phe Cys Gly Leu Asn Gly Ala260 265 270Asp Asn Ser Glu Lys Lys Glu Gly Glu Asp Tyr Asp Leu Val Leu Cys275 280 285Met Leu Lys Asn Leu Glu Lys Gln Ile Gln Glu Cys Lys Lys Lys His290 295 300Gly Glu Thr Ser Val Glu Asn Gly Gly Lys Ser Cys Thr Pro Leu Asp305 310 315 320Asn Thr Thr Leu Glu Glu Glu Pro Ile Glu Glu Glu Asn Gln Val Glu325 330 335Ala Pro Asn Ile Cys Pro Lys Gln Thr Val Glu Asp Lys Lys Lys Glu340 345 350Glu Glu Glu Glu Thr Cys Thr Pro Ala Ser Pro Val Pro Glu Lys Pro355 360 365Val Pro His Val Ala Arg Trp Arg Thr Phe Thr Pro Pro Glu Val Phe370 375 380Lys Ile Trp Arg Gly Arg Arg Asn Lys Thr Thr Cys Glu Ile Val Ala385 390 395 400Glu Met Leu Lys Asp Lys Asn Gly Arg Thr Thr Val Gly Glu Cys Tyr405 410 415Arg Lys Glu Thr Tyr Ser Glu Trp Thr Cys Asp Glu Ser Lys Ile Lys420 425 430Met Gly Gln His Gly Ala Cys Ile Pro Pro Arg Arg Gln Lys Leu Cys435 440 445Leu His Tyr Leu Glu Lys Ile Met Thr Asn Thr Asn Glu Leu Lys Tyr450 455 460Ala Phe Ile Lys Cys Ala Ala Ala Glu Thr Phe Leu Leu Trp Gln Asn465 470 475 480Tyr Lys Lys Asp Lys Asn Gly Asn Ala Glu Asp Leu Asp Glu Lys Leu485 490 495Lys Gly Gly Ile Ile Pro Glu Asp Phe Lys Arg Gln Met Phe Tyr Thr500 505 510Phe Ala Asp Tyr Arg Asp Ile Cys Leu Gly Thr Asp Ile Ser Ser Lys515 520 525Lys Asp Thr Ser Lys Gly Val Gly Lys Val Lys Cys Asn Ile Asp Asp530 535 540Val Phe Tyr Lys Ile Ser Asn Ser Ile Arg Tyr Arg Lys Ser Trp Trp545 550 555 560Glu Thr Asn Gly Pro Val Ile Trp Glu Gly Met Leu Cys Ala Leu Ser565 570 575Tyr Asp Thr Ser Leu Asn Asn Val Asn Pro Glu Thr His Lys Lys Leu580 585 590Thr Glu Gly Asn Asn Asn Phe Glu Lys Val Ile Phe Gly Ser Asp Ser595 600 605Ser Thr Thr Leu Ser Lys Phe Ser Glu Arg Pro Gln Phe Leu Arg Trp610 615 620Leu Thr Glu Trp Gly Glu Asn Phe Cys Lys Glu Gln Lys Lys Glu Tyr625 630 635 640Lys Val Leu Leu Ala Lys Cys Lys Asp Cys Asp Val Asp Gly Asp Gly645 650 655Lys Cys Asn Gly Lys Cys Val Ala Cys Lys Asp Gln Cys Lys Gln Tyr660 665 670His Ser Trp Ile Gly Ile Trp Ile Asp Asn Tyr Lys Lys Gln Lys Gly675 680 685Arg Tyr Thr Glu Val Lys Lys Ile Pro Leu Tyr Lys Glu Asp Lys Asp690 695 700Val Lys Asn Ser Asp Asp Ala Arg Asp Tyr Leu Lys Thr Gln Leu Gln705 710 715 720Asn Met Lys Cys Val Asn Gly Thr Thr Asp Glu Asn Cys Glu Tyr Lys725 730 735Cys Met His Lys Thr Ser Ser Thr Asn Ser Asp Met Pro Glu Ser Leu740 745 750Asp Glu Lys Pro Glu Lys Val Lys Asp Lys Cys Asn Cys Val Pro Asn
755 760 765Glu Cys Asn Ala Leu Ser Val Ser Gly Sar Gly Phe Pro Asp Gly Gln770 775 780Ala Phe Gly Gly Gly Val Leu Glu Gly Thr Cys Lys Gly Leu Gly Glu785 790 795 800Pro Lys Lys Lys Ile Glu Pro Pro Gln Tyr Asp Pro Thr Asn Asp Ile805 810 815Leu Lys Ser Thr Ile Pro Val Thr Ile Val Leu Ala Leu Gly Ser Ile820 825 830Ala phe Leu Phe Met Lys Val Ile Tyr Ile Tyr Val Trp Tyr Ile Tyr835 840 845Met Leu Cys Val Gly Ala Leu Asp Thr Tyr Ile Cys Gly Cys Ile Cys850 855 860Ile Cys Ile Phe Ile Cys Val Ser Val Tyr Val Cys Val Tyr Val Tyr865 870 875 880Val Phe Leu Tyr Met Cys Val Phe Tyr Ile Tyr Phe Ile Tyr Ile Tyr885 890 895Val Phe Ile Leu Lys Met Lys Lys Met Lys Lys Met Lys Lys Met Lys900 905 910Lys Met Lys Lys Arg Lys Lys Arg Ile915 920(2)SEQ ID NO9资料(I)序列特征(A)长度2101碱基对(B)类型核酸(C)链型单链(D)拓扑线型(II)分子类型DNA(基因组)(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO9GGAACAGGGT GATAATAAAG TAGGAGCCTG TGCTCCGTAT AGACGATTAC ATTTATGTGA 60TTATAATTTG GAATCTATAG ACACAACGTC GACGACGCAT AAGTTGTTGT TAGAGGTGTG120TATGGCAGCA AAATACGAAG GAAACTCAAT AAATACACAT TATACACAAC ATCAACGAAC190TAATGAGGAT TCTGCTTCCC AATTATGTAC TGTATTAGCA CGAAGTTTTG CAGATATAGG240TGATATCGTA AGAGGAAAAG ATCTATATCT CGGTTATGAT AATAAAGAAA AAGAACAAAG300AAAAAAATTA GAACAGAAAT TGAAAGATAT TTTCAAGAAA ATACATAAGG ACGTGATGAA360GACGAATGGC GCACAAGAAC GCTACATAGA TGATGCCAAA GGAGGAGATT TTTTTCAATT420AAGAGAAGAT TGGTGGACGT CGAATCGAGA AACAGTATGG AAAGCATTAA TATGTCATGC480ACCAAAAGAA GCTAATTATT TTATAAAAAC AGCGTGTAAT GTAGGAAAAG GAACTAATGG540TCAATGCCAT TGCATTGGTG GAGATGTTCC CACATATTTC GATTATGTGC CGCAGTATCT600TCGCTGGTTC GAGGAATGGG CAGAAGACTT TTGCAGGAAA AAAAAAAAAA AACTAGAAAA660TTTGCAAAAA CAGTGTCGTG ATTACGAACA AAATTTATAT TGTAGTGGTA ATGGCTACGA720TTGCACAAAA ACTATATATA AAAAAGGTAA ACTTGTTATA GGTGAACATT GTACAAACTG780TTCTGTTTGG TGTCGTATGT ATGAAACTTG GATAGATAAC CAGAAAAAAG AATTTCTAAA840ACAAAAAAGA AAATACGAAA CAGAAATATC AGGTGGTGGT AGTGGTAAGA GTCCTAAAAG900GACAAAACGG GCTGCACGTA GTAGTAGTAG TAGTGATGAT AATGGGTATG AAAGTAAATT960TTATAAAAAA CTGAAAGAAG TTGGCTACCA AGATGTCGAT AAATTTTTAA AAATATTAAA 1020CAAAGAAGGA ATATGTCAAA AACAACCTCA AGTAGGAAAT GAAAAAGCAG ATAATGTTGA 1080TTTTACTAAT GAAAAATATG TAAAAACATT TTCTCGTACA GAAATTTGTG AACCGTGCCC 1140ATGGTGTGGA TTGGAAAAAG GTGGTCCACC ATGGAAAGTT AAAGGTGACA AAACCTGCGG 1200AAGTGCAAAA ACAAAGACAT ACGATCCTAA AAATATTACC GATATACCAG TACTCTACCC 1260TGATAAATCA CAGCAAAATA TACTAAAAAA ATATAAAAAT TTTTGTGAAA AAGGTGCACC 1320TGGTGGTGGT CAAATTAAAA AATGGCAATG TTATTATGAT GAACATAGGC CTAGTAGTAA 1380AAATAATAAT AATTGTGTAG AAGGAACATG GGACAAGTTT ACACAAGGTA AACAAACCGT 1440TAAGTCCTAT AATGTTTTTT TTTGGGATTG GGTTCATGAT ATGTTACACG ATTCTGTAGA 1500GTGGAAGACA GAACTTAGTA AGTGTATAAA TAATAACACT AATGGCAACA CATGTAGAAA 1560CAATAATAAA TGTAAAACAG ATTGTGGTTG TTTTCAAAAA TGGGTTGAAA AAAAACAACA 1620AGAATGGATG GCAATAAAAG ACCATTTTGG AAAGCAAACA GATATTGTCC AACAAAAAGG 1680TCTTATCGTA TTTAGTCCCT ATGGAGTTCT TGACCTTGTT TTGAAGGGCG GTAATCTGTT 1740GCAAAATATT AAAGATGTTC ATGGAGATAC AGATGACATA AAACACATTA AGAAACTGTT 1800GGATGAGGAA GACGCAGTAG CAGTTGTTCT TGGTGGCAAG GACAATACCA CAATTGATAA 1860ATTACTACAA CACGAAAAAG AACAAGCAGA ACAATGCAAA CAAAAGCAGG AAGAATGCGA 1920GAAAAAAGCA CAACAAGAAA GTCGTGGTCG CTCCGCCGAA ACCCGCGAAG ACGAAAGGAC 1980ACAACAACCT GCTGATAGTG CCGGCGAAGT CGAAGAAGAA GAAGACGACG ACGACTACGA 2040CGAAGACGAC GAAGATGACG ACGTAGTCCA GGACGTAGAT GTAAGTGAAA TAAGAGGTCC 2100G 2101(2)SEQ ID NO10资料(I)序列特征(A)长度700个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑线型(II)分子类型蛋白质(III)假定的无(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO10Glu Gln Gly Asp Asn Lys Val Gly Ala Cys Ala Pro Tyr Arg Arg Leu1 5 10 15His Leu Cys Asp Tyr Asn Leu Glu Ser Ile Asp Thr Thr Ser Thr Thr20 25 30His Lys Leu Leu Leu Glu Val Cys Met Ala Ala Lys Tyr Glu Gly Asn35 40 45Ser Ile Asn Thr His Tyr Thr Gln His Gln Arg Thr Asn Glu Asp Ser50 55 60Ala Ser Gln Leu Cys Thr Val Leu Ala Arg Ser Phe Ala Asp Ile Gly65 70 75 80Asp Ile Val Arg Gly Lys Asp Leu Tyr Leu Gly Tyr Asp Asn Lys Glu85 90 95Lys Glu Gln Arg Lys Lys Leu Glu Gln Lys Leu Lys Asp Ile phe Lys100 105 110Lys Ile His Lys Asp Val Met Lys Thr Asn Gly Ala Gln Glu Arg Tyr115 120 125Ile Asp Asp Ala Lys Gly Gly Asp Phe Phe Gln Leu Arg Glu Asp Trp130 135 140Trp Thr Ser Asn Arg Glu Thr Val Trp Lys Ala Leu Ile Cys His Ala145 150 155 160Pro Lys Glu Ala Asn Tyr Phe Ile Lys Thr Ala Cys Asn Val Gly Lys165 170 175Gly Thr Asn Gly Gln Cys His Cys Ile Gly Gly Asp Val Pro Thr Tyr180 185 190Phe Asp Tyr Val Pro Gln Tyr Leu Arg Trp Phe Glu Glu Trp Ala Glu195 200 205Asp Phe Cys Arg Lys Lys Lys Lys Lys Leu Glu Asn Leu Gln Lys Gln210 215 220Cys Arg Asp Tyr Glu Gln Asn Leu Tyr Cys Ser Gly Asn Gly Tyr Asp225 230 235 240Cys Thr Lys Thr Ile Tyr Lys Lys Gly Lys Leu Val Ile Gly Glu His245 250 255Cys Thr Asn Cys Ser Val Trp Cys Arg Met Tyr Glu Thr Trp Ile Asp260 265 270Asn Gln Lys Lys Glu Phe Leu Lys Gln Lys Arg Lys Tyr Glu Thr Glu275 280 285Ile Ser Gly Gly Gly Ser Gly Lys Ser Pro Lys Arg Thr Lys Arg Ala290 295 300Ala Arg Ser Ser Ser Ser Ser Asp Asp Asn Gly Tyr Glu Ser Lys Phe305 310 315 320Tyr Lys Lys Leu Lys Glu Val Gly Tyr Gln Asp Val Asp Lys Phe Leu325 330 335Lys Ile Leu Asn Lys Glu Gly Ile Cys Gln Lys Gln Pro Gln Val Gly340 345 350Asn Glu Lys Ala Asp Asn Val Asp Phe Thr Asn Glu Lys Tyr Val Lys355 360 365Thr Phe Ser Arg Thr Glu Ile Cys Glu Pro Cys Pro Trp Cys Gly Leu370 375 380Glu Lys Gly Gly Pro Pro Trp Lys Val Lys Gly Asp Lys Thr Cys Gly385 390 395 400Ser Ala Lys Thr Lys Thr Tyr Asp Pro Lys Asn Ile Thr Asp Ile Pro405 410 415Val Leu Tyr Pro Asp Lys Ser Gln Gln Asn Ile Leu Lys Lys Tyr Lys420 425 430Asn Phe Cys Glu Lys Gly Ala Pro Gly Gly Gly Gln Ile Lys Lys Trp
435 440 445Gln Cys Tyr Tyr Asp Glu His Arg Pro Ser Ser Lys Asn Asn Asn Asn450 455 460Cys Val Glu Gly Thr Trp Asp Lys Phe Thr Gln Gly Lys Gln Thr Val465 470 475 480Lys Ser Tyr Asn Val Phe Phe Trp Asp Trp Val His Asp Met Leu His485 490 495Asp Ser Val Glu Trp Lys Thr Glu Leu Ser Lys Cys Ile Asn Asn Asn500 505 510Thr Asn Gly Asn Thr Cys Arg Asn Asn Asn Lys Cys Lys Thr Asp Cys515 520 525Gly Cys Phe Gln Lys Trp Val Glu Lys Lys Gln Gln Glu Trp MetAla530 535 540Ile Lys Asp His Phe Gly Lys Gln Thr Asp Ile Val Gln Gln Lys Gly545 550 555 560Leu Ile Val Phe Ser Pro Tyr Gly Val Leu Asp Leu Val Leu Lys Gly565 570 575Gly Asn Leu Leu Gln Asn Ile Lys Asp Val His Gly Asp Thr Asp Asp580 585 590Ile Lys His Ile Lys Lys Leu Leu Asp Glu Glu Asp Ala Val Ala Val595 600 605Val Leu Gly Gly Lys Asp Asn Thr Thr Ile Asp Lys Leu Leu Gln His610 615 620Glu Lys Glu Gln Ala Glu Gln Cys Lys Gln Lys Gln Glu Glu Cys Glu625 630 635 640Lys Lys Ala Gln Gln Glu Ser Arg Gly Arg Ser Ala Glu Thr Arg Glu645 650 655Asp Glu Arg Thr Gln Gln Pro Ala Asp Ser Ala Gly Glu Val Glu Glu660 665 670Glu Glu Asp Asp Asp Asp Tyr Asp Glu Asp Asp Glu Asp Asp Asp Val675 680 685Val Gln Asp Val Asp Val Ser Glu Ile Arg Gly Pro690 695 700(2)SEQ ID NO11资料(I)序列特征(A)长度8220个碱基对(B)类型核酸
(C)链型单链(D)拓扑线型(II)分子类型DNA(基因组)(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO11AAAAATGGGG CCCAAGGAGG CTGCAGGTGG GGATGATATT GAGGATGAAA GTGCCAAACA 60TATGTTTGAT AGGATAGGAA AAGATGTGTA CGATAAAGTA AAAGAGGAAG CTAAAGAACG120TGGTAAAGGC TTGCAAGGAC GTTTGTCAGA AGCAAAATTT GAGAAAAATG AAAGCGATCC180ACAAACACCA GAAGATCCAT GCGATCTTGA TCATAAATAT CATACAAATG TAACTACTAA240TGTAATTAAT CCGTGCGCTG ATAGATCTGA CGTGCGTTTT TCCGATGAAT ATGGAGGTCA300ATGTACACAT AATAGAATAA AAGATAGTCA ACAGGGTGAT AATAAAGGTG CATGTGCTCC360ATATAGGCGA TTGCATGTAT GCGATCAAAA TTTAGAACAG ATAGAGCCTA TAAAAATAAC420AAATACTCAT AATTTATTGG TAGATGTGTG TATGGCAGCA AAATTTGAAG GACAATCAAT480AACACAAGAT TATCCAAAAT ATCAAGCAAC ATATGGTGAT TCTCCTTCTC AAATATGTAC540TATGCTGGCA CGAAGTTTTG CGGACATAGG GGACATTGTC AGAGGAAGAG ATTTGTATTT600AGGTAATCCA CAAGAAATAA AACAAAGACA ACAATTAGAA AATAATTTGA AAACAATTTT660CGGGAAAATA TATGAAAAAT TGAATGGCGC AGAAGCACGC TACGGAAATG ATCCGGAATT720TTTTAAATTA CGAGAAGATT GGTGGACTGC TAATCGAGAA ACAGTATGGA AAGCCATCAC780ATGTAACGCT TGGGGTAATA CATATTTTCA TGCAACGTGC AATAGAGGAG AACGAACTAA840AGGTTACTGC CGGTGTAACG ACGACCAAGT TCCCACATAT TTTGATTATG TGCCGCAGTA900TCTTCGCTGG TTCGAGGAAT GGGCAGAAGA TTTTTGTAGG AAAAAAAATA AAAAAATAAA960AGATGTTAAA AGAAATTGTC GTGGAAAAGA TAAAGAGGAT AAGGATCGAT ATTGTAGCCG 1020TAATGGCTAC GATTGCGAAA AAACTAAACG AGCGATTGGT AAGTTGCGTT ATGGTAAGCA 1080ATGCATTAGC TGTTTGTATG CATGTAATCC TTACGTTGAT TGGATAAATA ACCAAAAAGA 1140ACAATTTGAC AAACAGAAAA AAAAATATGA TGAAGAAATA AAAAAATATG AAAATGGAGC 1200ATCAGGTGGT AGTAGGCAAA AACGGGATGC AGGTGGTACA ACTACTACTA ATTATGATGG 1260ATATGAAAAA AAATTTTATG ACGAACTTAA TAAAAGTGAA TATAGAACCG TTGATAAATT 1320TTTGGAAAAA TTAAGTAATG AAGAAATATG CACAAAAGTT AAAGACGAAG AAGGAGGAAC 1380AATTGATTTT AAAAACGTTA ATAGTGATAG TACTAGTGGT GCTAGTGGCA CTAATGTTGA 1440AAGTCAAGGA ACATTTTATC GTTCAAAATA TTGCCAACCC TGCCCTTATT GTGGAGTGAA 1500AAAGGTAAAT AATGGTGGTA GTAGTAATGA ATGGGAAGAG AAAAATAATG GCAAGTGCAA 1560GAGTGGAAAA CTTTATGAGC CTAAACCCGA CAAAGAAGGT ACTACTATTA CAATCCTTAA 1620AAGTGGTAAA GGACATGATG ATATTGAAGA AAAATTAAAC AAATTTTGTG ATGAAAAAAA 1680TGGTGATACA ATAAATAGTG GTGGTAGTGG TACGGGTGGT AGTGGTGGTG GTAACAGTGG 1740TAGACAGGAA TTGTATGAAG AATGGAAATG TTATAAAGGT GAAGATGTAG TGAAAGTTGG 1800ACACGATGAG GATGACGAGG AGGATTATGA AAATGTAAAA AATGCAGGCG GATTATGTAT 1860ATTAAAAAAC CAAAAAAAGA ATAAAGAAGA AGGTGGAAAT ACGTCTGAAA AGGAGCCTGA 1920TGAAATCCAA AAGACATTCA ATCCTTTTTT TTACTATTGG GTTGCACATA TGTTAAAAGA 1980TTCCATACAT TGGAAAAAAA AACTTCAGAG ATGTTTACAA AATGGTAACA GAATAAAATG 2040TGGAAACAAT AAATGTAATA ATGATTGTGA ATGTTTTAAA AGATGGATTA CACAAAAAAA 2100AGACGAATGG GGGAAAATAG TACAACATTT TAAAACGCAA AATATTAAAG GTAGAGGAGG 2160TAGTGACAAT ACGGCAGAAT TAATCCCATT TGATCACGAT TATGTTCTTC AATACAATTT 2220GCAAGAAGAA TTTTTGAAAG GCGATTCCGA AGACGCTTCC GAAGAAAAAT CCGAAAATAG 2280TCTGGATGCA GAGGAGGCAG AGGAACTAAA ACACCTTCGC GAAATCATTG AAAGTGAAGA 2340CAATAATCAA GAAGCATCTG TTGGTGGTGG CGTCACTGAA CAAAAAAATA TAATGGATAA 2400ATTGCTCAAC TACGAAAAAG ACGAAGCCGA TTTATGCCTA GAAATTCACG AAGATGAGGA 2460AGAGGAAAAA GAAAAAGGAG ACGGAAACGA ATGTATCGAA GAGGGCGAAA ATTTTCGTTA 2520TAATCCATGT AGTGGCGAAA GTGGTAACAA ACGATACCCC GTTCTTGCGA ACAAAGTAGC 2580GTATCAAATG CATCACAAGG CAAAGACACA ATTGGCTAGT CGTGCTGGTA GAAGTGCGTT 2640GAGAGGTGAT ATATCCTTAG CGCAATTTAA AAATGGTCGT AACGGAAGTA CATTGAAAGG 2700ACAAATTTGC AAAATTAACG AAAACTATTC CAATGATAGT CGTGGTAATA GTGGTGGACC 2760ATGTACAGGC AAAGATGGAG ATCACGGAGG TGTGCGCATG AGAATAGGAA CGGAATGGTC 2820AAATATTGAA GGAAAAAAAC AAACGTCATA CAAAAACGTC TTTTTACCTC CCCGACGAGA 2880ACACATGTGT ACATCCAATT TAGAAAATTT AGATGTTGGT AGTGTCACTA AAAATGATAA 2940GGCTAGCCAC TCATTATTGG GAGATGTTCA GCTCGCAGCA AAAACTGATG CAGCTGAGAT 3000AATAAAACGC TATAAAGATC AAAATAATAT ACAACTAACT GATCCAATAC AACAAAAAGA 3060CCAGGAGGCT ATGTGTCGAG CTGTACGTTA TAGTTTTGCC GATTTAGGAG ACATTATTCG 3120AGGAAGAGAT ATGTGGGATG AGGATAAGAG CTCAACAGAC ATGGAAACAC GTTTGATAAC 3180CGTATTTAAA AACATTAAAG AAAAACATGA TGGAATCAAA GACAACCCTA AATATACCGG 3240TGATGAAAGC AAAAAGCCCG CATATAAAAA ATTACGAGCA GATTGGTGGG AAGCAAATAG 3300ACATCAAGTG TGGAGAGCCA TGAAATGCGC AACAAAAGGC ATCATATGTC CTGGTATGCC 3360AGTTGACGAT TATATCCCCC AACGTTTACG CTGGATGACT GAATGGGCTG AATGGTATTG 3420TAAAGCGCAA TCACAGGAGT ATGACAAGTT AAAAAAAATC TGTGCAGATT GTATGAGTAA 3480GGGTGATGGA AAATGTACGC AAGGTGATGT CGATTGTGGA AAGTGCAAAG CAGCATGTGA 3540TAAATATAAA GAGGAAATAG AAAAATGGAA TGAACAATGG AGAAAAATAT CAGATAAATA 3600CAATCTATTA TACCTACAAG CAAAAACTAC TTCTACTAAT CCTGGCCGTA CTGTTCTTGG 3660TGATGACGAT CCCGACTATC AACAAATGGT AGATTTTTTG ACCCCAATAC ACAAAGCAAG 3720TATTGCCGCA CGTGTTCTTG TTAAACGTGC TGCTGGTAGT CCCACTGAGA TCGCCGCCGC 3780CGCCCCGATC ACCCCCTACA GTACTGCTGC CGGATATATA CACCAGGAAA TAGGATATGG 3840GGGGTGCCAG GAACAAACAC AATTTTGTGA AAAAAAACAT GGTGCAACAT CAACTAGTAC 3900CACGAAAGAA AACAAAGAAT ACACCTTTAA ACAACCTCCG CCGGAGTATG CTACAGCGTG 3960TGATTGCATA AATAGGTCGC AAACAGAGGA GCCGAAGAAA AAGGAAGAAA ATGTAGAGAG 4020TGCCTGCAAA ATAGTGGAGA AAATACTTGA GGGTAAGAAT GGAAGGACTA CAGTAGGTGA 4080ATGTAATCCA AAAGAGAGTT ATCCTGATTG GGATTGCAAA AACAATATTG ACATTAGTCA 4140TGATGGTGCT TGTATGCCTC CAAGGAGACA AAAACTATGT TTATATTATA TAGCACATGA 4200GAGTCAAACA GAAAATATAA AAACAGACGA TAATTTGAAA GATGCTTTTA TTAAAACTGC 4260AGCAGCAGAA ACTTTTCTTT CATGGCAATA TTATAAGAGT AAGAATGATA GTGAAGCTAA 4320AATATTAGAT AGAGGCCTTA TTCCATCCCA ATTTTTAAGA TCCATGATGT ACACGTTTGG 4380AGATTATAGA GATATATGTT TGAACACAGA TATATCTAAA AAACAAAATG ATGTAGCTAA 4440GGCAAAAGAT AAAATAGGTA AATTTTTCTC AAAAGATGGC AGCAAATCTC CTAGTGGCTT 4500ATCACGCCAA GAATGGTGGA AAACAAATGG TCCAGAGATT TGGAAAGGAA TGTTATGTGC 4560CTTAACAAAA TACGTCACAG ATACCGATAA CAAAAGAAAA ATCAAAAACG ACTACTCATA 4620CGATAAAGTC AACCAATCCC AAAATGGCAA CCCTTCCCTT GAAGAGTTTG CTGCTAAACC 4680TCAATTTCTA CGTTGGATGA TCGAATGGGG AGAAGAGTTT TGTGCTGAAC GTCAGAAGAA 4740GGAAAATATC ATAAAAGATG CATGTAATGA AATAAATTCT ACACAACAGT GTAATGATGC 4800GAAACATCGT TGTAATCAAG CATGTAGAGC ATATCAAGAA TATGTTGAAA ATAAAAAAAA 4860AGAATTTTCG GGACAAACAA ATAACTTTGT TCTAAAGGCA AATGTTCAGC CCCAAGATCC 4920AGAATATAAA GGATATGAAT ATAAAGACGG CGTACAACCG ATACAGGGGA ATGAGTATTT 4980ACTGCAAAAA TGTGATAATA ATAAATGTTC TTGCATGGAT GGAAATGTAC TTTCCGTCTC 5040TCCAAAAGAA AAACCTTTTG GAAAATATGC CCATAAATAT CCTGAGAAAT GTGATTGTTA 5100TCAAGGAAAA CATGTACCTA GCATACCACC TCCCCCCCCA CCTGTACAAC CACAACCGGA 5160AGCACCAACA GTAACAGTAG ACGTTTGCAG CATAGTAAAA ACACTATTTA AAGACACAAA 5220CAATTTTTCC GACGCTTGTG GTCTAAAATA CGGCAAAACC GCACCATCCA GTTGGAAATG 5280TATACCAAGT GACACAAAAA GTGGTGCTGG TGCCACCACC GGCAAAAGTG GTAGTGATAG 5340TGGTAGTATT TGTATCCCAC CCAGGAGGCG ACGATTATAT GTGGGGAAAC TACAGGAGTG 5400GGCTACCGCG CTCCCACAAG GTGAGGGCGC CGCGCCGTCC CACTCACGCG CCGACGACTT 5460GCGCAATGCG TTCATCCAAT CTGCTGCAAT AGAGACTTTT TTCTTATGGG ATAGATATAA 5520AGAAGAGAAA AAACCACAGG GTGATGGGTC ACAACAAGCA CTATCACAAC TAACCAGTAC 5580ATACAGTGAT GACGAGGAGG ACCCCCCCGA CAAACTGTTA CAAAATGGTA AGATACCCCC 5640CGATTTTTTG AGATTAATGT TCTATACATT AGGAGATTAT AGGGATATTT TAGTACACGG 5700TGGTAACACA AGTGACAGTG GTAACACAAA TGGTAGTAAC AACAACAATA TTGTGCTTGA 5760AGCGAGTGGT AACAAGGAGG ACATGCAAAA AATACAAGAG AAAATAGAAC AAATTCTCCC 5820AAAAAATGGT GGCACACCTC TTGTCCCAAA ATCTAGTGCC CAAACACCTG ATAAATGGTG 5880GAATGAACAC GCCGAATCTA TCTGGAAAGG TATGATATGT GCATTGACAT ATACAGAAAA 5940GAACCCTGAC ACCAGTGCAA GAGGCGACGA AAACAAAATA GAAAAGGATG ATGAAGTGTA 6000CGAGAAATTT TTTGGCAGCA CAGCCGACAA ACATGGCACA GCCTCAACCC CAACCGGCAC 6060ATACAAAACC CAATACGACT ACGAAAAAGT CAAACTTGAG GATACAAGTG GTGCCAAAAC 6120CCCCTCAGCC TCTAGTGATA CACCCCTTCT CTCCGATTTC GTGTTACGCC CCCCCTACTT 6180CCGTTACCTT GAAGAATGGG GTCAAAATTT TTGTAAAAAA AGAAAGCATA AATTGGCACA 6240AATAAAACAT GAGTGTAAAG TAGAAGAAAA TGGTGGTGGT AGTCGTCGTG GTGGTATAAC 6300AAGACAATAT AGTGGGGATG GCGAAGCGTG TAATGAGATG CTTCCAAAAA ACGATGGAAC 6360TGTTCCGGAT TTAGAAAAGC CGAGTTGTGC CAAACCTTGT AGTTCTTATA GAAAATGGAT 6420AGAAAGCAAG GGAAAAGAGT TTGAGAAACA AGAAAAGGCA TATGAACAAC AAAAAGACAA 6480ATGTGTAAAT GGAAGTAATA AGCATGATAA TGGATTTTGT GAAACACTAA CAACGTCCTC 6540TAAAGCTAAA GACTTTTTAA AAACGTTAGG ACCATGTAAA CCTAATAATG TAGAGGGTAA 6600AACAATTTTT GATGATGATA AAACCTTTAA ACATACAAAA GATTGTGATC CATGTCTTAA 6660ATTTAGTGTT AATTGTAAAA AAGATGAATG TGATAATTCT AAAGGAACCG ATTGCCGAAA 6720TAAAAATAGT ATTGATGCAA CAGATATTGA AAATGGAGTG GATTCTACTG TACTAGAAAT 6780GCGTGTCAGT GCTGATAGTA AAAGTGGATT TAATGGTGAT GGTTTAGAGA ATGCTTGTAG 6840AGGTGCTGGT ATCTTTGAAG GTATTAGAAA AGATGAATGG AAATGTCGTA ATGTATGTGG 6900TTATGTTGTA TGTAAACCGG AAAACGTTAA TGGGGAAGCA AAGGGAAAAC ACATTATACA 6960AATTAGAGCA CTGGTTAAAC GTTGGGTAGA ATATTTTTTT GAAGATTATA ATAAAATAAA 7020ACATAAAATT TCACATCGCA TAAAAAATGG TGAAATATCT CCATGTATAA AAAATTGTGT 7080AGAAAAATGG GTAGATCAGA AAAGAAAAGA ATGGAAGGAA ATTACTGAAC GTTTCAAAGA 7140TCAATATAAA AATGACAATT CAGATGATGA CAATGTGAGA AGTTTTTTGG AGACCTTGAT 7200ACCTCAAATT ACTGATGCAA ACGCTAAAAA TAAGGTTATA AAATTAAGTA AGTTCGGTAA 7260TTCTTGTGGA TGTAGTGCCA GTGCGAACGA ACAAAACAAA AATGGTGAAT ACAAGGACGC 7320TATAGATTGT ATGCTTAAAA AGCTTAAAGA TAAAATTGGC GAGTGCGAAA AGAAACACCA 7380TCAAACTAGT GATACCGAGT GTTCCGACAC ACCACAACCG CAAACCCTTG AAGACGAAAC 7440TTTGGATGAT GATATAGAAA CAGAGGAGGC GAAGAAGAAC ATGATGCCGA AAATTTGTGA 7500AAATGTGTTA AAAACAGCAC AACAAGAGGA TGAAGGCGGT TGTGTCCCAG CAGAAAATAG 7560TGAAGAACCG GCAGCAACAG ATAGTGGTAA GGAAACCCCC GAACAAACCC CCGTTCTCAA 7620ACCCGAAGAA GAAGCAGTAC CGGAACCACC ACCTCCACCC CCACAGGAAA AAGCCCCGGC 7680ACCAATACCC CAACCACAAC CACCAACCCC CCCCACACAA CTCTTGGATA ATCCCCACGT 7740TCTAACCGCC CTGGTGACCT CCACCCTCGC CTGGAGCGTT GGCATCGGTT TTGCTACATT 7800CACTTATTTT TATCTAAAGG TAAATGGAAG TATATATATG GGGATGTGGA TGTATGTGGA 7860TGTATGTGAA TGTATGTGGA TGTATGTGGA TGTATGTGGA TGTGTTTTAT GGATATGTAT 7920TTGTGATTAT GTTTGGATAT ATATATATAT ATATATATGT TTATGTATAT GTGTTTTTGG 7980ATATATATAT GTGTATGTAT ATGATTTTCT GTATATGTAT TTGTGGGTTA AGGATATATA 8040TATATGGATG TACTTGTATG TGTTTTATAT ATATATTTTA TATATATGTA TTTATATTAA 8100AAAAGAAATA TAAAAACAAA TTTATTAAAA TGAAAAAAAG AAAAATGAAA TATAAAAAAA 8160AATTTATTAA AATAAAAAAA AAAAAAAAAA AAAAGGAGAA AAATTTTTTA AAAAATAATA 8220(2)SEQ ID NO12资料(I)序列特征(A)长度2710个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑线型(II)分子类型蛋白质(III)假定的非(VI)原始来源(A)生物镰状疟原虫(XI)序列描述SEQ ID NO12Asn Val Met Val Glu Leu Ala Lys Met Gly Pro Lys Glu Ala Ala Gly1 5 10 15Gly Asp Asp Ile Glu Asp Glu Ser Ala Lys His Met Phe Asp Arg Ile20 25 30Gly Lys Asp Val Tyr Asp Lys Val Lys Glu Glu Ala Lys Glu Arg Gly35 40 45Lys Gly Leu Gln Gly Arg Leu Ser Glu Ala Lys Phe Glu Lys Asn Glu50 55 60Ser Asp Pro Gln Thr Pro Glu Asp Pro Cys Asp Leu Asp His Lys Tyr65 70 75 80His Thr Asn Val Thr Thr Asn Val Ile Asn Pro Cys Ala Asp Arg Ser85 90 95Asp Val Arg Phe Ser Asp Glu Tyr Gly Gly Gln Cys Thr His Asn Arg100 105 110Ile Lys Asp Ser Gln Gln Gly Asp Asn Lys Gly Ala Cys Ala Pro Tyr115 120 125Arg Arg Leu His Val Cys Asp Gln Asn Leu Glu Gln Ile Glu Pro Ile130 135 140Lys Ile Thr Asn Thr His Asn Leu Leu Val Asp Val Cys Met Ala Ala145 150 155 160Lys Phe Glu Gly Gln Ser Ile Thr Gln Asp Tyr Pro Lys Tyr Gln Ala165 170 175Thr Tyr Gly Asp Ser Pro Ser Gln Ile Cys Thr Met Leu Ala Arg Ser180 185 190Phe Ala Asp Ile Gly Asp Ile Val Arg Gly Arg Asp Leu Tyr Leu Gly195 200 205Asn Pro Gln Glu Ile Lys Gln Arg Gln Gln Leu Glu Asn Asn Leu Lys210 215 220Thr Ile Phe Gly Lys Ile Tyr Glu Lys Leu Asn Gly Ala Glu Ala Arg225 230 235 240Tyr Gly Asn Asp Pro Glu Phe Phe Lys Leu Arg Glu Asp Trp Trp Thr245 250 255Ala Asn Arg Glu Thr Val Trp Lys Ala Ile Thr Cys Asn Ala Trp Gly260 265 270Asn Thr Tyr Phe His Ala Thr Cys Asn Arg Gly Glu Arg Thr Lys Gly275 280 285Tyr Cys Arg Cys Asn Asp Asp Gln Val Pro Thr Tyr Phe Asp Tyr Val290 295 300Pro Gln Tyr Leu Arg Trp Phe Glu Glu Trp Ala Glu Asp Phe Cys Arg305 310 315 320Lys Lys Asn Lys Lys Ile Lys Asp Val Lys Arg Asn Cys Arg Gly Lys325 330 335Asp Lys Glu Asp Lys Asp Arg Tyr Cys Ser Arg Asn Gly Tyr Asp Cys340 345 350Glu Lys Thr Lys Arg Ala Ile Gly Lys Leu Arg Tyr Gly Lys Gln Cys355 360 365Ile Ser Cys Leu Tyr Ala Cys Asn Pro Tyr Val Asp Trp Ile Asn Asn370 375 380Gln Lys Glu Gln Phe Asp Lys Gln Lys Lys Lys Tyr Asp Glu Glu Ile385 390 395 400Lys Lys Tyr Glu Asn Gly Ala Ser Gly Gly Ser Arg Gln Lys Arg Asp405 410 415Ala Gly Gly Thr Thr Thr Thr Asn Tyr Asp Gly Tyr Glu Lys Lys Phe420 425 430Tyr Asp Glu Leu Asn Lys Ser Glu Tyr Arg Thr Val Asp Lys Phe Leu435 440 445Glu Lys Leu Ser Asn Glu Glu Ile Cys Thr Lys Val Lys Asp Glu Glu450 455 460Gly Gly Thr Ile Asp Phe Lys Asn Val Asn Ser Asp Ser Thr Ser Gly465 470 475 480Ala Ser Gly Thr Asn Val Glu Ser Gln Gly Thr Phe Tyr Arg Ser Lys485 490 495Tyr Cys Gln Pro Cys Pro Tyr Cys Gly Val Lys Lys Val Asn Asn Gly500 505 510Gly Ser Ser Asn Glu Trp Glu Glu Lys Asn Asn Gly Lys Cys Lys Ser515 520 525Gly Lys Leu Tyr Glu Pro Lys Pro Asp Lys Glu Gly Thr Thr Ile Thr530 535 540Ile Leu Lys Ser Gly Lys Gly His Asp Asp Ile Glu Glu Lys Leu Asn545 550 555 560Lys Phe Cys Asp Glu Lys Asn Gly Asp Thr Ile Asn Ser Gly Gly Ser565 570 575Gly Thr Gly Gly Ser Gly Gly Gly Asn Ser Gly Arg Gln Glu Leu Tyr580 585 590Glu Glu Trp Lys Cys Tyr Lys Gly Glu Asp Val Val Lys Val Gly His595 600 605Asp Glu Asp Asp Glu Glu Asp Tyr Glu Asn Val Lys Asn Ala Gly Gly610 615 620Leu Cys Ile Leu Lys Asn Gln Lys Lys Asn Lys Glu Glu Gly Gly Asn625 630 635 640Thr Ser Glu Lys Glu Pro Asp Glu Ile Gln Lys Thr Phe Asn Pro Phe645 650 655Phe Tyr Tyr Trp Val Ala His Met Leu Lys Asp Ser Ile His Trp Lys660 665 670Lys Lys Leu Gln Arg Cys Leu Gln Asn Gly Asn Arg Ile Lys Cys Gly675 680 685Asn Asn Lys Cys Asn Asn Asp Cys Glu Cys Phe Lys Arg Trp Ile Thr690 695 700Gln Lys Lys Asp Glu Trp Gly Lys Ile Val Gln His Phe Lys Thr Gln705 710 715 720Asn Ile Lys Gly Arg Gly Gly Ser Asp Asn Thr Ala Glu Leu Ile Pro725 730 735Phe Asp His Asp Tyr Val Leu Gln Tyr Asn Leu Gln Glu Glu Phe Leu
740 745 750Lys Gly Asp Ser Glu Asp Ala Ser Glu Glu Lys Ser Glu Asn Ser Leu755 760 765Asp Ala Glu Glu Ala Glu Glu Leu Lys His Leu Arg Glu Ile Ile Glu770 775 780Ser Glu Asp Asn Asn Gln Glu Ala Ser Val Gly Gly Gly Val Thr Glu785 790 795 800Gln Lys Asn Ile Met Asp Lys Leu Leu Asn Tyr Glu Lys Asp Glu Ala805 810 815Asp Leu Cys Leu Glu Ile His Glu Asp Glu Glu Glu Glu Lys Glu Lys820 825 830Gly Asp Gly Asn Glu Cys Ile Glu Glu Gly Glu Asn Phe Arg Tyr Asn835 840 845Pro Cys Ser Gly Glu Ser Gly Asn Lys Arg Tyr Pro Val Leu Ala Asn850 855 860Lys Val Ala Tyr Gln Met His His Lys Ala Lys Thr Gln Leu Ala Ser865 870 875 880Arg Ala Gly Arg Ser Ala Leu Arg Gly Asp Ile Ser Leu Ala Gln Phe885 890 895Lys Asn Gly Arg Asn Gly Ser Thr Leu Lys Gly Gln Ile Cys Lys Ile900 905 910Asn Glu Asn Tyr Ser Asn Asp Ser Arg Gly Asn Ser Gly Gly Pro Cys915 920 925Thr Gly Lys Asp Gly Asp His Gly Gly Val Arg Met Arg Ile Gly Thr930 935 940Glu Trp Ser Asn Ile Glu Gly Lys Lys Gln Thr Ser Tyr Lys Asn Val945 950 955 960Phe Leu Pro Pro Arg Arg Glu His Met Cys Thr Ser Asn Leu Glu Asn965 970 975Leu Asp Val Gly Ser Val Thr Lys Asn Asp Lys Ala Ser His Ser Leu980 985 990Leu Gly Asp Val Gln Leu Ala Ala Lys Thr Asp Ala Ala Glu Ile Ile995 10001005Lys Arg Tyr Lys Asp Gln Asn Asn Ile Gln Leu Thr Asp Pro Ile Gln101010151020Gln Lys Asp Gln Glu Ala Met Cys Arg Ala Val Arg Tyr Ser Phe Ala1025103010351040Asp Leu Gly Asp Ile Ile Arg Gly Arg Asp Met Trp Asp Glu Asp Lys104510501055Ser Ser Thr Asp Met Glu Thr Arg Leu Ile Thr Val Phe Lys Asn Ile106010651070Lys Glu Lys His Asp Gly Ile Lys Asp Asn Pro Lys Tyr Thr Gly Asp107510801085Glu Ser Lys Lys Pro Ala Tyr Lys Lys Leu Arg Ala Asp Trp Trp Glu109010951100Ala Asn Arg His Gln Val Trp Arg Ala Met Lys Cys Ala Thr Lys Gly1105111011151120Ile Ile Cys Pro Gly Met Pro Val Asp Asp Tyr Ile Pro Gln Arg Leu112511301135Arg Trp Met Thr Glu Trp Ala Glu Trp Tyr Cys Lys Ala Gln Ser Gln114011451150Glu Tyr Asp Lys Leu Lys Lys Ile Cys Ala Asp Cys Met Sar Lys Gly11551160 1165Asp Gly Lys Cys Thr Gln Gly Asp Val Asp Cys Gly Lys Cys Lys Ala117011751180Ala Cys Asp Lys Tyr Lys Glu Glu Ile Glu Lys Trp Asn Glu Gln Trp1185119011951200Arg Lys Ile Ser Asp Lys Tyr Asn Leu Leu Tyr Leu Gln Ala Lys Thr120512101215Thr Ser Thr Asn Pro Gly Arg Thr Val Leu Gly Asp Asp Asp Pro Asp122012251230Tyr Gln Gln Met Val Asp Phe Leu Thr Pro Ile His Lys Ala Ser Ile123512401245Ala Ala Arg Val Leu Val Lys Arg Ala Ala Gly Ser Pro Thr Glu Ile125012551260Ala Ala Ala Ala Pro Ile Thr Pro Tyr Ser Thr Ala Ala Gly Tyr Ile1265127012751280His Gln Glu Ile Gly Tyr Gly Gly Cys Gln Glu Gln Thr Gln Phe Cys128512901295Glu Lys Lys His Gly Ala Thr Ser Thr Ser Thr Thr Lys Glu Asn Lys130013051310Glu Tyr Thr Phe Lys Gln Pro Pro Pro Glu Tyr Ala Thr Ala Cys Asp131513201325Cys Ile Asn Arg Ser Gln Thr Glu Glu Pro Lys Lys Lys Glu Glu Asn
133013351340Val Glu Ser Ala Cys Lys Ile Val Glu Lys Ile Leu Glu Gly Lys Asn1345135013551360Gly Arg Thr Thr Val Gly Glu Cys Asn Pro Lys Glu Ser Tyr Pro Asp136513701375Trp Asp Cys Lys Asn Asn Ile Asp Ile Ser His Asp Gly Ala Cys Met138013851390Pro Pro Arg Arg Gln Lys Leu Cys Leu Tyr Tyr Ile Ala His Glu Ser139514001405Gln Thr Glu Asn Ile Lys Thr Asp Asp Asn Leu Lys Asp Ala Phe Ile141014151420Lys Thr Ala Ala Ala Glu Thr Phe Leu Ser Trp Gln Tyr Tyr Lys Ser1425143014351440Lys Asn Asp Ser Glu Ala Lys Ile Leu Asp Arg Gly Leu Ile Pro Ser144514501455Gln Phe Leu Arg Ser Met Met Tyr Thr Phe Gly Asp Tyr Arg Asp Ile146014651470Cys Leu Asn Thr Asp Ile Ser Lys Lys Gln Asn Asp Val Ala Lys Ala147514801485Lys Asp Lys Ile Gly Lys Phe Phe Ser Lys Asp Gly Ser Lys Ser Pro149014951500Ser Gly Leu Ser Arg Gln Glu TrP Trp Lys Thr Asn Gly Pro Glu Ile1505151015151520Trp Lys Gly Met Leu Cys Ala Leu Thr Lys Tyr Val Thr Asp Thr Asp152515301535Asn Lys Arg Lys Ile Lys Asn Asp Tyr Ser Tyr Asp Lys Val Asn Gln154015451550Ser Gln Asn Gly Asn Pro Ser Leu Glu Glu Phe Ala Ala Lys Pro Gln155515601565Phe Leu Arg Trp Met Ile Glu Trp Gly Glu Glu Phe Cys Ala Glu Arg157015751580Gln Lys Lys Glu Asn Ile Ile Lys Asp Ala Cys Asn Glu Ile Asn Ser1585159015951600Thr Gln Gln Cys Asn Asp Ala Lys His Arg Cys Asn Gln Ala Cys Arg160516101615Ala Tyr Gln Glu Tyr Val Glu Asn Lys Lys Lys Glu Phe Ser Gly Gln162016251630Thr Asn Asn Phe Val Leu Lys Ala Asn Val Gln Pro Gln Asp Pro Glu163516401645Tyr Lys Gly Tyr Glu Tyr Lys Asp Gly Val Gln Pro Ile Gln Gly Asn165016551660Glu Tyr Leu Leu Gln Lys Cys Asp Asn Asn Lys Cys Ser Cys Met Asp1665167016751680Gly Asn Val Leu Ser Val Ser Pro Lys Glu Lys Pro Phe Gly Lys Tyr168516901695Ala His Lys Tyr Pro Glu Lys Cys Asp Cys Tyr Gln Gly Lys His Val170017051710Pro Ser Ile Pro Pro Pro Pro Pro Pro Val Gln Pro Gln Pro Glu Ala171517201725Pro Thr Val Thr Val Asp Val Cys Ser Ile Val Lys Thr Leu Phe Lys173017351740Asp Thr Asn Asn Phe Ser Asp Ala Cys Gly Leu Lys Tyr Gly Lys Thr1745175017551760Ala Pro Ser Ser Trp Lys Cys Ile Pro Ser Asp Thr Lys Ser Gly Ala176517701775Gly Ala Thr Thr Gly Lys Ser Gly Ser Asp Ser Gly Ser Ile Cys Ile178017851790Pro Pro Arg Arg Arg Arg Leu Tyr Val Gly Lys Leu Gln Glu Trp Ala179518001805Thr Ala Leu Pro Gln Gly Glu Gly Ala Ala Pro Ser His Ser Arg Ala181018151820Asp Asp Leu Arg Asn Ala Phe Ile Gln Ser Ala Ala Ile Glu Thr Phe1825183018351840Phe Leu Trp Asp Arg Tyr Lys Glu Glu Lys Lys Pro Gln Gly Asp Gly184518501855Ser Gln Gln Ala Leu Ser Gln Leu Thr Ser Thr Tyr Ser Asp Asp Glu186018651870Glu Asp Pro Pro Asp Lys Leu Leu Gln Asn Gly Lys Ile Pro Pro Asp187518801885Phe Leu Arg Leu Met Phe Tyr Thr Leu Gly Asp Tyr Arg Asp Ile Leu189018951900Val His Gly Gly Asn Thr Ser Asp Ser Gly Asn Thr Asn Gly Ser Asn1905191019151920Asn Asn Asn Ile Val Leu Glu Ala Ser Gly Asn Lys Glu Asp Met Gln
192519301935Lys Ile Gln Glu Lys Ile Glu Gln Ile Leu Pro Lys Asn Gly Gly Thr194019451950Pro Leu Val Pro Lys Ser Ser Ala Gln Thr Pro Asp Lys Trp Trp Asn195519601965Glu His Ala Glu Ser Ile Trp Lys Gly Met Ile Cys Ala Leu Thr Tyr197019751980Thr Glu Lys Asn Pro Asp Thr Ser Ala Arg Gly Asp Glu Asn Lys Ile1985199019952000Glu Lys Asp Asp Glu Val Tyr Glu Lys Phe Phe Gly Ser Thr Ala Asp200520102015Lys His Gly Thr Ala Ser Thr Pro Thr Gly Thr Tyr Lys Thr Gln Tyr202020252030Asp Tyr Glu Lys Val Lys Leu Glu Asp Thr Ser Gly Ala Lys Thr Pro203520402045Ser Ala Ser Ser Asp Thr Pro Leu Leu Ser Asp Phe Val Leu Arg Pro205020552060Pro Tyr Phe Arg Tyr Leu Glu Glu Trp Gly Gln Asn Phe Cys Lys Lys2065207020752080Arg Lys His Lys Leu Ala Gln Ile Lys His Glu Cys Lys Val Glu Glu208520902095Asn Gly Gly Gly Ser Arg Arg Gly Gly Ile Thr Arg Gln Tyr Ser Gly210021052110Asp Gly Glu Ala Cys Asn Glu Met Leu Pro Lys Asn Asp Gly Thr Val211521202125Pro Asp Leu Glu Lys Pro Ser Cys Ala Lys Pro Cys Ser Ser Tyr Arg213021352140Lys Trp Ile Glu Ser Lys Gly Lys Glu Phe Glu Lys Gln Glu Lys Ala2145215021552160Tyr Glu Gln Gln Lys Asp Lys Cys Val Asn Gly Ser Asn Lys His Asp216521702175Asn Gly Phe Cys Glu Thr Leu Thr Thr Ser Ser Lys Ala Lys Asp Phe218021852190Leu Lys Thr Leu Gly Pro Cys Lys Pro Asn Asn Val Glu Gly Lys Thr219522002205Ile Phe Asp Asp Asp Lys Thr Phe Lys His Thr Lys Asp Cys Asp Pro221022152220Cys Leu Lys Phe Ser Val Asn Cys Lys Lys Asp Glu Cys Asp Asn Ser2225223022352240Lys Gly Thr Asp Cys Arg Asn Lys Asn Ser Ile Asp Ala Thr Asp Ile224522502255Glu Asn Gly Val Asp Ser Thr Val Leu Glu Met Arg Val Ser Ala Asp226022652270Ser Lys Ser Gly Phe Asn Gly Asp Gly Leu Glu Asn Ala Cys Arg Gly227522802285Ala Gly Ile Phe Glu Gly Ile Arg Lys Asp Glu Trp Lys Cys Arg Asn229022952300Val Cys Gly Tyr Val Val Cys Lys Pro Glu Asn Val Asn Gly Glu Ala2305231023152320Lys Gly Lys His Ile Ile Gln Ile Arg Ala Leu Val Lys Arg Trp Val232523302335Glu Tyr Phe Phe Glu Asp Tyr Asn Lys Ile Lys His Lys Ile Ser His234023452350Arg Ile Lys Asn Gly Glu Ile Ser Pro Cys Ile Lys Asn Cys Val Glu235523602365Lys Trp Val Asp Gln Lys Arg Lys Glu Trp Lys Glu Ile Thr Glu Arg237023752380Phe Lys Asp Gln Tyr Lys Asn Asp Asn Ser Asp Asp Asp Asn Val Arg2385239023952400Ser Phe Leu Glu Thr Leu Ile Pro Gln Ile Thr Asp Ala Asn Ala Lys240524102415Asn Lys Val Ile Lys Leu Ser Lys Phe Gly Asn Ser Cys Gly Cys Ser242024252430Ala Ser Ala Asn Glu Gln Asn Lys Asn Gly Glu Tyr Lys Asp Ala Ile243524402445Asp Cys Met Leu Lys Lys Leu Lys Asp Lys Ile Gly Glu Cys Glu Lys245024552460Lys His His Gln Thr Ser Asp Thr Glu Cys Ser Asp Thr Pro Gln Pro2465247024752480Gln Thr Leu Glu Asp Glu Thr Leu Asp Asp Asp Ile Glu Thr Glu Glu248524902495Ala Lys Lys Asn Met Met Pro Lys Ile Cys Glu Asn Val Leu Lys Thr250025052510Ala Gln Gln Glu Asp Glu Gly Gly Cys Val Pro Ala Glu Asn Ser Glu
251525202525Glu Pro Ala Ala Thr Asp Ser Gly Lys Glu Thr Pro Glu Gln Thr Pro253025352540Val Leu Lys Pro Glu Glu Glu Ala Val Pro Glu Pro Pro Pro Pro Pro2545255025552560Pro Gln Glu Lys Ala Pro Ala Pro Ile Pro Gln Pro Gln Pro Pro Thr256525702575Pro Pro Thr Gln Leu Leu Asp Asn Pro His Val Leu Thr Ala Leu Val258025852590Thr Ser Thr Leu Ala Trp Ser Val Gly Ile Gly Phe Ala Thr Phe Thr259526002605Tyr Phe Tyr Leu Lys Val Asn Gly Ser Ile Tyr Met Gly Met Trp Met261026152620Tyr Val Asp Val Cys Glu Cys Met Trp Met Tyr Val Asp Val Cys Gly2625263026352640Cys Val Leu Trp Ile Cys Ile Cys Asp Tyr Val Trp Ile Tyr Ile Tyr2645 26502655Ile Tyr Ile Cys Leu Cys Ile Cys Val Phe Gly Tyr Ile Tyr Val Tyr266026652670Val Tyr Asp Phe Leu Tyr Met Tyr Leu Trp Val Lys Asp Ile Tyr Ile267526802685Trp Met Tyr Leu Tyr Val Phe Tyr Ile Tyr Ile Leu Tyr Ile Cys Ile269026952700Tyr Ile Lys Lys Glu Ile27052710(2)SEQ ID NO13资料(I)序列特征(A)长度30对碱基(B)类型核酸(C)链型单链(D)拓扑线性(II)分子类型DNA(基因组)(III)假定的非(IV)反义无(V)片段类型(VI)原始来源(XI)序列描述SEQ ID NO13
ATCGATCAGC TGGGAAGAAA TACTTCATCT(2)SEQ ID NO14资料(I)序列特征(A)长度30对碱基(B)类型核酸(C)链型单链(D)拓扑线性(II)分子类型DNA(基因组)(III)假定的非(IV)反义无(V)片段类型(VI)原始来源(XI)序列描述SEQ ID NO14ATCGATGGGC CCCGAAGTTT GTTCATTATT(2)SEQ ID NO15资料(I)序列特征(A)长度30对碱基(B)类型核酸(C)链型单链(D)拓扑线性(II)分子类型DNA(基因组)(III)假定的非(IV)反义无(V)片段类型(VI)原始来源(XI)序列描述SEQ ID NO15TCTCGTCAGC TGACGATCTC TAGTGCTATT(2)SEQ ID NO16资料(I)序列特征(A)长度30对碱基(B)类型核酸(C)链型单链(D)拓扑线性(II)分子类型DNA(基因组)(III)假定的非(IV)反义无(V)片段类型(VI)原始来源(XI)序列描述SEQ ID NO16ACGAGTGGGC CCTGTCACAA CTTCCTGAGT
权利要求
1.一种源自镰状疟原虫唾液酸结合蛋白(SABP)的分离的结合区多肽,其中所述的结合区多肽至少含有图1中定义的所述的SABP中开始于SEQ ID NO4中的大约第158位残基的半胱氨酸富集区的一部分,或者其中含有用GAP,BESTFIT,FASTA或TFASTA在使用默认参数下确定其中至少存在SEQ ID NO4所含半胱氨酸残基的70%的序列的一部分,所述的结合区多肽含有的氨基酸在约50个到约616个之间。
2.权利要求1的结合区多肽,其中SABP结合区多肽含大约200到大约600之间的氨基酸残基。
3.权利要求1的结合区多肽,其中SABP结合区多肽具有大约616的氨基酸残基。
4.权利要求1的结合区多肽,其中SABP结合区多肽含有图1所示的开始于SEQ ID NO4的大约第158位残基的SABP F1序列。
5.权利要求1的结合区多肽,其中SABP结合区多肽含有图1所示的开始于SEQ ID NO4的大约第462位残基的SABP F2序列。
6.权利要求1的结合区多肽,其中SABP结合区多肽是重组产生的。
7.一种药物用组合物,包含药学上可接受的载体和权利要求1的结合区多肽,其用途是在人体或动物体内诱导抗疟原虫属裂殖子的保护性免疫反应。
8.权利要求7的药物用组合物在人体或动物体内诱导抗疟原虫属裂殖子的保护性免疫反应上的用途。
9.一种包含分离的编码权利要求1的SABP结合区多肽的多核苷酸。
10.一种含有权利要求9的多核苷酸的重组细胞。
全文摘要
本发明提供了在治疗和阻止由镰状疟原虫或间日疟原虫引起的疟疾中有用的分离的多肽。特别是来自EBL家族中的蛋白质的结合区以及镰状疟原虫裂殖子上唾液酸结合蛋白(SABP)的多肽。也可以是来自间日疟原虫裂殖子上Duffy抗原结合蛋白(DABP)的多肽。
文档编号C12N15/09GK1414018SQ02131950
公开日2003年4月30日 申请日期2002年9月5日 优先权日1993年9月10日
发明者吉里·辛, 切坦·切特尼斯, 路易斯·H·米勒, 戴维·S·彼特森, 星专·苏, 托马斯·E·威廉姆斯 申请人:美国国有健康与人类服务部