编码新孢子虫蛋白质的多核苷酸分子的制作方法

文档序号：966547阅读：533来源：国知局

专利名称：编码新孢子虫蛋白质的多核苷酸分子的制作方法
技术领域：
本发明属于动物保健领域，并涉及疫苗组合物和疾病诊断方法。具体地说，本发明涉及包含编码新孢子虫(Neospora)GRA1,GRA2,SAG1,MIC1和MAG1蛋白质之核苷酸序列的多核苷酸分子，所说的多核苷酸分子和蛋白质可用于生产抗新孢子虫病的疫苗，及作为诊断试剂。
新孢子虫是动物的一种病原性原生动物寄生虫，已认定其为哺乳动物流产、新生儿死亡、先天性感染和脑炎病的主要原因(Dubey和Lindsay,1996，兽医寄生虫学，67:1-59；Dubey和Lindsay,1993，今日寄生虫学，9:452-458)。犬新孢子虫(Neospora caninum)会感染犬，并先天性地感染幼犬，常常导致麻痹。已从天然感染的幼犬体内分离出了速殖体(Lindsay和Dubey,1989，寄生虫学杂志，75:163-165)。新孢子虫感染是奶牛和肉牛流产的主要原因。也已报导了绵羊、山羊和马新孢子虫相关疾病即新孢子虫病的病例。
虽然犬新孢子虫表面相似于病原体Toxoplasma gondii，但犬新孢子虫和T.gondii彼此在抗原性和超结构上是不同的(Dubey和Lindsay,1993，上述文献)。此外，已显示从流产的牛胎儿脑中分离的、并在体外连续培养的新孢子虫样原生动物寄生虫在抗原性和超结构上都明显不同于T.gondii和Hammondia hammondi，而与犬新孢子虫最为相似(Conrad等，1993，寄生虫学，106:239-249)。再者，对核小亚单位核糖体RNA基因的分析表明，从牛和犬体内分离的新孢子虫株系之间没有核苷酸差异，但新孢子虫和T.gondii之间则显示了一致的差异(Marsh等，1995，寄生虫学杂志，81:530-535)。
已证实了新孢子虫的牛分离物在牛流产和先天性疾病中的病原作用(Barr等，1994，兽医诊断与研究杂志，6:207-215)。已使用被犬新孢子虫感染的纯系BALB/c小鼠建立了中枢神经系统新孢子虫病的啮齿动物模型(Lindsay等，1995，寄生虫学杂志，81:313-315)。另外，Cole等人(1995，寄生虫学杂志，81:730-732)和Long等人(1996，寄生虫学杂志，21:608-611)已分别描述了研究妊娠的杂系和纯系小鼠中犬新孢虫跨胎盘传播的模型。已证明了十分相似于天然获得性新孢子虫诱发的牛流产的实验性犬新孢子虫矮山羊模型(Lindsay等，1995，美国兽医研究杂志，56:1176-1180)。也已证明有一种实验性犬新孢子虫绵羊模型十分相似于天然获得性新孢子虫诱发的牛流产(Buxton等，1997,J.Camp.Path.117:1-16)。
在T.gondii中，包含抗原的排泄-分泌组的电子致密颗粒存在于速殖体的胞浆中。已将这些抗原定名为GRA蛋白。已报导T.gondii的GRA1蛋白质的分子量为大约22-27KDa，并且T.gondii的GRA2蛋白质的分子量为大约28KDa(Sam-Yellowe,1996，今日寄生虫学，12:308-315)。相似的电子致密颗粒也存在于犬新孢子虫速殖体的胞浆中(Bjerkas等，1994，临床诊断与实验免疫学，1:214-221；Hemphill等，1998，国际寄生虫学杂志，28:429-438)。
也已知T.gondii含有一组定名为SAG的主要表面抗原。据报导T.gondii的SAG1蛋白的分子量约为30KDa(Kasper等，1983，免疫学杂志，130:2407-2412)。在组织培养条件下，抗T.gondii SAG1蛋白质的单克隆抗体明显地阻断T.gondii速殖体侵入牛肾细胞的能力(Grimwood和Smith,1996，国际寄生虫学杂志，26:169-173)。由于T.gondii SAG1似乎在侵入过程中发挥某种作用，所以推测SAG1对于支持毒力表型可能是必要的(Windeck和Gross,1996，寄生虫学研究，82:715-719)。与这一推测一致的是，先用T.gondii SAG1免疫、然后用T.gondii攻击的小鼠比对照组小鼠降低了它们的脑中的弓浆虫孢囊形成(Debard等，1996，感染与免疫，64:2158-2166)。T.gondii SAG1可能在功能上与Hemphill等人(1997，寄生虫学，115:371-380)所述的新孢子虫中称为NC-p36的相似分子有关。
微丝是位于T.gondii和新孢子虫速殖体顶端的细胞内细胞器，并可在侵入期间的宿主细胞识别和在细胞表面上附着中起作用(Formaux等，1996，微生物学与免疫学当前论题，219:55-58)。已在T.gondii中鉴定了至少4种不同的微丝相关(MIC)蛋白质。T.gondii的MIC1蛋白约60KDa，它与宿主细胞的表面结合，并已报导其与能结合到人肝细胞上的恶性疟原虫中的血小板反应蛋白相关性粘附蛋白(TRAP)有部分同源性。(Robson等，1995,EMBO J.,14:3883-3894)。
寄生虫从速殖体转变成慢殖体是T.gondii慢性感染和持久性的关键因素。已在T.gondii中鉴定了表达一种免疫显性的称为MAG1的慢殖体特异性65KD抗原的基因(Parmley等，1994，分子生物化学与寄生虫学，66:283-296)。已报导可在慢殖体孢囊中，而不是在速殖体阶段表达MAG1。这种表达特异性可能表明，MAG1参予寄生虫生命周期中速殖体和慢殖体阶段间的转换(Bohne等，1996，微生物学与免疫学当前论题，219:81-91)。
在新孢子虫中鉴定T.gondii GRA1、GRA2、SAG1、MIC1和MAG1蛋白的蛋白质同系物，和编码所述新孢子虫蛋白之多核苷酸分子的核苷酸序列，将有利于开发抗新孢子虫病的疫苗，以及诊断试剂。
本发明提供包含编码犬新孢子虫中GRA1蛋白的核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，GRA1蛋白具有SEQ IDNO:2的氨基酸序列。在另一优选实施方案中，本发明分离的编码GRA1的多核苷酸分子包含选自下列一组的核苷酸序列SEQ ID NO:1的从大约nt205至大约nt777的核苷酸序列，存在于SEQ ID NO:3中从大约nt605至大约nt1304的GRA1基因之开放阅读框(ORF)的核苷酸序列，和质粒pRC77(ATCC209685)的编码GRA1的ORF的核苷酸序列。在一非限制性实施方案中，本发明分离的编码GRA1的多核苷酸分子包含选自SEQ ID NO:1和SEQ ID NO:3之核苷酸序列的核苷酸序列。本发明进一步提供具有与本发明编码GRA1的多核苷酸分子之核苷酸序列同源的核苷酸序列的一种分离多核苷酸分子。本发明进一步提供包含编码与犬新孢子虫GRA1蛋白同源之多肽的核苷酸序列的分离多核苷酸分子。本发明进一步提供由上文提到的任一种GRA1相关性多核苷酸分子的基本部分的核苷酸序列组成的多核苷酸分子。
本发明进一步提供包含编码犬新孢子虫GRA2蛋白之核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，GRA2蛋白具有SEQ IDNO:5的氨基酸序列。在另一优选实施方案中，本发明分离的编码GRA2的多核苷酸分子包含选自下列组中的核苷酸序列SEQ ID NO:4的从大约nt25至大约nt660的ORF核苷酸序列，质粒pRC5(ATCC209686)的编码GRA2的ORF的核苷酸序列。在一非限制性的实施方案中，本发明的分离的编码GRA2的多核苷酸分子包含SEQ ID NO:4的核苷酸序列。本发明进一步提供具有与本发明编码GRA2的多核苷酸分子之核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供包含编码与犬新孢子虫GRA2蛋白同源之多肽的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供由作为任何上述GRA2相关性多核苷酸分子的基本部分的核苷酸序列组成的多核苷酸分子。
本发明进一步提供包含编码犬新孢子虫SAG1之核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，SAG1蛋白具有SEQ IDNO:7的氨基酸序列。在另一优选实施方案中，本发明分离的编码SAG1的多核苷酸分子包含选自下列一组中的核苷酸序列SEQ ID NO:6中从大约nt130至大约nt1089的ORF的核苷酸序列，和质粒pRC102(ATCC209687)之编码SAG1的ORF的核苷酸序列。在一非限制性实施方案中，本发明的分离的编码SAG1的多核苷酸分子包含SEQ ID NO:6的核苷酸序列。本发明进一步提供具有与本发明编码SAG1的多核苷酸分子之核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供包含编码同源于犬新孢子虫SAG1蛋白之多肽的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供由作为上述任何SAG1相关性多核苷酸分子的基本部分的核苷酸序列组成的多核苷酸分子。
本发明进一步提供包含编码犬新孢子虫MIC1蛋白的核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，MIC1蛋白具有SEQ IDNO:9的氨基酸序列。在进一步的优选实施方案中，本发明的分离的编码MIC1的多核苷酸分子包含选自下列一组中的核苷酸序列SEQ IDNO:8中从大约nt138至大约nt1520的ORF的核苷酸序列，作为SEQ IDNO:10给出的MIC1基因之ORF的核苷酸序列，及质粒pRC340(ATCC209688)的编码MIC1的ORF的核苷酸序列。在一非限制性实施方案中，本发明的分离的编码MIC1的多核苷酸分子包含选自SEQ ID NO:8的核苷酸序列和SEQ ID NO:10的核苷酸序列的一种核苷酸序列。本发明进一步提供具有与本发明编码MIC1的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供包含编码同源于犬新孢子虫MIC1蛋白之多肽的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供由作为上述任何MIC1相关性多核苷酸分子的基本部分的核苷酸序列组成的多核苷酸分子。
本发明进一步提供包含编码犬新孢子虫MAG1蛋白的核苷酸序列的一种分离的多核苷酸分子。该MAG1蛋白具有SEQ ID NO:13中所示的推测的氨基酸序列。在一优选实施方案中，本发明分离的编码MAG1的多核苷酸分子包含选自下列成员的核苷酸序列存在于SEQ ID NO:11中的从大约nt1305至大约nt2786的核苷酸序列，从中制备的cDNA分子(如具有SEQ ID NO:12中从大约nt122至大约nt1381的ORF的cDNA分子)，和存在于质粒bd304(ATCC203413)中的编码MAG1的ORF的核苷酸序列。本发明进一步提供具有SEQ ID NO:11中给出的任何ORF的核苷酸序列的多核苷酸分子。在一非限制性实施方案中，本发明分离的编码MAG1的多核苷酸分子包含选自SEQ ID NO:11和SEQ ID NO:12的核苷酸序列。本发明进一步提供具有与本发明编码MAG1的多核苷酸分子之核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供包含编码同源于犬新孢子虫MAG1蛋白之多肽的核苷酸序列的一种分离的多核苷酸分子。本发明进一步提供由作为上述任何MAG1相关性多核苷酸分子的基本部分的核苷酸序列组成的多核苷酸分子。
本发明进一步提供包含犬新孢子虫GRA1和MAG1基因启动子之核苷酸序列的多核苷酸分子，所述核苷酸序列示于SEQ ID NO:1中从大约nt127至大约nt703，并包括其互补序列。
本发明进一步提供与本发明任何一种多核苷酸分子能杂交或与具有作为本发明任何一种多核苷酸分子之互补物的核苷酸序列的多核苷酸分子能杂交的寡核苷酸分子。
本发明进一步提供用于克隆和表达本发明任何一种多核苷酸分子的组合物及方法，其中包含重组克隆载体、重组表达载体、包含任何所说的载体的被转化的宿主细胞和由之衍生的新的菌株或细胞系。更具体地说，本发明提供包含具有编码犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白之核苷酸序列的多核苷酸分子的重组载体。在特定的非限制性实施方案中，本发明提供了编码GRA1的质粒pRC77(ATCC209685)、编码GRA2的质粒pRC5(ATCC209686)、编码SAG1的质粒pRC102(ATCC209687)、编码MIC1的质粒pRC340(ATCC209688)和包含MAG1基因序列及MAG1/GRA1双向启动子区域的质粒bd304(ATCC203413)。
本发明进一步提供选自GRA1、GRA2、SAG1、MIC1和MAG1蛋白的基本上已纯化或分离的犬新孢子虫多肽。在一优选的实施方案中，犬新孢子虫GRA1蛋白具有SEQ ID NO:2的氨基酸序列。在另一优选实施方案中，犬新孢子虫GRA2蛋白具有SEQ ID NO:5的氨基酸序列。在另一优选实施方案中，犬新孢子虫SAG1蛋白具有SEQ ID NO:7的氨基酸序列。在另一优选实施方案中，犬新孢子虫MIC1蛋白具有SEQ IDNO:9的氨基酸序列。在另一优选实施方案中，犬新孢子虫MAG1蛋白具有SEQ ID NO:13的氨基酸序列。本发明进一步提供同源于上述任何犬新孢子虫蛋白的基本上已纯化或分离的多肽。本发明进一步提供融合蛋白形式的多肽，所述融合蛋白中上述任一多肽与本领域已知的载体或融合对象融合。本发明进一步提供由上述任何多肽的基本部分组成的多肽。本发明的多肽适用于预防哺乳动物新孢子虫病的疫苗组合物中和用作诊断试剂。
本发明进一步提供制备上述任何多肽的方法，其包括在适于表达多肽的条件下培养用重组表达载体转化的宿主细胞，所说的载体包含含有编码上述任何多肽之核苷酸序列的多核苷酸分子，其中所述核苷酸序列是以可操作方式与一个或多个调节元件连接的；再从细胞培养物中回收所表达的多肽。
本发明进一步提供抗犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白的特异性抗体。
本发明进一步提供可用于突变新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1基因以生产修饰过的新孢子虫细胞的遗传构建体。这种经修饰的新孢子虫细胞可用于疫苗组合物中以保护哺乳动物抗新孢子虫病。在一优选的非限制性实施方案中，本发明的遗传构建体包含一种多核苷酸分子，该多核苷酸分子含有与编码犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白的核苷酸序列本来相同的核苷酸序列、或其基本部分，但还进一步包含可使该基因突变的一个或多个突变，即一或多个核苷酸缺失、插入和/或取代的多核苷酸分子。一旦转化到新孢子虫细胞中之后，该遗传构建体的多核苷酸分子就可例如通过同源重组而特异地导向特定的新孢子虫基因，并缺失或取代该基因或其部分，或插入到该基因中。这一重组过程的结果是该新孢子虫基因发生突变。所产生的突变基因较好是编码部分无效或完全无效的蛋白质，或不能编码蛋白质，因而部分或完全丧失活性。本发明进一步提供已通过一种或多种所说的基因突变得到修饰的新孢子虫细胞，以及使用本发明的遗传构建体制备经修饰的新孢子虫细胞的方法。
本发明进一步提供抗新孢子虫病的疫苗，所说的疫苗包含免疫有效量的本发明的多肽，或免疫有效量的本发明的多核苷酸分子，或免疫有效量的本发明的经修饰的新孢子虫细胞；以及兽医可接受的载体。在一个优选实施方案中，本发明的疫苗包含表达GRA1-、GRA2-、SAG1-、MIC1-或MAG1-表型或这类表型的组合的修饰过的犬新孢子虫活细胞。在一非限制性实施方案中，该疫苗是对抗新孢子病以及可选的一种或多种可危害哺乳动物的其他疾病或病理状态以保护哺乳动物的联合疫苗，该联合疫苗含有免疫有效量的包含本发明的多肽、多核苷酸分子或经修饰的新孢子虫细胞在内的第一成分，免疫有效量的不同于第一成分、并且能够诱导或有助于诱导对抗可给哺乳动物带来痛苦之疾病或病理状况的保护性反应的第二成分，以及兽医可接受的载体。
本发明进一步提供制备抗新孢子虫病的疫苗的方法，该方法包括以适于给哺乳动物施用的方式，将免疫有效量的本发明犬新孢子虫多肽，或免疫有效量的本发明的多核苷酸分子，或免疫有效量的本发明的经修饰的新孢子虫细胞与兽医可接受的载体联合使用。
本发明进一步提供给哺乳动物接种疫苗以对抗新孢子虫病的方法，其包括给哺乳动物施用免疫有效量的本发明的疫苗。
本发明进一步提供可用于接种哺乳动物以对抗新孢子虫病的试剂盒，其包含含有免疫有效量的本发明的多肽、或免疫有效量的本发明的多核苷酸分子、或免疫有效量的本发明的经修饰的新孢子虫细胞的第一容器，和含有兽医可接受的载体或稀释剂的第二容器。
1．多核苷酸分子本发明的分离的多核苷酸分子可具有衍生于新孢子虫任何种或株系的核苷酸序列，但较好是来自致病性新孢子虫如犬新孢子虫。可用来分离或衍生本发明多核苷酸分子的犬新孢子虫株系的一个非限制性例子是株系NC-1，该株系可得自于美国典型培养物保藏中心(ATCC)(12301Parklawn Drive,Rockville,MD 20852,USA)保藏登记号No.CRL-12231的宿主MARC-145猴肾细胞中。Dubey等人(1988，美国兽医医学学会杂志，193:1259-63)也描述了株系NC-1，该出版物在此引入作为参考。或者，也可使用如上述文献中公开的那些标准分离技术从被感染动物的器官、组织或体液中分离出可用于实施本发明的病原性新孢子虫的种或株系。
本文所用的术语“多核苷酸分子”、“多核苷酸序列”、“编码序列”、“开放阅读框(ORF)”等是指单链或双链的DNA和RNA分子，可包含一个或多个原核序列，cDNA序列，包含外显子和内含子的基因组DNA序列，化学合成的DNA和RNA序列，以及有义和相应的反义链。本文使用的术语“ORF”是指编码特定的新孢子虫蛋白质，即GRA1、GRA2、SAG1、MIC1或MAG1蛋白所需的、没有任何干扰性终止密码子的最小核苷酸序列。
生产和操作本文公开的多核苷酸分子及寡核苷酸分子的方法是本领域技术人员已知的，并可按照已描述的重组技术(参见Maniatis等，1989，分子克隆，实验室手册，冷泉港实验室出版社，冷泉港，纽约；Ausubel等，1989，分子生物学当前技术，Greene Publishing Associates&Wiley Interscience,NY；Sambrook等，1989，分子克隆，实验室手册，第2版，冷泉港实验室出版社，冷泉港，纽约；Innis等(编)，1995,PCR策略，Academic Press,Inc.,San Diego；和Erlich(编)，1992,PCR技术，牛津大学出版社，New York)完成。
1.1．GRA1相关性多核苷酸分子除非另外指出，本文下面提到的SEQ ID NO:1和3中所示的核苷酸序列和其基本部分也分别指存在于质粒pRC77(ATCC209685)中的相应核苷酸序列和其基本部分。另外，下文提到的SEQ ID NO:2中所示的氨基酸序列和其基本部分及肽片段，除另外说明者外，也分别指由质粒pRC77(ATCC209685)中相应的编码GRA1的核苷酸序列所编码的相应氨基酸序列，和其基本部分及肽片段。
本发明提供包含编码犬新孢子虫GRA1蛋白的核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，GRA1蛋白具有SEQ ID NO:2的氨基酸序列。在进一步的优选实施方案中，本发明分离的编码GRA1的多核苷酸分子包含选自下列成员的核苷酸序列SEQ ID NO:1中从大约nt205至大约nt777的核苷酸序列，GRA1基因开放阅读框(ORF)的核苷酸序列(在SEQ ID NO:3中给出的从大约nt605至大约nt1304)，及质粒pRC77(ATCC209685)中编码GRA1的ORF的核苷酸序列。在一非限制性实施方案中，本发明分离的编码GRA1的多核苷酸分子包含选自SEQID NO:1和SEQ ID NO:3核苷酸序列的核苷酸序列。SEQ ID NO:3中给出的GRA1基因包含从nt605到nt855和从nt983至nt1304的ORF并带有一个从nt856至nt982的间插内含子。另外，已在mRNA起始位点之5′端150bp内鉴定了与在T.gondii GRA基因中发现的那些相类似的推定的启动子基序(参见下文5.3节)。
本发明进一步提供具有与本发明编码GRA1的多核苷酸分子之核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。术语“同源”当用于表示GRA1相关性多核苷酸分子时，是指具有下述核苷酸序列的多核苷酸分子(a)与本发明上述编码GRA1的多核苷酸分子之一编码相同蛋白质、但根据遗传密码的简并性而在核苷酸序列中包含一个或多个沉默改变的核苷酸序列；或(b)在中度严紧条件下，即在0.5M NaHPO4、7％十二烷基硫酸钠(SDS)、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.2×SSC/0.1％SDS中于42℃洗涤的条件(参见Ausubel等(编)，1989，分子生物学当前技术，第1卷，Green Publishing Associntes,Inc.,and John Wiley&Sons,Inc.,NY,P.2.10.3)下，能与具有编码犬新孢子虫GRA1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物杂交，并可用于实施本发明的核苷酸序列。在一优选实施方案中，该同源多核苷酸分子在高度严紧条件下，即在0.5M NaHPO4、7％SDS、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.1×SSC/0.1％SDS中于68℃洗涤条件(Ausubel等，1989，上述文献)下，与具有编码犬新孢子虫GRA1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明。在更优选的实施方案中，该同源多核苷酸分子在高度严紧条件下与由SEQ ID NO:1的ORF(从大约nt205至大约nt777)或GRA1基因ORF(SEQ ID NO:3中从大约nt605至大约nt1304)之核苷酸序列组成的多核苷酸分子的互补物能杂交，并可用于实施本发明。
本文所说的多核苷酸分子“可用于实施本发明”是指该多核苷酸分子可用于以标准扩增技术扩增新孢子虫特异性多核苷酸分子，或作为诊断试剂用以检测被新孢子虫感染的动物体液或组织样品中新孢子虫特异性多核苷酸的存在。
具有与本发明编码GRA1的多核苷酸分子的核苷酸序列同源的核苷酸序列的本发明多核苷酸分子并不包括具有编码T.gondii GRA蛋白的T.gondii天然核苷酸序列的多核苷酸分子，而且与这种T.gondii多核苷酸分子之间的序列同一性不超过约90％，较好不超过约80％，其中序列同一性是使用BLASTN算法(Gen Bank,National Center for BiotechnologyInformation)确定的。
本发明进一步提供包含编码同源于犬新孢子虫GRA1蛋白之多肽的核苷酸序列的一种分离多核苷酸分子。本文中提到同源于犬新孢子虫GRA1蛋白的多肽时所使用的术语“同源”是指多肽本来具有犬新孢子虫GRA1蛋白的氨基酸序列，但其中一个或多个氨基酸残基已被不同的氨基酸残基保守地取代，并且所得到的多肽可用于实施本发明。保守氨基酸取代是本领域已知的。造成这样的取代的规则包含由Dayhof,M.D.(1978，国家生物医学研究基金，Washington,D.C.，第5卷，增刊3)等所述的取代规则。更具体地说，保守氨基酸取代发生在与其酸性、极性或侧链大小相关联的氨基酸家族内。一般可将遗传编码的氨基酸分为四组(1)酸性氨基酸=天冬氨酸、谷氨酸；(2)碱性氨基酸=赖氨酸、精氨酸、组氨酸；(3)非极性氨基酸=丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸；(4)不带电的极性氨基酸=甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸。苯丙氨酸、色氨酸和酪氨酸也共同分类为芳香氨基酸。任何特定组内的一个或多个取代，例如用异亮氨酸或缬氨酸取代亮氨酸、或用谷氨酸取代天冬氨酸、或用丝氨酸取代苏氨酸，或任何其他氨基酸残基结构上相关的氨基酸残基，例如有相似酸性、极性、侧链大小的，或在其某些组合方面有相似性的氨基酸残基取代，一般对多肽的功能或免疫原性不会有太大影响。
本文中所说的多肽“可用于实施本发明”是指该多肽可用作诊断试剂以检测新近被新孢子虫感染的、或已被新孢子虫感染的动物血液或血清样品中新孢子虫特异性抗体的存在。
本发明进一步提供由本发明的上述任何新孢子虫GRA1相关性多核苷酸分子的基本部分组成的多核苷酸分子。GRA1相关性多核苷酸分子的“基本部分”在本文中是指组成上小于GRA1相关性多核苷酸分子的完整核苷酸序列，但包含GRA1相关性多核苷酸分子之核苷酸序列的至少约5％，较好至少约10％，并可用于实施本发明的多核苷酸分子。
除了上文提到的任何GRA1相关性多核苷酸分子的核苷酸序列之外，本发明的多核苷酸分子还可进一步包含，或者说可由选自下列者的核苷酸序列组成天然原位侧接于犬新孢子虫中GRA1 ORF或基因并包含SEQ ID NO:1中所示从大约nt1至大约nt204和从大约nt778至大约nt1265、或如SEQ ID NO:3中所示从大约nt1至大约nt604和从大约nt1305至大约nt1774的核苷酸序列的核苷酸序列，或其基本部分。
1.2 GRA2相关性多核苷酸分子下文提到的SEQ ID NO:4的核苷酸序列和其基本部分，除特别说明外，还分别指如质粒pRC5(ATCC209686)中给出的相应核苷酸序列和其基本部分。此外，除非另外指出，本文下面提到的SEQ ID NO:5中所示的氨基酸序列及其基本部分和肽片段，还分别指由存在于质粒pRC5(ATCC209686)中相应的编码GRA2的核苷酸序列所编码的相应氨基酸序列及其基本部分和肽片段。
本发明进一步提供包含编码犬新孢子虫GRA2蛋白之核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，GRA2蛋白具有SEQ IDNO:5的氨基酸序列。在进一步优选的实施方案中，本发明分离的编码GRA2的多核苷酸分子包含选自下列一组中的核苷酸序列从大约nt25至大约nt660的SEQ ID NO:4之ORF的核苷酸序列，和质粒pRC5(ATCC209686)中编码GRA2的ORF的核苷酸序列。在一个非限制性实施方案中，本发明分离的编码GRA2的多核苷酸分子包含SEQ IDNO:4的核苷酸序列。
本发明进一步提供具有与本发明编码GRA2的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离多核苷酸分子。术语“同源”当用于表示GRA2相关性多核苷酸分子时，是指具有下述核苷酸序列的多核苷酸分子(a)与本发明上述编码GRA2的多核苷酸分子之一编码相同样蛋白质、但根据遗传密码的简并性而包含一个或多个沉默改变的核苷酸序列；或(b)在中度严紧条件下，即在0.5M NaHPO4、7％十二烷基硫酸钠(SDS)、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.2×SSC/0.1％SDS中于42℃洗涤的条件(参见Ausubel等，1989，出处同前)下，与具有编码犬新孢子虫GRA2蛋白之氨基酸序列的核苷酸序列的多核苷酸分子之互补物能杂交、并可用于实施本发明的核苷酸序列。在一优选实施方案中，该同源多核苷酸分子在高度严紧条件下，即在0.5MNaHPO4、7％SDS、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.1×SSC/0.1％SDS中于68℃洗涤条件(Ausubel等，1989，上述文献)下，与具有编码犬新孢子虫GRA2蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明。在更优选的实施方案中，该同源多核苷酸分子在高度严紧条件下与由SEQ ID NO:4中ORF的核苷酸序列(从大约nt25至大约nt660)组成的多核苷酸分子的互补物能杂交，并可用于实施本发明。
具有与本发明编码GRA2的多核苷酸分子的核苷酸序列同源的核苷酸序列的本发明多核苷酸分子并不包括具有编码T.gondii GRA蛋白的T.gondii天然核苷酸序列的多核苷酸分子，并且与这种T.gondii多核苷酸分子之间的序列同一性不超过约90％，较好不超过约80％，其中序列同一性是使用BLASTN算法(GenBank,NCBI)确定的。
本发明进一步提供包含编码同源于犬新孢子虫GRA2蛋白之多肽的核苷酸序列的一种分离多核苷酸分子。本文中提到同源于犬新孢子虫GRA2蛋白的多肽时所使用的术语“同源于”是指多肽本来具有犬新孢子虫GRA2蛋白的氨基酸序列，但其中一个或多个氨基酸残基已被不同的氨基酸残基保守地取代(如上定义)，其中所得到的多肽可用于实施本发明(其中术语“可用于”具有上文就多肽所限定的含义)。
本发明进一步提供由本发明上述任何新孢子虫GRA2相关性多核苷酸分子的基本部分组成的多核苷酸分子。GRA2相关性多核苷酸分子的“基本部分”在本文中是指组成上小于GRA2相关性多核苷酸分子的完整核苷酸序列、但包含GRA2相关性多核苷酸分子的核苷酸序列的至少约5％，较好至少约10％、并可用于实施本发明的多核苷酸分子(其中术语“可用于”具有上文就多核苷酸分子所限定的含义)。
除了上文提到的任何GRA2相关性多核苷酸分子的核苷酸序列之外，本发明的多核苷酸分子还可进一步包含，或者说可由选自下列者的核苷酸序列组成天然原位侧接于犬新孢子虫中GRA2 ORF或基因并包含SEQ ID NO:4中所示从大约nt1至大约nt24和从大约nt661至大约nt1031的侧翼核苷酸序列的核苷酸序列，或其基本部分。
1.3 SAG-1相关性多核苷酸分子除非另外指出，本文下面提到的SEQ ID NO:6中所示的核苷酸序列和其基本部分也分别指存在于质粒pRC102(ATCC209687)中的相应核苷酸序列和其基本部分。另外，下文提到的SEQ ID NO:7中所示的氨基酸序列和其基本部分及肽片段，除另外说明者外，也分别指由质粒pRC102(ATCC209687)中相应的编码SAG1的核苷酸序列所编码的相应氨基酸序列，和其基本部分及肽片段。
本发明进一步提供包含编码犬新孢子虫SAG1蛋白之核苷酸序列的一种分离多核苷酸分子。在一优选实施方案中，SAG1蛋白具有SEQ IDNO:7的氨基酸序列。在进一步优选的实施方案中，本发明分离的编码SAG1的多核苷酸分子包含选自下列成员的核苷酸序列SEQ ID NO:6中从大约nt130至大约nt1089的ORF的核苷酸序列，和质粒pRC102(ATCC209687)中编码SAG1的ORF的核苷酸序列。在一非限制性实施方案中，本发明分离的编码SAG1的多核苷酸分子包含SEQ IDNO:6的核苷酸序列。
本发明进一步提供具有与本发明编码SAG1的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离多核苷酸分子。术语“同源”当用于表示SAG1相关性多核苷酸分子时，是指具有下述核苷酸序列的多核苷酸分子(a)与本发明上述编码SAG1的多核苷酸分子之一编码相同蛋白质、但根据遗传密码的简并性而包含一个或多个沉默改变的核苷酸序列；或(b)在中度严紧条件下，即在0.5M NaHPO4、7％十二烷基硫酸钠(SDS)、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.2×SSC/0.1％SDS中于42℃洗涤的条件(参见Ausubel等，1989，出处同前)下，与具有编码犬新孢子虫SAG1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明的核苷酸序列(“可用于”具有上文就多核苷酸分子所限定的含义)。在一优选实施方案中，该同源多核苷酸分子在高度严紧条件下，即在0.5M NaHPO4、7％SDS、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.1×SSC/0.1％SDS中于68℃洗涤的条件(Ausubel等，1989，上述文献)下，与具有编码犬新孢子虫SAG1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明。在更优选的实施方案中，该同源多核苷酸分子在高度严紧条件下与由SEQ ID NO:6之ORF的核苷酸序列(从大约nt130至大约nt1089)组成的多核苷酸分子的互补物能杂交，并可用于实施本发明。
具有与本发明编码SAG1的多核苷酸分子的核苷酸序列同源的核苷酸序列的本发明多核苷酸分子并不包括具有编码T.gondii SAG1蛋白的T.gondii天然核苷酸序列的多核苷酸分子，而且与这种T.gondii多核苷酸分子之间的序列同一性不超过约90％，较好不超过约80％，其中序列同一性是使用BLASTN算法(GenBank,NCBI)确定的。
本发明进一步提供包含编码同源于犬新孢子虫SAG1蛋白之多肽的核苷酸序列的一种分离的多核苷酸分子。本文中提到同源于犬新孢子虫SAG1蛋白的多肽时所使用的术语“同源”是指多肽本来具有犬新孢子虫SAG1蛋白的氨基酸序列，但其中一个或多个氨基酸残基已被不同的氨基酸残基保守地取代(如上述定义)，其中所得到的多肽可用于实施本发明(其中术语“可用于”具有上文就多肽所限定的含义)。
本发明进一步提供由本发明上述任何新孢子虫SAG1相关性多核苷酸分子的基本部分组成的多核苷酸分子。SAG1相关性多核苷酸分子的“基本部分”在本文中是指组成上小于SAG1相关性多核苷酸分子的完整核苷酸序列、但包含SAG1相关性多核苷酸分子的核苷酸序列的至少约5％，较好至少约10％、并可用于实施本发明的多核苷酸分子(其中术语“可用于”具有上文就多核苷酸分子所限定的含义)。
除了上文提到的任何SAG1相关性多核苷酸分子的核苷酸序列之外，本发明的多核苷酸分子还可进一步包含，或者说可由选自下列者的核苷酸序列组成天然原位侧接于犬新孢子虫中SAG1 ORF或基因、并包含SEQ ID NO:6中所示从大约nt1至大约nt129和从大约nt1090至大约nt1263的侧翼核苷酸序列的核苷酸序列，或其基本部分。
1.4 MIC1相关性多核苷酸分子除非另外指出，本文下面提到的SEQ ID NO:8和10中所示的核苷酸序列和其基本部分也分别指存在于质粒pRC340(ATCC209688)中的相应核苷酸序列和其基本部分。另外，下文提到的SEQ ID NO:9中所示的氨基酸序列和其基本部分及肽片段，除另外说明者外，也分别指由质粒pRC340(ATCC209688)中相应的编码MIC1的核苷酸序列编码的相应氨基酸序列，和其基本部分及肽片段。
本发明进一步提供包含编码犬新孢子虫MIC1蛋白的核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，MIC1蛋白具有SEQ IDNO:9的氨基酸序列。在进一步优选的实施方案中，本发明分离的编码MIC1的多核苷酸分子包含选自下列成员的核苷酸序列SEQ ID NO:8中从大约nt138至大约nt1520之ORF的核苷酸序列，SEQ ID NO:10给出的MIC1基因之ORF的核苷酸序列，及质粒pRC340(ATCC209688)中编码MIC1之ORF的核苷酸序列的核苷酸序列。在一非限制性实施方案中，本发明分离的编码MIC1的多核苷酸分子包含选自SEQ ID NO:8和SEQ ID NO:10之核苷酸序列的核苷酸序列。
本发明进一步提供具有与本发明编码MIC1的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离多核苷酸分子。术语“同源”当用于表示MIC1相关性多核苷酸分子时，是指具有下述核苷酸序列的多核苷酸分子(a)与本发明上述编码MIC1的多核苷酸分子之一编码相同蛋白质、但根据遗传密码的简并性而包含一个或多个沉默改变的核苷酸序列；或(b)在中度严紧条件下，即在0.5M NaHPO4、7％十二烷基硫酸钠(SDS)、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.2×SSC/0.1％SDS中于42℃洗涤的条件(Ausubel等，1989，出处同前)下，与具有编码犬新孢子虫MIC1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明的核苷酸序列(“可用于”具有上文就多核苷酸分子所限定的含义)。在一优选实施方案中，该同源多核苷酸分子在高度严紧条件下，即在0.5M NaHPO4、7％SDS、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.1×SSC/0.1％SDS中于68℃洗涤的条件(Ausubel等，1989，上述文献)下，与具有编码犬新孢子虫MIC1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明。在更优选的实施方案中，该同源多核苷酸分子在高度严紧条件下与由SEQ ID NO:8中从大约nt138至大约nt1520的ORF或SEQ ID NO:10所给出的MIC1基因ORF的核苷酸序列组成的多核苷酸分子的互补物能杂交，并可用于实施本发明。
具有与本发明编码MIC1的多核苷酸分子的核苷酸序列同源的核苷酸序列的本发明多核苷酸分子并不包括具有编码T.gondii MIC1蛋白的T.gondii天然核苷酸序列的多核苷酸分子，而且与这种T.gondii多核苷酸分子之间的序列同一性不超过约90％，较好不超过约80％，其中序列同一性是使用BLASTN算法(GenBank,NCBI)确定的。
本发明进一步提供包含编码同源于犬新孢子虫MIC1蛋白的多肽之核苷酸序列的一种分离的多核苷酸分子。本文中提到同源于犬新孢子虫MIC1蛋白的多肽时所使用的术语“同源”是指多肽本来具有犬新孢子虫MIC1蛋白的氨基酸序列，但其中一个或多个氨基酸残基已被不同的氨基酸残基保守地取代(如上述定义)，其中所得到的多肽可用于实施本发明(其中术语“可用于”具有上文就多肽所限定的含义)。
本发明进一步提供由本发明的上述任何新孢子虫MIC1相关性多核苷酸分子的基本部分组成的多核苷酸分子。MIC1相关性多核苷酸分子的“基本部分”在本文中是指组成上小于MIC1相关性多核苷酸分子的完整核苷酸序列，但包含MIC1相关性多核苷酸分子的核苷酸序列的至少约5％，较好至少约10％，并可用于实施本发明的多核苷酸分子。
除了上文提到的任何MCI相关性多核苷酸分子的核苷酸序列外，本发明的多核苷酸分子还可进一步包含，或者说可由选自下列者的核苷酸序列组成天然原位侧接于犬新孢子虫中MIC1 ORF或基因、并包含SEQID NO:8中所示从大约nt1至大约nt137和从大约nt1521至大约nt2069的核苷酸序列的核苷酸序列，或其基本部分。
1.5．MAG1相关性多核苷酸分子除非另外指出，本文下面提到的SEQ ID NO:11中所示核苷酸序列和其基本部分也分别指质粒bd304(ATCC203413)中给出的相应核苷酸序列和其基本部分。另外，除非特别指出，下文提到的SEQ ID NO:13中所示的氨基酸序列和其基本部分及肽片段，也分别是指由质粒bd304(ATCC203413)中相应的编码MAG1的核苷酸序列所编码的相应氨基酸序列，和其基本部分及肽片段。
本发明进一步提供包含编码犬新孢子虫MAG1蛋白的核苷酸序列的一种分离的多核苷酸分子。在一优选实施方案中，MAG1蛋白具有SEQID NO:13的氨基酸序列。在进一步优选的实施方案中，本发明分离的编码MAG1的多核苷酸分子包含选自下列成员的核苷酸序列SEQ IDNO:11中给出的从大约nt1305至大约nt2786的核苷酸序列，由之制备的cDNA分子(如具有从大约nt122至大约nt1381的SEQ ID NO:12之ORF的cDNA分子)，和质粒bd304(ATCC203413)中编码MAG1的ORF的核苷酸序列。本发明进一步提供具有SEQ ID NO:11中任何ORF的核苷酸序列的多核苷酸分子。在一非限制性实施方案中，本发明分离的编码MAG1的多核苷酸分子包含选自下列者的核苷酸序列SEO ID NO:11的核苷酸序列，基于推定的外显子/内含子边缘而由之推测的cDNA的核苷酸序列。
本发明进一步提供具有与本发明编码MAG1的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。术语“同源”当用于表示MAG1相关性多核苷酸分子时，是指具有下述核苷酸序列的多核苷酸分子(a)与本发明上述编码MAG1的多核苷酸分子编码相同蛋白质、但根据遗传密码的简并性而包含一个或多个沉默改变的核苷酸序列；或(b)在中度严紧条件下，即在0.5M NaHPO4、7％十二烷基硫酸钠(SDS)、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.2×SSC/0.1％SDS中于42℃洗涤的条件(参见Ausubel等，1989，出处同前)下，与具有编码犬新孢子虫MAG1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明的核苷酸序列(“可用于”具有上语言不多核苷酸分子所限定的含义)。在一优选实施方案中该同源多核苷酸分子在高度严紧条件下，即在0.5M NaHPO4、7％SDS、1mM EDTA中于65℃与结合于滤膜的DNA杂交，并在0.1×SSC/0.1％SDS中于68℃洗涤的条件(Ausubel等，1989，上述文献)下，与具有编码犬新孢子虫MAG1蛋白之氨基酸序列的核苷酸序列的多核苷酸分子的互补物能杂交，并可用于实施本发明。在更优选的实施方案中，该同源多核苷酸分子在高度严紧条件下与由选自SEQ ID NO:11中从大约nt1305至大约nt2786的MAG1基因之ORF的核苷酸序列或基于推断的外显子/内含子边缘而由之制备的cDNA分子(例如具有从大约nt122至大约nt1381的SEQ ID NO:12之ORF的cDNA分子)的互补物能杂交，并可用于实施本发明。
具有与本发明编码MAG1的多核苷酸分子的核苷酸序列同源的核苷酸序列的本发明多核苷酸分子并不包括具有编码T.gondii MAG1蛋白的T.gondii天然核苷酸序列的多核苷酸分子，而且与T.gondii多核苷酸分子之间的序列同一性不超过约90％，较好不超过约80％，其中序列同一性是使用BLASTN算法(GenBank,NCBI)确定的。
本发明进一步提供包含编码同源于犬新孢子虫MAG1蛋白之多肽的核苷酸序列的一种分离的多核苷酸分子。本文中提到同源于犬新孢子虫MAG1蛋白的多肽时所使用的术语“同源”是指多肽本来具有犬新孢子虫MAG1蛋白的氨基酸序列，但其中一个或多个氨基酸残基已被不同的氨基酸残基保守地取代(如上述定义)，其中所得到的多肽可用于实施本发明(“可用于”具有上文就多肽所限定的含义)。
本发明进一步提供由本发明的上述任何新孢子虫MAG1相关性多核苷酸分子的基本部分组成的多核苷酸分子。MAG1相关性多核苷酸分子的“基本部分”在本文中是指组成上小于MAG1相关性多核苷酸分子的完整核苷酸序列，但包含MAG1相关性多核苷酸分子的核苷酸序列的至少约5％，较好至少约10％，并可用于实施本发明的多核苷酸分子(术语“可用于”具有上文就多核苷酸分子所限定的含义)。例如，SEQ ID NO:11所示多核苷酸分子的基本部分可包含从大约nt704至大约nt820的推测的外显子1，或从大约nt1301至大约nt1399的推定的外显子2，或从大约nt1510至大约nt1808的推测的外显子3，或从大约nt1921至大约nt3297的推测的外显子4。
除了上文提到的任何MAG1相关性多核苷酸分子的核苷酸序列之外，本发明的多核苷酸分子还可进一步包含，或者说可由选自下列者的核苷酸序列组成天然侧接于犬新孢子虫原位MAG1基因或ORF、并且包括如SEQ ID NO:11中所示从大约nt1至大约nt1304和从大约nt2787至大约nt4242的核苷酸序列的核苷酸序列，或天然侧接于基于推测的外显子/内含子边缘而由之制备的cDNA分子的ORF，并包括具有SEQ ID NO:12中ORF的cDNA分子ORF的侧翼序列(从大约nt1至大约121和从大约nt1382至大约nt1892)的核苷酸序列，或其基本部分。
2．Gra1/Mag1启动子区域本发明进一步提供包含犬新孢子虫GRA1和MAG1基因启动子之核苷酸序列的多核苷酸分子。在进行本文公开的实验工作期间，确定了本文公开的犬新孢子虫GRA1和MAG1基因在原位是以头-头方向天然排列的，它们之间有一长度约577nt的间插核苷酸序列。如SEQ ID NO:11中所示从nt127至nt703的该间插核苷酸序列代表包含犬新孢子虫GRA1和MAG1基因二者的启动子在内的假定的双向启动子区。
本发明的GRA1/MAG1双向启动子区可用于多种目的，包括在犬新孢子虫宿主细胞中，或在任何其他种的新孢子虫或Apicomplexa其他成员的宿主细胞中，或其他任何适当的宿主细胞中控制GRA1或MAG1基因，或这两种基因，或者一种或多种其他基因或编码序列的重组表达。这种其他基因或编码序列可以是重组宿主细胞固有的或异源的。可以使用本领域已知的标准重组技术，将该启动子序列融合到特定基因或编码序列上，以使该启动子序列以可操作方式与之连接(“可操作的连接”的定义见下文)。可利用该启动子构建重组表达系统，并用以筛选可调节新孢子虫或Apicomlexa其他成员的GRA1和MAG1基因表达的化合物和转录因子。此外，可使用这样的启动子构建体在新孢子虫或Apicomplexa的其他成员中表达异源多肽。
3．寡核苷酸分子本发明进一步提供与本发明上述任何一种多核苷酸分子能杂交，或与具有作为本发明上述任一多核苷酸分子之互补物的核苷酸序列的多核苷酸分子能杂交的多核苷酸分子。这样的寡核苷酸分子较好是至少长约10nt，更好是长约15至约30nt，并可在高度严紧条件下与一种或多种上述多核苷酸分子杂交。所说的高度严紧条件是在6×SSC/0.5％焦磷酸钠中洗膜，并且洗膜温度对于长约14碱基者，为大约37℃，长约17碱基者为大约48℃，长约20碱基者为大约55℃，长约23碱基者为大约60℃。本发明的较长寡核苷酸分子的其他杂交条件可由本领域技术人员按照标准技术来确定。在一优选实施方案中，本发明的寡核苷酸分子互补于本发明上述多核苷酸分子至少之一的一部分。
可用于实施本发明的寡核苷酸分子的非限制性特定实例包括选自SEQ ID NO:14-26和28-34的寡核苷酸分子，及其互补物。
本发明的寡核苷酸分子可用于多种目的，其中包括作为扩增新孢子虫特异性多核苷酸分子的引物以用于诸如疾病鉴别诊断，或者编码或用作基因调节的反义分子。就诊断方面来说，可使用适当设计的引物检测动物组织或体液，如脑组织、肺组织、胎盘组织、血液、脑脊液、粘液、尿液、羊水等样品中新孢子虫特异性多核苷酸分子的存在。特异性扩增产物的产生可支持新孢子虫感染的诊断，而缺少扩增的产物则可能指示没有感染。例如Innis等人(1995，出处同前)和Erlicch(1992，出处同前)编辑的前述文献中描述了进行扩增的方法，例如聚合酶链反应(PCR)方法。本领域已知的其他扩增技术也可使用，例如连接酶链反应法。也可使用本文公开的多核苷酸分子的序列设计用于从新孢子虫的其他种或株系中，或者从Apicomplexa的其他成员中分离同源基因的引物。
4．重组表达系统4.1克隆和表达载体本发明进一步提供可用于克隆和表达本发明任何一种多核苷酸分子的组合物，包括克隆载体、表达载体、包含任何所说的载体的被转化宿主细胞，以及由其衍生的新的株系或细胞系。在一优选实施方案中，本发明提供包含一种多核苷酸分子的重组载体，所说多核苷酸分子具有编码犬新孢子虫之GRA1、GRA2、SAG1、MIC1或MAG1蛋白的核苷酸序列。在特定的但非限制性的实施方案中，本发明提供了编码犬新孢子虫GRA1蛋白的质粒pRC77(ATCC209685)、编码犬新孢子虫GRA2蛋白的质粒pRC5(ATCC209686)、编码犬新孢子虫SAG1蛋白的质粒pRC102(ATCC209687)、编码犬新孢子虫MIC1蛋白的质粒pRC340(ATCC209688)、编码犬新孢子虫MAG1蛋白的质粒bd304(ATCC203413)，并且诸质粒还包含上述的双向启动子区域。
优选地，本发明的重组载体，特别是表达载体的构建方式能使得本发明多核苷酸分子的编码序列与转录和翻译编码序列所需的一个或多个调节元件可操作性地连接，以产生多肽。本文中使用的术语“调节元件”包括但不只限于编码诱导型和非诱导型启动子、增强子、操纵子及本领域已知的可用于驱动和/或调节多核苷酸编码序列表达的其它元件的核苷酸序列。另外，本文所说的编码序列与一个或多个调节元件“可操作性地连接”是指调节元件可有效地调节并允许转录编码序列或翻译其mRNA，或发挥两方面的功能。
构建包含与适当的调节元件可操作性地连接的特定编码序列的重组载体的方法是已知的，并可使用这些方法实现本发明。这些方法包括体外重组技术、合成技术和体内遗传重组(如参见Maniatis等人(1989),Ausubel等人(1989)、Sambrook等人(1989),Innis等人(1989)和Erlich(1992)的上述文献)。
可用于表达本发明的GRA1、GRA2、SAG1、MIC1和MAG1编码序列的各种表达载体是本领域已知的，其中包括含有特定编码序列的重组噬菌体DNA、质粒DNA和粘粒DNA表达载体。可经加工而含有本发明的多核苷酸分子的典型原核表达载体质粒包括pUC8、pUC9、pBR322和pBR329(Biorad Laboratories,Richmond,CA)、pPL和pKK223(Pharmacia,Piscataway,NJ)、pQE50(Qiagen,Chatsworth,CA)和pGEM-T EASY(Promega,Madison,WI)等。可经加工而含有本发明的多核苷酸分子的典型真核表达载体包括蜕皮激素诱导型哺乳动物表达系统(Invitrogen,Carlsbad,CA)、基于巨细胞病毒启动子-增强子的系统(Promega,Madison,WI；Stratagene,La Jolla,CA；Invitrogen)，和基于杆状病毒的表达系统(Promega)等。
这些和其他载体的调节元件可在其强度和特异性方面各不相同。基于所利用的宿主/载体系统，可以使用多种适当的转录和翻译元件中的任一种。例如，当在哺乳动物细胞系统中克隆时，可使用从哺乳动物细胞基因组中分离的启动子，如小鼠金属硫蛋白启动子，或从生长于这些细胞内的病毒中分离的启动子，如痘苗病毒7.5K启动子或莫洛尼鼠类肉瘤病毒长末端重复序列。可使用以重组DNA或合成技术得到的启动子以转录被插入的序列。另外，在特定诱导子，例如适于金属硫蛋白启动子的锌和镉离子的存在下，由某些启动子启动的表达可以被增强。转录调节区或启动子的非限制性例子包括用于细菌的β-gal启动子、T7启动子、TAC启动子、λ左向和右向启动子、trp和lac启动子、trp-lac融合启动子等；用于酵母的糖酵解酶启动子，如ADH-和ADH-Ⅱ启动子、GPK启动子、PGI启动子、TRP启动子等；以及用于哺乳动物细胞的SV40早期和晚期启动子、腺病毒主要晚期启动子等。本发明进一步提供包含犬新孢子虫GRA1和MAG1基因之启动子的核苷酸序列的多核苷酸分子，其可用于在新孢子虫或Apicomplexa的其他成员中表达本发明的任何编码序列。
为足够地翻译被插入的编码序列，还需要特异性起始信号。这些信号一般包括ATG起始密码子及相邻序列。在将包含其自身的起始密码子和相邻序列的本发明的多核苷酸分子插入到适当的表达载体中的情况下，可能不必加入另外的翻译控制信号。然而，当只插入一部分编码序列时，可能需要包括ATG起始密码子等的外源翻译控制信号。可从各种来源，即天然和合成来源，得到这些外源翻译控制信号和起始密码子。再者，起始密码子必须与编码区的读框一致，以确保整个插入片段符合读框地翻译。
也可构建将表达包含本发明蛋白质或多肽的融合蛋白质的表达载体。这样的融合蛋白质例如可用于产生抗新孢子虫蛋白的抗血清、研究新孢子虫蛋白的生化性质、工程化修饰表现有不同免疫学或功能性质的新孢子虫蛋白、帮助鉴定或纯化重组表达的新孢子虫蛋白或改善其稳定性。可能的融合蛋白表达载体包括但不只限于插入了编码β半乳糖苷酶和trpE融合体、麦芽糖结合蛋白融合体、谷胱甘肽-S-转移酶融合体及多组氨酸融合体(载体区域)之序列的载体。可用于构建编码这些和其他融合蛋白的表达载体的方法是本领域已知的。
可用融合蛋白质帮助纯化已表达的蛋白质。在一非限制性实施方案中，可使用直链淀粉树脂纯化GRA 1-麦芽糖结合性融合蛋白，可使用谷胱甘肽琼脂糖小球纯化GRA 1-谷胱甘肽-S-转移酶融合蛋白质，可使用二价镍树脂纯化GRA1-多组氨酸融合蛋白质。或者，也可使用抗载体蛋白质或肽的抗体对融合蛋白质进行亲和层析纯化。例如，可将编码单克隆抗体之靶表位的核苷酸序列工程化转移到与调节元件可操作性地连接的表达载体中，并限定其位置以使所表达的表位融合到本发明的新孢子虫蛋白上。在一非限制性实施方案中，可用标准技术在相当于GRA1蛋白之氨基或羧基末端的某个点上插入编码FLAGTM表位标记(其为亲水性标记肽)(Znternational Biotechnologies Inc.)的核苷酸序列中，然后可使用市售的抗FLAGTM抗体检测并亲和纯化所表达的GRA1蛋白-FLAGTM表位融合体产物。
也可以修饰表达载体使之含有编码特定蛋白酶切割位点的多接头序列，从而可经特定蛋白酶处理而从载体区域或融合对象释放出已表达的新孢子虫蛋白。例如，融合蛋白载体可包含编码凝血酶或因子Xa裂解位点的核苷酸序列。
可使用已知方法将位于新孢子虫蛋白编码序列上游且读框一致的信号序列加工到表达载体中，以指导所表达之蛋白质的运输和分泌。信号序列的非限制性实例包括α因子、免疫球蛋白、外膜蛋白质、青霉素酶及T细胞受体等的信号序列。
为了有助于筛选出经本发明重组载体转化或转染的宿主细胞，可以工程化修饰载体使之进一步包含报道基因产物或其他选择标志的编码序列。这样的编码序列较好是与上述调节元件可操作性地连接的。用于实施本发明的报道基因是本领域熟知的，包括编码氯霉素乙酰转移酶(CAT)、绿色荧光蛋白、荧火虫荧光素酶和人生长激素等的基因。编码选择标志的核苷酸序列是本领域已知的，包括编码赋予抗生素抗性或抗代谢物抗性，或提供营养缺陷型需要等的基因产物的那些核苷酸序列。这些序列的例子包括编码胸苷激酶活性，或抗氨甲喋呤、氨苄青霉素、卡那霉素、氯霉素、zeocin、嘧啶甲胺、氨基糖苷或潮霉素等的那些序列。
4.2．宿主细胞转化本发明进一步提供包含本发明的多核苷酸分子或重组载体的已转化的宿主细胞，以及由之衍生的细胞系。可用于实施本发明的宿主细胞可以是真核或原核细胞。这样的已转化宿主细胞包括但不只限于微生物，例如用重组噬菌体DNA、质粒DNA或粘粒DNA载体转化的细菌，或者用重组载体转化的酵母，或者是动物细胞，如用重组病毒载体如杆状病毒感染的昆虫细胞，或用重组病毒载体如腺病毒或痘苗病毒感染的哺乳动物细胞等。例如，可使用大肠杆菌菌株，如可得自ATCC(Rockville,MD,USA)(登记号No.31343)或Stratagene(La Jolla,CA)的DH5α菌株。真核宿主细胞包括酵母细胞，但也可有效地利用小鼠、仓鼠、牛、猴或人细胞系等哺乳动物细胞。可用于表达本发明的重组蛋白质的真核宿主细胞包括中国仓鼠卵巢(CHO)细胞(例如ATCC登记号No.CCL-61),NIHSwiss小鼠胚胎细胞NIH/3T3(例如ATCC登记号No.CRL-1658)，和Madin-Darby牛肾(MDBK)细胞(ATCC登记号No.CCL-22)。
较好是将本发明的重组载体转化或转染到细胞的基本均质培养物的一个或多个宿主细胞中。一般可按照已知技术，例如原生质体转化、磷酸钙沉淀、氯化钙处理、微量注射、电穿孔、经与重组的病毒接触进行感染、脂质体介导的转染、DEAE-葡聚糖转染、转导、接合或微粒轰击等技术将载体导入宿主细胞内。可使用标准方法选择转化体，例如通过选择表达与重组表达载体相关的可选择标志如抗生素抗性的细胞的方法。
一旦将表达载体导入宿主细胞后，即可使用Southern杂交分析、限制性酶切分析、包括反转录酶PCR(rt-PCR)的PCR分析等标准技术证实本发明的多核苷酸分子是否整合并保留在宿主细胞基因组中或以附加体形式存在，或者用免疫学检测法检测预期的蛋白质产物。可用本领域已知的至少下列四种一般性方法中的一种鉴定含有和/或表达本发明的多核苷酸分子的宿主细胞(ⅰ)DNA-DNA、DNA-RNA、或RNA-反义RNA杂交；(ⅱ)检测“标志”基因功能的存在；(ⅲ)检测特异性mRNA转录本在宿主细胞中的表达，以估计转录水平；或(ⅳ)以本领域已知的免疫检测法检测成熟多肽产物的存在。
4.3．重组多肽的表达和纯化一旦已将本发明的多核苷酸分子稳定导入到适当的宿主细胞中之后，即可克隆增殖已转化的宿主细胞，并在有助于最大量产生所编码的多肽的条件下培养所得到的细胞。这样的条件一般包括培养已转化的细胞达到高密度。当表达载体含有诱导型启动子时，可根据需要，利用温度改变、营养素耗尽、加入义务诱导剂(如糖类类似物，例如异丙基β-D-硫代半乳糖苷(IPTG)、过量代谢付产物积聚等适当诱导条件以诱导表达。
当多肽保留在宿主细胞内时，应收获并裂解细胞，并在本领域已知的尽可能减少蛋白质降解的提取条件下，例如于4℃和/或有蛋白酶抑制剂存在条件下，从裂解物中基本上纯化或分离产物。如多肽能从宿主细胞中分泌出来，则可简单地收集已耗竭的营养素培养基，并从中基本上纯化或分离多肽。
必要时，可使用标准方法，包括但不只限于硫酸铵沉淀，大小分级分离、离子交换层析、HPLC、密度梯度离心及亲和层析法，从细胞裂解物或培养基中基本上纯化或分离多肽。如果多肽缺乏生物学活性，则可作根据分子大小、或与多肽特异性抗体的反应性，或根据融合体标记的存在检测之。用于实施本发明时，多肽可以是已分泌到培养液中或存在于细胞裂解物中的未纯化状态，但较好是已从中得到基本纯化或分离。本文中所说的多肽“基本上已纯化”，是指该多肽构成特定制剂中蛋白质的至少约20％(重量)。另外，本文中所说的多肽“已分离”，指的是该多肽构成特定制剂中蛋白质的至少约80％(重量)。
因此，本发明提供由本发明的多核苷酸编码的基本上已纯化或分离的多肽。在一非限制性实施方案中，该多肽是选自GRA1、GRA2、SAG1、MIC1和MAG1蛋白的犬新孢子虫蛋白。在另一优选实施方案中，犬新孢子虫GRA1蛋白具有SEQ ID NO:2的氨基酸序列。在一优选实施方案中，犬新孢子虫GRA2蛋白具有SEQ ID NO:5的氨基酸序列。在另一优选实施方案中，犬新孢子虫SAG1蛋白具有SEQ ID NO:7的氨基酸序列。在另一优选实施方案中，犬新孢子虫MIC1蛋白具有SEQ IDNO:9的氨基酸序列。在另一优选实施方案中，犬新孢子虫MAG1蛋白具有SEQ ID NO:13的氨基酸序列。
本发明进一步提供同源于上述任何一种犬新孢子虫蛋白的多肽，其中术语“同源”具有上文就多肽所限定的含义。本发明的与上述犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白任何一种同源的多肽并不包括具有T.gondii GRA、SAG、MIC或MAG蛋白所固有的氨基酸序列的多肽，而且与这样的T.gondii多肽之间的氨基酸序列同一性不超过大约90％，较好不超过大约80％，其中序列同一性是使用BLASTP算法(GenBank,NCBI)确定的。
本发明进一步提供由本发明任何一种上述多肽的基本部分组成的多肽。本文使用的术语-本发明多肽的“基本部分”或“肽片段”意指组成上小于相应全长度多肽之完整氨基酸序列、但包含其氨基酸序列的至少约10％、较好至少约20％、并可用于实施本发明的多肽(“可用于”具有上文就多肽所限定的含义)。特别优选的是具有免疫原性(即能够诱导免疫反应而产生特异地抗相应的全长度新孢子虫多肽的抗体)的肽片段。
本发明进一步提供包含与本领域已知的载体或融合对象融合的任一种上述多肽的融合蛋白质。
本发明进一步提供制备任一种上述多肽的方法，包括在有利于多肽表达的条件下培养已用重组表达载体转化的宿主细胞，其中所说的重组表达载体包含含有编码特定多肽之核苷酸序列的多核苷酸分子，并且该多核苷酸分子与一种或多种调节元件可操作性地连接；然后从细胞培养物中回收所表达的多肽。
5．多肽的应用一旦本发明的多肽已达到足够的纯度，即可使用SDS-PAGE、大小排阻层析、氨基酸序列分析、免疫学活性、生物学活性等标准方法鉴定其特性。可进一步使用亲水性分析(参见Hopp和Woods,1981，美国国家科学院院报，78:3824)、类似的软件算法鉴定多肽的疏水性和亲水性区域。可进行结构分析以鉴定呈现特异性二级结构的多肽区域。可使用X射线晶体分析法(Engstrom,1974，生物化学与实验生物学，11:7-13)、计算机模型绘制(Fletterick和Zoller(编)，1996,Current Communicationsin Molecular Biology,Cold Spring Harbor Laboratory,Cold SpringHarbor,NY)及核磁共振(NMR)等生物物理方法制图并研究多肽与其他推测的相互作用性蛋白质/受体/分子之间相互作用的潜在位点。可使用从这些研究中获得的信息设计缺失突变体和疫苗组合物，并设计或选择可在体内特异性阻断该多肽之生物学功能的治疗或药用化合物。
本发明的多肽可用于多种目的，包括作为疫苗组合物的成分以用于保护哺乳动物免患新孢子虫病，或作为诊断试剂，例如以ELISA检测等标准检测法筛选动物血液或血清样品中的新孢子虫特异性抗体；或如下所述用作产生多克隆或单克隆抗体的抗原，其中可以使用所述抗体作为诊断试剂，例如以Western印迹检测法等标准技术筛选动物细胞、组织或体液样品中的新孢子虫特异性蛋白质。
6．多肽的类似物和衍生物可以在蛋白质水平上修饰本发明的任何多肽，以改善或改变其生物学或免疫学特征。可使用已知技术对多肽进行一种或多种化学修饰，以制备其类似物，这些技术包括但不只限于下述中任何一种用相应的D型氨基酸、氨基酸类似物或氨基酸模拟物取代多肽的一个或多个L型氨基酸，以便例如产生肼基甲酸酯类(carbazates)或三元中心；或者特异性化学修饰，例如用胰蛋白酶、胰凝乳蛋白酶、木瓜蛋白酶或V8蛋白酶进行蛋白水解性切割，或者用NaBH4或溴化氰处理，或者乙酰化、甲酰化、氧化或还原等。另一种方案或同时地，也可用遗传重组技术修饰本发明的多肽。
可以在分子上连接一个或多个化学基团，包括但不只限于乙酰基、硫桥基、糖基、脂和磷酸，和/或连接到本发明的第二种多肽，或另一种蛋白质如血清白蛋白、匙孔血兰蛋白或商品上已活化的BSA，或者多聚氨基酸(如多聚赖氨酸)，或多糖(如Sepharose，琼脂糖，或经过修饰或未经修饰的纤维素)上等，以制备本发明多肽的衍生物。较好是在多肽的氨基酸侧链和/或N末端或C末端上进行共价连接。进行这些连接反应的方法是蛋白质化学领域中已知的。
可用于实现本发明的衍生物包括那些将水溶性聚合物如聚乙二醇连接到本发明的多肽或其类似物或衍生物上，以提供其他所期望的性质，同时保留多肽的至少一部分免疫原性的衍生物。这些附加的预期性质包括比如提高在水溶液中的溶解度，提高贮存稳定性、提高对蛋白降解的抗性，提高体内半寿期等。适于连接到本发明多肽上的水溶性聚合物包括但不只限于聚乙二醇均聚物、聚丙二醇均聚物、乙二醇与丙二醇的共聚物，其中所说的均聚物和共聚物未被取代或在一侧末端被烷基、聚氧乙烯化多元醇、聚乙烯醇、多糖、聚乙烯醚酯类和α、β-多(2-羟乙基)-DL-天冬酰胺取代的。特别优选的是聚乙二醇。制备多肽的水溶性聚合物结合物的方法是本领域已知的，并且已在下列专利文献中描述过美国专利3,788,948、3,960,830、4,002,531、4,055,635、4,179,337、4,261,973、4,412,989、4,414,147、4,415,665、4,609,546、4,732,863、4,745,180，欧洲专利(EP)152,847、98,110；和日本专利5,792,435等，这些专利均在此引入作为参考。
7．抗体本发明进一步提供抗本发明多肽的分离抗体。在一优选实施方案中，可使用已知方法产生抗犬新孢子虫GRA1、GRA2、SAG1、MIC1和MAG1蛋白的抗体。可用部分或基本上纯化或分离的犬新孢子虫蛋白，或其如上文描述的同系物、融合蛋白、基本部分、类似物或衍生物免疫选自猪、牛、马、兔、山羊、绵羊或小鼠等各种宿主动物。可使用下文描述的佐剂提高抗体产生量。
可从被免疫动物的血清中得到和分离多克隆抗体，并使用常规方法试验其对抗原的特异性。或者，也可使用由培养的连续细胞系生产抗体分子的任何技术制备并分离单克隆抗体。这些技术包括但不只限于原先由Kohler和Milstein(自然，1975,256:495-497)描述的杂交瘤技术、人B细胞杂交瘤技术(Kosbor等，1983，今日免疫学，4:72；Cote等，1983，美国国家科学院院报，80:2026-2030)，以及EBV杂交瘤技术(Cole等，1985，单克隆抗体和癌症治疗，Alan R.Liss,Inc.,PP.77-86)。或者，可采用已述的生产单链抗体的技术(如参见美国专利4,946,778)生产犬新孢子虫抗原特异性单链抗体。
含有本发明多肽的特异性结合位点的抗体片段也包括在本发明范围内，并可用已知技术制备。这样的片段包括但不只限于可由胃蛋白酶消化完整抗体分子而产生的F(ab′)2片段，和可经还原F(ab′)2片段的二硫桥而产生的Fab片段。或者，也可构建Fab表达文库(Huse等，1989，科学，246:1275-1281)，以迅速鉴定对犬新孢子虫蛋白有所需特异性的Fab片段。
生产和分离单克隆抗体及抗体片段的技术是本领域已知的，并在例如下列文献中给出了更详细的描述Harlow和Lane,1988，抗体实验室手册，冷泉港实验室和J.W.Cooding,1986，单克隆抗体原理与实践，Academic Press,London(其列为本文参考文献)。
8．新孢子虫基因的定向突变基于对本发明多核苷酸分子的公开，可以制备可用于使新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1基因(以下合在一起或单独称为“新孢子虫基因”)失活或发生突变的遗传构建体。可使用适当设计的遗传构建体，结合现在已知的或有待进一步发展的遗传技术对每种新孢子虫基因进行突变。例如可以使用可发挥下列功能的本发明的遗传构建体突变新孢子虫基因(a)删除该新孢子虫基因的所有或部分编码序列或调节序列，或(b)用不同的核苷酸序列取代该新孢子虫基因的所有或部分编码序列或调节序列；或(c)将一个或多个核苷酸或者含有新孢子虫或异源来源的核苷酸序列的寡核苷酸分子或多核苷酸分子插入到该新孢子虫基因的编码序列或调节序列中；或(d)完成(a)、(b)或(c)的某种组合。
若其内一种新孢子虫基因已突变的新孢子虫细胞与其内基因未被突变的新孢子虫同样株系的细胞相比，基因的突变使携带该已突变基因的新孢子虫细胞的病原性降低，并且可将携带失活基因的这种新孢子虫细胞用于疫苗组合物中，特别是用于经修饰的活疫苗中，以诱导或有助于诱导哺乳动物抗新孢子虫病的保护性反应，则该已突变的新孢子虫细胞可用于实施本发明。在一优选实施方案中，该突变可使所述新孢子虫基因部分或完全失活，或者使新孢子虫基因编码的蛋白质部分或完全失活。在此，如果不产生蛋白质产物(例如已缺失该基因)，或者所产生的蛋白质产物不再完成其正常生物学功能，或者不再能被运输到其正常细胞部位上，或者所产生的产物虽能完成其正常生物学功能，但明显降低了速率，或者如果这种突变导致与其内基因未被如此突变的同一株系细胞相比，其内基因已被如此突变的新孢子虫致病性株系的细胞的致病性发生可检测水平的降低，则认为这种新孢子虫基因或蛋白质是部分或完全失活的。
在一非限制性实施方案中，可用本发明的遗传构建体，可以以不同的核苷酸序列，例如突变的编码序列或突变的调节序列或者其部分，取代野生型基因的编码序列或其启动子或其他调节区域或者其部分，而突变野生型新孢子虫基因。可用易错聚合酶链反应法或盒式诱变法等多种已知方法产生用于这种遗传构建体中的突变的新孢子虫基因序列。例如，可以利用寡核苷酸介导的诱变方法，按限定的方式改变野生型新孢子虫基因的编码序列或启动子序列，例如在序列内的特定点上导入移码突变或终止密码子。另一种方式是或附加地，可将一个或多个核苷酸、寡核苷酸分子或多核苷酸分子插入到编码序列或启动子序列中，或用一个或多个不同的核苷酸、寡核苷酸分子或多核苷酸分子取代一部分编码序列或启动子序列，从而制备可用于本发明遗传构建体中的突变的核苷酸序列。可从任何天然来源或合成得到这样的寡核苷酸分子或多核苷酸分子。插入的序列可以只是简单地破坏新孢子虫基因的读框，或可进一步编码如可选择标志等异源基因产物。
另一种方式是或者额外地，可用随机诱变法产生突变的新孢子虫基因序列，以用于本发明的遗传构建体中。可用现在知道的或有待进一步发展的任何技术，如将携带新孢子虫基因的细胞暴露于紫外照射下或X光照射，或与N-甲基-N′-亚硝基胍、甲基磺酸乙酯、亚硝酸或氮芥子气等化学诱变剂接触以完成突变，然后选择特定基因中携带突变的细胞即可完成随机诱变(有关诱变技术的综述可参见Ausubel,1989，上述文献)。
产生如上述可用于实施本发明的经修饰的新孢子虫细胞的突变可发生于新孢子虫基因内的任何区段，其中包含ORF、启动子或其他调节区，或发生于天然包含该基因或ORF的任何其他序列中。这样的新孢子虫细胞包括能产生其中由新孢子虫基因正常编码的蛋白质受到修饰、或者不产生由新孢子虫基因正常编码的蛋白质的突变体，并且可以是无效突变体、条件突变体或渗漏突变体。
或者，本发明的遗传构建体可包含天然侧接于新孢子虫原位基因或ORF的核苷酸序列，例如SEQ ID NO:1,3,4,6,8,10,11和12中给出的那些，其中只有一部分或没有该基因编码区的核苷酸序列。这样的遗传构建体例如可用于删除整个所述新孢子虫基因或ORF。
在一优选的实施方案中，本发明的遗传构建体包含可用于使一种新孢子虫基因失活的多核苷酸分子，包括(a)具有与编码新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白的核苷酸序列本来相同的核苷酸序列、但其中还进一步包含一个或多个失活突变的多核苷酸分子；或者(b)含有天然侧接于原位新孢子虫基因ORF上的核苷酸序列的多核苷酸分子。当被转化到新孢子虫株系的细胞中之后，即通过同源重组使遗传构建体的多核苷酸分子定向结合于特定新孢子虫基因，并进而取代该基因或其部分，或插入到该基因中。该重组过程的结果是使特定新孢子虫株系固有的新孢子虫基因被失活了。
在寄生性原生动物中完成同源性基因置换的方法是本领域已知的，并已在其他文献中作出描述(如参见Cruz和Beverley,1990，自然，348:171-173；Cruz等，1991，美国国家科学院院报，88:7170-7174；Donald和Roos,1994，分子生物学与寄生虫学，63:245-253，和Titus等，1995，美国国家科学院院报，92:10267-10271，这些文献均列为本文参考文献)。
为了通过同源重组造成定向基因突变，遗传构建体较好是含有上述已突变的核苷酸序列的环形或线性化的质粒。在一非限制性实施方案中，使用至少约200个核苷酸的突变序列将本发明的遗传构建体导向特定的新孢子虫基因以进行同源重组，尽管使用长度较短的核苷酸序列可能也是有效的。此外，质粒较好是包含附加的编码报道基因产物或其他可选择标志的核苷酸序列，构建该质粒以使之将以与待破坏的固有新孢子虫基因的调节元件序列可操作性地连接的方式插入到新孢子虫基因组中。可用于实现本发明的报道基因是本领域已知的，包括编码CAT、绿色荧光素蛋白和β-半乳糖苷酶等的基因。编码可选择性标志的核苷酸序列也是本领域已知的，包括编码赋予对抗生素或抗代谢物的抗性，或补充营养缺陷性需要之基因产物的核苷酸序列。这样的序列的例子包括编码嘧啶甲胺抗性，或新霉素磷酸转移酶(赋予对氨基糖苷类的抗性)、或潮霉素磷酸转移酶(赋予对潮霉素的抗性)的那些序列。
可用于制备本发明的遗传构建体的方法是本领域已知的，包括体外重组技术、合成技术和体内遗传重组技术(如参见Maniatis等，1989；Ausubel等，1989；Sambrook等，1989；Innis等，1995，和Erlich,1992等的上述文献)。
可按照已知技术，例如电穿孔技术，用本发明的遗传构建体转化或转染新孢子虫细胞。可使用标准技术选择转化体，例如选择表达与构建体相关之可选择标记的细胞。可使用基因分析技术，例如Southern印迹分析，或Northern分析法以检测编码特定蛋白质的mRNA转录物是否缺乏，或根据以诸如免疫分析法确定的如降低了致病性或细胞缺乏特定的蛋白质等新表型的出现，或联用这些方法来鉴定其中已发生了成功重组过程并已使特定靶基因失活的转化体。
能够按照本发明进行修饰的新孢子虫细胞较好是速殖体，但也可以是慢殖体或卵母细胞。虽然在新孢子虫生活周期的某些阶段细胞是二倍体但速殖体是单倍体。因此，在生产表达适当突变表型的经修饰的新孢子虫细胞时优选使用速殖体，因为速殖体只需要一次成功重组过程即可破坏特定的新孢子虫基因。或者，在新孢子虫的二倍体细胞中，必须破坏各基因的两个等位基因。为此，可用携带两个不同选择标志的遗传构建体依次破坏第一个等位基因，然后破坏第二个等位基因。
在另一个非限制性实施方案中，本发明的遗传构建体进一步包含来自新孢子虫或可感染动物的不同病原体的不同基因或编码区，其中所说的基因或编码区编码可用于在免疫接种了本发明经修饰的活新孢子虫细胞的动物体内诱导或帮助诱导分别的和不同的保护性免疫反应。可对该附加基因或编码区作进一步的遗传修饰以使之含有导致所编码的蛋白质从被修饰的活新孢子虫细胞中分泌出来的信号序列，从而使抗原呈现于被免疫动物的免疫系统中。
因此本发明提供其内GRA1、GRA2、SAG1、MIC1或MAG1基因已发生突变的经过修饰的活新孢子虫细胞。本发明进一步提供其内GRA1、GRA2、SAG1、MIC1和MAG基因中两个或多个已发生突变的经过修饰的活新孢子虫细胞，其中可使用上述常规方法制备所说的细胞。另外，本发明提供制备经修饰的活新孢子虫细胞的方法，其包括(a)用本发明的遗传构建体转化新孢子虫；(b)选择其内GRA1、GRA2、MIC1、SAG1或MAG1基因已被遗传构建体突变的被转化的细胞；并且(3)从步骤(b)的细胞中选择出可用于保护哺乳动物抗新孢子虫病的疫苗中的那些细胞。
9．培养新孢子虫细胞可按照本领域中所描述的已知技术，用速殖体感染任何接受性宿主细胞系，特别是哺乳动物细胞系，以体外培养和维持可用于本发明的新孢子虫细胞。可在其中培养新孢子虫速殖体的哺乳动物细胞系，包含人包皮成纤维细胞(Lindsay等，1993，美国兽医研究杂志，54:103-106)、牛心肺主动脉内皮细胞(Marsh等，1995，上述文献)、牛单核细胞(Lindsay和Dubey,1989，上述文献)，和猴肾细胞等。例如，可在Hs68人包皮成纤维细胞(ATCC登记号No.CRL-1635)(Lindsay，等，1993，上述文献)的单层中培养犬新孢子虫的速殖体，并且本发明中使用的用犬新孢子虫株系NC-1感染的MARC145猴肾细胞保藏在ATCC(登记号No.12231)。可以类似地培养并维持慢殖体。
可在本领域中描述的几种类型的培养基中培养哺乳动物细胞培养物和维持已感染了新孢子虫细胞的细胞培养物。例如，可以在加有10％(V/V)热灭活的胎牛血清(FBS)或成年马血清(ES)、2mM L-谷氨酰胺、50U/ml青霉素和50μg/ml链霉素(Conrad等，1993，文献同上)的Dulbecco极限必需培养基(DMEM；Gibco Laboratories,N.Y.)中培养已用犬新孢子虫速殖体感染的牛心肺主动脉内皮细胞的稳定单层培养物。可在含有2％(V/V)FBS、1.0mM丙酮酸钠、1×104U/ml青霉素、1×104μg/ml链霉素、5×10-2mM 2-巯基乙醇和0.3mg/ml L-谷氨酰胺的RPMI1640(维持培养基)中维持Hs68人包皮成纤维细胞的单层。可在其中FBS增加到10％(V/V)的同样培养基(生长培养基)中维持已被新孢子虫感染的Hs68人包皮成纤维细胞的单层培养物。
通常在标准组织培养条件如37℃和5％CO2条件下维持被新孢子虫感染的哺乳动物细胞单层培养物。通常可以使用标准技术，借助显微镜确定，当培养物中70-90％的哺乳动物细胞已被感染时，即将速殖体传代到未被感染的单层培养物中。可使用任何标准技术裂解宿主细胞并经过滤或离心收集速殖体，而从被感染的哺乳动物细胞培养物中收集速殖体。
也可以如上所述在哺乳动物细胞中培养本发明的经修饰的活新孢子虫细胞。
10．抗新孢子虫疫苗本发明进一步提供抗新孢子虫病的疫苗，其包含免疫有效量的一种或多种本发明的蛋白质或多肽，和兽医可接受的载体。在一优选实施方案中，疫苗包含选自GRA1、GRA2、SAG1、MIC1和MAG1的犬新孢子虫蛋白。
本发明进一步提供抗新孢子虫病的疫苗，其包含免疫有效量的一种或多种本发明的多核苷酸分子，和兽医可接受的载体。在一优选实施方案中，疫苗包含具有编码选自GRA1、GRA2、SAG1、MIC1和MAG1的犬新孢子虫蛋白质的核苷酸序列的多核苷酸分子。
本发明进一步提供抗新孢子虫病的疫苗，其包含免疫有效量的本发明的经修饰的新孢子虫细胞，和兽医可接受的载体。在一优选实施方案中，用于本发明的疫苗中的经修饰的新孢子虫细胞是表达GRA1-、GRA2-、SAG1-、MICI-或MAG1-表型的活的犬新孢子虫细胞。或者，本发明的疫苗也可包含已失活的本发明的任何经修饰的新孢子虫细胞。可使用本领域已知的任何技术，例如用二元氮丙啶(BEI)，或β-丙内酯(beta-propiolactone)，或用冻融法或加热处理，或细胞匀浆化，或合用这些类型的技术而失活经修饰的新孢子虫细胞。从匀浆化的、经修饰的新孢子虫细胞制备的疫苗可由整个未分离的细胞匀浆物或其免疫有效的亚级份组成。
本文中使用的术语“免疫有效量”是指当对哺乳动物的一个成员一次给药或多次给药后能够诱导抗新孢子虫病的保护性反应所需的抗原，如蛋白质、多肽、多核苷酸分子或经修饰的细胞的量。
本文中多处使用的短语“能够诱导保护性反应”包含动物响应于疫苗接种而诱导或增强任何基于免疫的反应，包括可保护接种后动物免于患新孢子虫病的抗体或细胞介导的免疫反应或两种情况兼而有之。术语“保护性反应”和“保护”在这里不仅是指绝对预防新孢子虫病或绝对预防由致新孢子虫病的病原体引起的感染，而且还指由这种病原体所致感染的速度和程度方面的任何可检测的降低，或由这种病原体感染所导致的疾病严重性或任何症状或病情的任何可检测的降低，包括如在一种或多种组织中所形成的损伤的形成速度或绝对数目的任何可检测的降低，或流产发生率，或感染从受孕哺乳动物向胎儿或从亲代哺乳动物向其子代传播的任何可检测的降低(以上均为同种的接种疫苗的动物与未接种疫苗的被感染动物相比)。
在进一步的优选实施方案中，本发明的疫苗是用于保护哺乳动物抗新孢子虫病和任选地一种或多种其他会给哺乳动物带来痛苦的疾病或病理状况的联合疫苗，其包含免疫有效量的含有本发明的多肽、多核苷酸分子、或经修饰的新孢子虫细胞的第一成分；免疫有效量的不同于第一成分的第二成分，它能够诱导或有利于诱导对抗可给哺乳动物带来痛苦的疾病或病理条件的保护性反应；以及兽医可接受的载体。
联合疫苗的第二种成分是基于其能够诱导或有利于诱导抗新孢子虫病，或本领域已知的另一种可给哺乳动物成员带来痛苦的疾病或病理条件的保护性反应而选择的。本领域中现在已知的，或将来待定的可用于特定哺乳动物的疫苗组合物中的任何抗原成分均可作为联合疫苗的第二种成分。这样的抗原成分包含但不限于能提供对抗下列病原体的保护作用的抗原牛疱疹病毒(引起感染性牛鼻气管炎)，牛呼吸道合胞病毒，牛病毒性腹泻病毒，Ⅰ、Ⅰ或Ⅲ型副流感病毒、钩端螺旋体、弯曲杆菌、金黄色葡萄球菌、无乳链球菌、支原体、克雷伯氏杆菌、沙门氏菌、冠形病毒、轮状病毒、狂犬病毒、溶血巴氏杆菌、出血败血性巴氏杆菌、梭状芽孢杆菌、破伤风类毒素、大肠杆菌、隐孢菌(Cryptosporidium spp.)、艾美球虫、毛滴虫及其他真核生物寄生虫等。
在一非限制性实施方案中，本发明的联合疫苗包含选自下列成员中的两种或多种成分的组合免疫有效量的本发明的蛋白质或多肽、免疫有效量的本发明的多核苷酸分子，和免疫有效量的本发明的经修饰的新孢子虫细胞。在一优选实施方案中，本发明的联合疫苗包含选自犬新孢子虫GRA1、GRA2、SAG1、MIC1和MAG1蛋白，编码犬新孢子虫GRA1、GRA2、SAG1、MIC1和MAG1蛋白之一的多核苷酸分子，和表现有GRA1-、GRA2-、SAG1-、MIC1-和MAG1-表型之一的经修饰的活新孢子虫细胞中的两种或多种成分的组合。
如下所述，本发明的疫苗进一步包含一种或多种附加的免疫调节成分，包括佐剂或细胞因子。
本发明进一步提供制备抗新孢子虫病之疫苗的方法，其包括将免疫有效量的本发明的犬新孢子虫蛋白或多肽，或多核苷酸分子，或经修饰的新孢子虫细胞，以适于对哺乳动物给药的形式与兽医可接受的载体组合。在一优选实施方案中，所述蛋白质是选自GRA1、GRA2、SAG1、MIC1、或MAG1的犬新孢子虫蛋白；优选所述多核苷酸分子包含编码选自GRA1、GRA2、SAG1、MIC1和MAG1的犬新孢子虫蛋白质的核苷酸序列；优选所述经修饰的新孢子虫细胞是表现选自GRA1-、GRA2-、SAG1-、MIC1-和MAG1-的表型的活细胞。
可使用含有所说的新孢子虫细胞(其可以是游离在培养基中或保留在哺乳动物宿主细胞中或两种情况兼而有之)的培养液等分样品制备含有本发明经修饰的活新孢子虫细胞的疫苗，并可直接或以浓缩形式对哺乳动物给药。或者，可将经修饰的活新孢子虫细胞与兽医可接受的载体组合，其中加或不加选自本领域已知的并适于选定的给药途径的免疫调节剂，并且优选疫苗组合物中保留至少有一定程度存活性的经修饰的活新孢子虫细胞。可用于本发明的疫苗中的经修饰的新孢子虫细胞较好是速殖体，但也可代之以慢殖体或卵中母细胞，或其某种组合。
可按已被接受的常规方法配制本发明的疫苗组合物，以包含兽医可接受的载体，如标准缓冲液、稳定剂、稀释剂、防腐剂和/或助溶剂，并可配制成有利于缓释的剂型。稀释剂包含水、盐溶液、右旋糖、乙醇、甘油等。等渗性添加剂包含氯化钠、右旋糖、甘露糖醇、山梨糖醇和乳糖等。稳定剂包含白蛋白等。适用的其他疫苗载体和添加剂，包含特别适用于配制经修饰的活疫苗的那些载体和添加剂是本领域技术人员已知的或显而易见的(如参见Remington的制药科学，第18版，1990,MackPublishing)(其列为本文参考文献)。
本发明的疫苗可进一步包含一种或多种其他免疫调节成分，如佐剂或细胞因子等。可用于本发明疫苗中的佐剂的非限制性例子是RIBI佐剂系统(Ribi Inc.,Hamilton,MT)、明矾、矿物质凝胶如氢氧化铝凝胶、水包油乳剂、油包水乳剂如弗氏完全佐剂和不完全佐剂、嵌段共聚物(CytRx,Atlanta GA)、QS-21(Cambridge Biotech Inc.,Cambridge MA)、SAF-M(Chiron,Emeryville CA)、AMPHIGEN佐剂、皂苷、Quil A或其他皂苷级份、单磷酰脂A和Avridine脂质胺佐剂。用于本发明疫苗中的水包油型乳剂的特定非限制性实例包括改进的SEAM62和SEAM1/2配制品。改进的SEAM62是一种水包油乳剂，其中含有5％(V/V)角鲨烯(Sigma)、1％(V/V)SPAN85去污剂(ICI Surfactants)、0.7％(V/V)TWEEN80去污剂、2.5％(V/V)乙醇、200μg/ml Quil A、100μg/ml胆固醇和0.5％(V/V)卵磷脂。改进的SEAM1/2也是一种水包油乳剂，其中含有5％(V/V)角鲨烯、1％(V/V)SPAN85去污剂、0.7％(V/V)Tween 80去污剂、2.5％(V/V)乙醇、100μg/mlQuil A和50μg/ml胆固醇。可包括于疫苗中的其他免疫调节剂包含例如一种或多种白细胞介素、干扰素或其他已知的细胞因子。如疫苗中包含经修饰的活新孢子虫细胞，则较好是根据所得疫苗制剂在维持经修饰的活新孢子虫细胞至少某种程度存活性方面的能力选择佐剂。
当疫苗组合物含有经修饰的活新孢子虫细胞时，可以冷藏或冻存疫苗。当疫苗组合物含有本发明的蛋白质、多肽、多核苷酸分子或失活的经修饰的新孢子虫细胞时，则疫苗可以冷冻贮存或以冻干形式贮存，后者要在给药之前使用适当的稀释剂重新水合。
可根据需要将本发明的疫苗配制成适于缓慢释放抗原的形式。这样的缓释配方的例子包括抗原与生物相容性聚合物的合成物如聚(乳酸)、乳酸乙醇酸共聚物(poly(lactic-co-glycolic acid))、甲基纤维素、透明质酸、胶原蛋白等的组合。包括A.Domb等，1992，用于高级技术的聚合物，3:279-292在内的几种出版物中已综述了药物送递载体中可降解性聚合物的结构、选择和使用。可在M.Chasin和R.Langer(编)，1990，″作为药物送递系统的生物可降解性聚合物″(摘自药物和制药科学，Vol.45,M.Dekker,NY)中查到选择和使用药物配方中的聚合物的进一步指南。另一种方案是或额外地，可将抗原制成微胶囊化制剂以改善给药途径和效率。制备微胶囊化抗原的方法是本领域熟知的，包括例如美国专利3,137,631、3,959,457、4,205,060、4,606,940、4,744,933、5,132,117，和国际专利申请WO95/28227中描述的那些技术，所有这些出版物均在此引入作为参考文献。
脂质体也可用于改善抗原的持续释放。有关如何制备和使用脂质体配方的详细内容可见于美国专利4,016,100、4,452,747、4921,706、4,927,637、4,944,948、5,008,050和5,009,056，所有这些出版物均在此引入作为参考文献。
本发明进一步提供给哺乳动物接种疫苗以对抗新孢子虫病的方法，其包括给哺乳动物施用免疫有效量的本发明的疫苗。较好是经胃肠道外，如皮下或肌肉内注射途径施用疫苗。但也可以通过腹膜内或静脉内注射，或口服、鼻内、直肠、阴道、眼内或联合途径，或可借助本领域已知的缓释装置施用疫苗。本领域技术人员可以确定施用疫苗的最佳途径，并可基于所选定的用药途径确定疫苗组合物的可接受配方。
可用常规方法确定有效剂量，即从低剂量抗原开始，然后增加剂量，同时监测效果。在确定每只动物的最佳剂量时，可考虑多种影响因素。其中主要是动物的种类、大小、年龄和一般状态，动物体内其他药物的存在，动物即将接种的新孢子虫的特定种或株系的毒力等。较好是在考虑了其他动物研究结果之后再选择实际剂量。
本发明疫苗中本发明的新孢子虫蛋白或多肽的剂量范围优选约为10μg至10mg，更优选为大约50μg至大约1mg，最优选为大约100μg至大约0.5mg。本发明疫苗中本发明的新孢子虫多肽苷酸分子的剂量范围优选为大约50μg至大约1mg。本发明疫苗中本发明的经修饰的新孢子虫细胞的剂量范围优选为大约1×103至大约1×108个细胞/ml，更优选为大约1×105至大约1×107个细胞/ml。适当的剂量体积范围为大约0.5ml至大约10ml，较好为大约1ml至大约5ml。这些抗原的剂量也适用于本发明的联合疫苗。如联合疫苗的第二种成分是本发明的新孢子虫蛋白、多肽、多核苷酸或经修饰的细胞以外的抗原时，可根据本领域已知的该第二种成份在现有疫苗中的应用情况来确定其在联合疫苗中的使用剂量。
本发明的疫苗可用于保护哺乳动物以抗新孢子虫病。术语“哺乳动物”用于本文中是指可使用本发明的疫苗进行保护以抗新孢子虫病的任何种的哺乳动物，包括狗、牛、山羊、绵羊和马等。可根据多种因素，包括其他动物中新孢子虫病暴发的时间规律等，在特定动物生活期的任何时间施用本发明的疫苗。例如可作为生育前疫苗，给离乳龄或更年青动物，或较成熟动物施用疫苗，以预防新孢子虫相关的先天性疾病或流产。有效保护作用可能只需要初次疫苗接种，或可能需要一次或多次强化接种。检测是否已达到了足够的免疫保护的一种方法是确定疫苗接种后动物体内的抗血清形成和抗体滴度。优选基于对所有相关因素(某些因素在前面已有描述)的分析，由兽医来决定疫苗接种的时间和强化接种的次数(如果有的话)。
本发明进一步提供用于给哺乳动物接种以抗新孢子虫病的药盒，所说的药盒包含含有免疫有效量的本发明的多肽、多核苷酸分子或经修饰的新孢子虫细胞或者其某种组合的一个容器。药盒还可选择性地包含含有兽医学可接受的载体或稀释剂的第二个容器。在一优选实施方案中，所述多肽选自犬新孢子虫的GRA1、GRA2、SAG1、MIC1和MAG1蛋白；所述多核苷酸分子较好具有编码犬新孢子虫GRA1、GRA2、SAG1、MIC1和MAG1蛋白之一的核苷酸序列；所述经修饰的新孢子虫细胞较好是表达GRA1-、GRA2-、SAG1-、MIC1-和MAG1-表型的活细胞。
下列实施例只是举例描述，而不用来限制本发明的范围。
实施例犬新孢子虫cDNA和基因序列的分离1．鉴定含有GRA1、GRA2、SAG1和MIC1 cDNA的λ克隆犬新孢子虫速殖体的cDNA文库由T.Baszler博士(WashingtonState University,Puuman,WA)惠赠。简单地说，使用从新孢子虫NC-1速殖体中纯化的RNA构建该文库。将EcoRⅠ和XhoⅠ接头加到cDNA末端后，将cDNA克隆到噬菌体λZAPExpress(Stratagene,La Jolla,CA)中。当将文库的等分样品与大肠杆菌XL-1 Blue MRA(P2)(Stratagene)混合并铺板到含有IPTG的NZY琼脂板上时，根据白色噬斑的形成估计该文库含有约99％重组体。
基本上按照Krishnan等人(1991，核酸研究，19:6177-6182；Krishnan等，1993，酶学方法，218:258-279)所述的方法，对按上述方法鉴定的各个假定的λZAPExpress克隆的重组体插入片段DNA序列进行PCR分析。使用无菌吸管回收含有良好分离的λ噬菌体噬斑的琼脂小块，并在100μl无菌水中浸泡至少1小时。使用大约10μl已分散的λ噬菌体颗粒，在含有(1)对λ噬菌体载体(即λZAPEXpress)特异的并对相邻于克隆位点(即EcoRⅠ和XhoⅠ)的序列有特异性，而且按5′至3′方向朝向插入片段DNA序列的λDASH-T3和λDASH-T7寡核苷酸引物各100mg；(2)200μM dNTPs；(3)PCR缓冲液(LifeTechnologies,Inc.,Gaithersburg,MD)；和(4)约1单位Taq DNA聚合酶(Life Technologies,Inc.)的总100μl反应体积中进行PCR反应。λDASH-T3的序列是5′-AATTAACCCTCACTAAAGGG(SEQ IDNO:14)。λDASH-T7的序列是5′-GTAATACGACTCACTATAGGGC(SEQ ID NO:15)。热循环条件是94℃,5分钟，1次循环；94℃,1分钟，55℃,1分钟，72℃,1分钟，30次循环；72℃,7分钟，1次循环。用标准的琼脂糖凝胶电泳，用溴乙锭染色并在UV光射下进行肉眼观察，检查反应混合物的等分样品(一般10μl)。使用PCR纯化系统(Qiagen)，经离子交换柱层析纯化PCR混合物，利用荧光标记的λDASH-T3和λDASH-T4引物和Sanger双脱氧链终止DNA测序技术直接测序。在National Center for Biotechnology Information,Bethesda,Maryland,20894,USA，通过与DNA序列数据库的比较分析诸序列与其他已知序列的同源性。鉴定出4个分别与T.gondii GRA1、GRA2、SAG1和MIC1基因同源的序列。
2．犬新孢子虫GRA1、GRA2、SAG1和MIC1 cDNA的完整ORF的鉴定按照生产商(Stratagene)的使用说明书，对经鉴定的含有分别同源于T.gondii GRA1、GRA2、SAG1和MIC1基因之犬新孢子虫序列的上述噬菌体λZAPExpress颗粒进行体内切割，以回收质粒pBluescript中的插入片段序列。简单地说，使噬菌体颗粒感染已用ExAssist辅助噬菌体(Stratagene)共感染的大肠杆菌XL-1 BlueMRF′。经此处理后，收集上清并与大肠杆菌XLOLR细胞(Stratagene)混合。然后将细胞悬液的等分样品铺板到含有卡那霉素(～50μg/ml)的培养基上，并检查卡那霉素抗性菌落以分析质粒形式。纯化质粒DNA并使用Sanger双脱氧链终止DNA测序技术测定重组部分的序列。用DNASTAR(DNASTAR,Inc.,Madison,WI)分析所得到的DNA序列以鉴定ORF和其他特征。还使用BLAST算法(National Center forBiotechnology Information)分析序列以与公共数据库中的DNA序列进行同源性比较。
将鉴定后证明含有完整犬新孢子虫GRA1 ORF的重组质粒克隆定名为pRC77(ATCC 209685)。pRC77中cDNA插入片段序列的总长度为1,265bp，其中GRA1 ORF从nt205延伸到nt777(SEQ ID NO:1)。SEQID NO:2给出的是推断的犬新孢子虫GRA1蛋白的氨基酸序列。犬新孢子虫GRA1 ORF的核苷酸序列与T.gondii GRA1 ORF的核苷酸序列有大约55％相似性。推断出的犬新孢子虫GRA1蛋白的氨基酸序列与推断出的T.gondii GRA1蛋白的氨基酸序列有大约51％的相似性。
将鉴定为含有完整犬新孢子虫GRA2 ORF的重组质粒克隆称为pRC5(ATCC 209686)。pRC5中cDNA插入片段序列的总长度为1,031bp，其中GRA2 ORF从nt25延伸到nt660(SEQ ID NO:4)。SEQ IDNO:5给出的是推断的犬新孢子虫GRA2蛋白的氨基酸序列。犬新孢子虫GRA2 ORF的核苷酸序列与T.gondii GRA2 ORF的核苷酸序列有大约37％的相似性。推断的犬新孢子虫GRA2蛋白的氨基酸序列与推断的T.gondii GRA2蛋白的氨基酸序列有大约26％的相似性。
将鉴定为含有完整犬新孢子虫SAG1 ORF的重组质粒克隆称为pRC102(ATCC 209687)。pRC102中cDNA插入片段序列的总长度为1,263bp，其中SAG1 ORF从nt130延伸到nt1089(SEQ ID NO:6)。SEQID NO:7给出的是推断的犬新孢子虫SAG1蛋白的氨基酸序列。犬新孢子虫SAG1 ORF的核苷酸序列与T.gondii SAG1 ORF的核苷酸序列有大约58％的相似性。推断的犬新孢子虫SAG1蛋白的氨基酸序列与推断的T.gondii SAG1蛋白的氨基酸序列有大约49％的相似性。
将鉴定为含有完整犬新孢子虫MIC1 ORF的重组质粒克隆称为pRC340(ATCC 209688)。pRC340中cDNA插入片段序列的总长度为2,069bp，其中MIC1 ORF从nt138延伸到nt1,520(SEQ ID NO:8)。SEQID NO:9给出的是推断的犬新孢子虫MIC1蛋白的氨基酸序列。犬新孢子虫MIC1 ORF的核苷酸序列与T.gondii MIC1 ORF的核苷酸序列有大约58％的相似性。推断的犬新孢子虫MIC1蛋白的氨基酸序列与推断的T.gondii MIC1蛋白的氨基酸序列有大约47％的相似性。
3．GRA1基因序列的鉴定按照常规方法，在噬菌体λⅡ载体(Stratagene)中构建犬新孢子虫株系NC-1的基因组DNA文库。按下述方法PCR扩增从pRC77(ATCC209685)衍生的cDNA序列，并将所得到的经PCR扩增的DNA片段用作探针以筛选犬新孢子虫株系NC-1的基因组DNA文库。使用对犬新孢子虫GRA1 cDNA特异的引物bd219和bd220扩增相当于犬新孢子虫GRA1 cDNA(pRC77)的ORF的一个563bp片段。bd219的序列为5′-GCCGCGACTTCTTTTTCTCT(SEQ ID NO:16),bd220的序列是5′-CTCGATCGCCTCCTTTACTG(SEQ ID NO:17)。使用Seaplaque低熔点琼脂糖(LMA)(FMC Bioproducts)电泳纯化该563bp片段。从凝胶上切出电泳条带，然后用于随机引发的标记反应，以产生可用于筛选新孢子虫基因组文库的探针。
将犬新孢子虫基因组文库(λDASH Stratagene#845201)的2.5×105pfu经噬斑浸提到Hybond N+尼龙膜(Amersham)上。使用563bp GRA1cDNA片段作为探针，筛选复制滤膜。9个复制pfu被记录为阳性，随后将它们浸入1ml SM缓冲液中。对其中4个克隆(#5-8)进行第二轮筛选。第二轮筛选时，将每个克隆500-1000pfu经噬斑浸提到复制膜上。第二轮筛选证明所有4个Gra1克隆均为阳性，作为单个噬斑分离之。
由此方法鉴定出一个称为Gra1#8的λ克隆，并以其作为模板，使用引物bd256和bd254进行PCR扩增。引物bd256的序列是5′-TGCTAGTACTGGCGAGTGAA(SEQ ID NO:18)。引物bd254是5′-CAGGTTTGCCACACATTTTT(SEQ ID NO:19)。将所得到的PCR片段亚克隆到pGEM-T EASY载体(Promega,Madison,WI)中。利用荧光标记法和Sanger双脱氧链终止测序技术测定克隆片段的序列。序列分析表明，克隆片段含有GRA1基因。GRA1基因序列(SEQ ID NO:3)含有从nt605至nt855和从nt983至nt1304的一个ORF，其与pRC77(ATCC209685)从nt205至nt777的GRA1 cDNA序列(SEQ ID NO:1)共有全部同一性。然而，GRA1基因序列(SEQ ID NO:3)在3′未翻译区的单一核苷酸位置上不同于cDNA序列(SEQ ID NO:1)，在GRA1基因的nt1728处为T残基，而在pRC77的nt1201处为G残基。这种差异可能是由于RFLP现象或pRC77中的测序错误，因为在来自GRA1#8λ基因组克隆中的2个独立亚克隆中也证实了这种核苷酸差异。GRA1基因序列(SEQ IDNO:3)还包含一个从nt856延伸到nt982的内含子。此外，已在mRNA起始位点的5’侧150bp内鉴定了三个启动子基序，它们与在T.gondii GRA基因中发现的(Mereier等，1996，分子微生物学，21:421-428)相似。
4．SAG1基因序列的鉴定基于得自pRC102之DNA序列的SAG1 ORF合成特异于SAG1基因的寡核苷酸引物。称为NCSAG15′的第一个引物的序列是5′-ATGTTTCCTCCTCGGGCAGTG(SEQ ID NO:20)；称为NCSAG13′的第二个引物的序列是5′-TCACGCGACGCCAGCCGCTATCG(SEQID NO:21)。后来认定，上面给出的引物NCSAG15′被粗心设计成包含另外3个附加的核苷酸(CCT)，因此当确定真正的SAG1基因序列时考虑到了这3个附加核苷酸的存在。
使用引物NCSAG15′(SEQ ID NO:20)和NCSAG13′(SEQ ID NO:21)对作为模板的犬新孢子虫株系NC-1基因组DNA进行PCR扩增。得到约1Kb的扩增片段，按照生产商推荐的方法，将其克隆到质粒pCR2.1和pBlunt(Invitrogen,Carlsbad,CA)中。利用荧光标记法并使用标准的“通用”、“反向”引物及下列寡核苷酸，以Sanger双脱氧链终止测序技术分析已鉴定为含有基因组SAG1 PCR片段的重组质粒的序列NCSAG1200:5′-GCCCTGACAATTCGACCGCC(SEQ ID NO:22),NCSAG1500:5′-CCCACAACATCCAAGTCGTTC(SEQ ID NO:23)；NCSAG1660:5′-GTTTTGCACCATCCTTAGTG(SEQ ID NO:24)，和NCSAG1320:5′-GAGAGTTTGCTTTGCACCG(SEQ ID NO:25)。使用DNAStar软件包分析所得到的DNA序列，并发现其完全相同于由pRC102推导出的SAG1 ORF的序列。因此，SAG1基因的基因组序列相同于由cDNA测序得出的序列。
5．MIC1基因序列的鉴定使用对MIC1 cDNA片段(参见pRC340的序列)之5′和3′末端特异的寡核苷酸，从犬新孢子虫基因组DNA以PCR技术扩增约2.2Kb DNA片段。热循环条件是94℃,1分钟，1次循环；94℃,45秒，54℃,45秒，72℃,2分钟，29次循环；72℃,5分钟，1次循环。将此2.2kb片段克隆到pCR2.1和pZEROBLUNT(Invitrogen,Carlsbad,CA)中。用标准的限制性酶切分析法鉴定重组质粒，并使用使用荧光标记法和Sanger双脱氧链终止技术测定有代表性的克隆的核苷酸序列。与pRC340的MIC1 cDNA序列比较，以确定外显子和内含子的位置。
MIC1基因区的总长度为2278bp(SEQ ID NO:10)，包含从nt1至nt73、nt345至nt811、nt1187至nt1265，和nt1515至nt2278的ORF，还有3个间插的内含子。
6．MAG1基因序列的鉴定使用基因组克隆Gra1#8作为模板，按照生产商推荐的方法，制备BspD1、EcoR1和HindⅢ Vectorette文库(Genosys)。使用对5′GRA1cDNA特异的反义引物bd234，和Vectorette引物Ⅱ(ER-70)，借助Klentaq(AB Peptide Inc)和PFU(Stratagene)聚合酶从HindⅢVectorette文库中扩增出一个约2Kb的片段。引物bd234的序列是5′-CCAGCCGAGTTCGTGTTCAGA(SEQ ID NO:26)，引物ER-70的序列是CAACGTGGATCCGATTCAAGCTTC(SEQ ID NO:27)。在1％LMA凝胶上电泳分离产物，切出相应的条带，并直接用来与pGEM-T EASY载体进行克隆反应。转化到大肠杆菌DH5α中产生一些白色菌落。对20个不同的白色克隆的DNA所进行的NotⅠ限制性分析表明，20个克隆中有18个含有适当大小的插入片段。选择亚克隆2，使之生长为贮备液，并将该质粒重新命名为bd245。使用嵌套引物bd218和Vectorette测序引物从两末端测定得自Vectorette 2Kb Gra1启动子片段的PCR产物的序列。引物bd218的序列是5′-AAAGCTCTTCGGCAGTTCAA(SEQ ID NO:28)。使用Sanger荧光双脱氧链终止测序技术，以标准的引物步行法得到质粒bd245的完整序列。
在一个PCR反应中，联合使用引物bd252和引物T7的一个变体，并以Gra1#8 DNA作为模板，以测定克隆Gra1#8之一个末端的位置。引物bd252的序列是5′-CCGCGCTACCACTTTCCA(SEQ ID NO:29)。T7引物变体的序列是5′-GTAATACGACTCACTATA(SEQ ID NO:30)。使用引物bd252和T7变体扩增得到一个约2.5Kb的片段，将该产物亚克隆到pGEM-T EASY载体中，并将该质粒定名为bd282。使用荧光标记法和Sanger双脱氧链终止测序技术，经引物步行法测出质粒bd282的完整序列。
使用质粒bd245和bd282的序列产生SEQ ID NO:11所示的、通过WU-BLAST2(Washington University BLAST第2版)鉴定为编码MAG1基因的连续序列。结果表明，该序列与T.gondii MAG1基因(登记号No.U09029)具有同源性。通过内含子剪接位点共有序列及与T.gondiiMAG1的序列对比，鉴定出推断的外显子/内含子边缘，此提示一个有从nt704至nt820(外显子1)、从nt1301至nt1399(外显子2)、从nt1510至nt1808(外显子3)和从nt1921至nt3297(外显子4)的外显子，并带有间插内含子的mRNA转录物。基于这些推定的外显子/内含子边缘，SEQ IDNO:12给出了推测的cDNA序列，SEQ ID NO:13给出了由之推出的氨基酸序列。T.gondii和犬新孢子虫之间的内含子和外显子边界的比较结果表明，两种生物体间MAG1基因的外显子1-3和内含子1-2在位置上是相对保守的。内含子3和外显子4剪接位点是犬新孢子虫MAG1所独有的。SEQ ID NO:11还包含GRA1基因序列的一部分(从nt1至nt126)，以及从nt127至nt703的完整的间插性的推定双向GRA1/MAG1启动子区。
用NotⅠ消化来自λGra1#8克隆的DNA以释放出插入片段DNA，然后用苯酚/氯仿抽提沉淀并重新悬浮于水中。将由此得到的DNA连接到已纯化的经NotⅠ消化的BS KS+载体DNA(Stratagene)上，然后转化到大肠杆菌DH5α细胞中。使用对GRA1和MAG1基因特异的引物，经PCR反应筛选克隆，并用Not1限制性消化以进一步证实～16Kb的λGRA1#8 Not1插入片段的存在。用于PCR的引物是GRA1引物219(SEQID NO:16)和220(SEQ ID NO:17)，以及MAG1引物261和270。引物261的序列是5′-CATCAGAGAAACTGGAGT(SEQ ID NO:31)；引物270的序列是5′-CATCAGAGAAACTGGAGT(SEQ ID NO:32)。鉴定出一个含有连接了GRA1#8中之NotⅠ插入片段的BS KS+载体的阳性质粒克隆，并定名为bd304(ATCC 203413)。
7．新孢子虫MAG1和GRA1启动子的鉴定7.1．有关T.gondii GRA1启动子元件的背景由对T.gondii GRA1启动子的功能性突变分析，和与另一个充分明确的T.gondii启动子(SAG1)的序列比较，鉴定出了一个七核苷酸基序(TGAGACG)，其以方向非依赖性方式提供基础GRA1启动子活性(Mercier等，1996，分子微生物学，21:421-428)。GRA1启动子中的另外两个七核苷酸基序则提供额外的转录活性。T.gondii GRA1启动子包含在相对于GRA1转录起始位点的上游从-129至-47的近端区域内。该T.gondii GRA1区域中重要的启动子元件包括1个CAAT框、1个正向七核苷酸基序和两个反向七核苷酸基序。在T.gondii GRA1启动子上游(-349到-204)还鉴定出其它三个七核苷酸基序，但它们并没有明显地增加-129至-47的启动子元件的功能。
7.2．新孢子虫MAG1-GRA1启动子元件对犬新孢子虫株系NC-1之完整MAG1-GRA1区域的基因组序列分析表明，两个基因是以头对头构象排列的。MAG1和GRA1基因推定的翻译起始位点间有一个577bp区域(SEQ ID NO:11,nt127至nt703)，其含有推定的MAG1/GRA1双向启动子。对该577bp区域的序列分析鉴定出其中有如上文就T.gondii GRA1启动子所述的(Mercier等，1996，文献同上)三个反向七核苷酸基序(CGTCTCA或CGTCTCT)。两个CAAT框侧接于这些七核苷酸基序旁一个CAAT框朝向GRA1基团，另一个CAAT框朝向MAG1基因。下表列出了发现于犬新孢子虫MAG1/GRA1双向启动子区中的启动子元件。
表
a核苷酸位置是根据由GRA1 cDNA(pRC77)的5′末端限定的推定转录起始位点而定的。*此CAAT框是由互补链读出的，并且朝向MAG1基因(65KDa)。**如Mercier等人(1996，上述文献)限定的反向七核苷酸启动子基序。
7.3新孢子虫GRA1启动子构建体的构建为试验含有所述两个七核苷酸基序和两个CAAT框的577bp假定的MAG1/GRA1双向启动子的功能，可以构建在所限定的序列下游含有LacZ报道基因的质粒，然后将此质粒转化到NC-1速殖体中。定名为GLS的、含有驱动LacZ表达的T.gondii GRA1启动子并含有T.gondiiSAG1 3′末端的Bluescript质粒是由David Sibley博士(WashingtonUniversity School of Medicine,St.Louis,MO,USA)提供的。用HindⅢ/NsiⅠ消化质粒GLS以除去T.gondii GRA1启动子片段，然后进行LMA纯化以产生缺少启动子的LacZ报道载体。以λ克隆Gra1#8作为模板，使用引物HindⅢ-bd256(5′-GGCCAAGCTTGCTAGTACTGGCGA；SEQ ID NO:33)和bd260-Nsil(5′-ATCCAATGCATCTTGCTGAATGCCTTAAAAG；SEQ IDNO:34)，以及PFU和Klentaq聚合酶进行扩增反应，以产生含有新孢子虫GRA1基因之5′非翻译区的～600bp启动子片段。用HindⅢ/NsiⅠ消化该片段，在LMA上纯化，然后与上述缺少启动子的LacZ报道载体进行连接反应，以产生质粒克隆bd266。用引物HindⅢ-bd256和bd260-NsiⅠ就质粒克隆bd266进行PCR反应，以证实犬新孢子虫GRA1启动子的插入。
在Howe等人(1997,Methods:A Conpanion to Methods inEnzymology,13:1-11)所述的细胞混合缓冲液中，以1.4kV、10uF，用5μg或50μg未切开的质粒bd266或质粒GL5经电穿孔转染犬新孢子虫NC-1速殖体(1×107)。在T25瓶中使电穿孔的NC-1细胞感染MARC-145猴肾细胞(80％长满度)，3天后收获细胞以进行β半乳糖苷酶检测。为了收获细胞，首先除去3ml培养基并留下1ml培养基以从培养瓶中刮取细胞。将收获的细胞转移到微型离心机中离心。弃去上清，并将沉淀的细胞重新悬浮于100μl裂解缓冲液(Howe等，1997，上述文献)中。将离心管置-20℃保存以备进行β半乳糖苷酶检测。
为了进行半乳糖苷酶检测，将试管内容物解冻，混合，于50℃保温1小时，然后在微量离心机中离心。每份样品使用50μl上清液。按Howe等人(1997，上述文献)所述方法完成β半乳糖苷酶检测试验。使用已被David Sibley博士提供的质粒GLS稳定转染的犬新孢子虫株系制备标准曲线。收获速殖体，计数，以104个寄生虫/ml的密度重新悬浮于裂解缓冲液中，然后按上述方法处理(即于50℃保温1小时)。以每孔大约20,000至大约10个寄生虫的范围制备该制剂的12个连续稀释液，并用于制作β半乳糖苷酶检测中的标准曲线。
7.4．结果与含有用质粒GLS转染之犬新孢子虫株系NC-1的细胞裂解产物的样品相比，含有用质粒bd266转染之犬新孢子虫株系NC-1的细胞裂解物的样品给出了最高β半乳糖苷酶读数。使用由bd266(50μg质粒)的标准曲线求得的值，得出β半乳糖苷酶读数相当于上述用质粒GLS稳定地转化之犬新孢子虫细胞系中的7013个寄生虫。这些实验提供了首要证据证明犬新孢子虫GRA1启动子是有功能的，并且该启动子元件处于由引物HindⅢ-bd256和bd260-NsiⅠ限定的约600bp基因组片段之内。
实施例重组犬新孢子虫MIC1蛋白的表达和免疫反应性PCR扩增代表MIC1 ORF的DNA序列并克隆到pQE50(Qiagen)中，后者为有利于诱导性高水平表达克隆序列的重组系统。将重组质粒定名为pQEmic1。经SDS-PAGE电泳和考马斯亮兰蛋白质染色检查未被诱导的和被诱导的含有pQEmic1之大肠杆菌细胞的全细胞裂解物。在被诱导的携带pQEmic1的大肠杆菌细胞中鉴定出一种分子量约57KDa的多肽，未被诱导的细胞中则没有。根据推断的MIC1的氨基酸序列(SEQ IDNO:9)估计MIC1多肽的分子量约为49KDa。
对被诱导的和未被诱导的携带pQEmic1的大肠杆菌的全细胞裂解物进行SDS-PAGE，并用标准方法将蛋白质转移到PVF膜(Novex)上。然后使用磷酸缓冲盐溶液(PBS)中的1％聚乙烯醇(PVA)封闭膜。随后，在含有0.05％Tween-20的PBS(PBST)中将膜淋洗三次。然后在含有从犬新孢子虫自然感染的牛群得到的合并的多克隆抗血清(由澳大利亚悉尼技术大学John Ellis博士惠赠)溶液中，或含有用T.gondii实验性感染兔得到的多克隆抗血清(由国家野生生物健康中心(Madison,WI)的R.A.Cole博士惠赠)溶液中将膜保温约1小时。然后用PBST洗膜三次，并与羊抗牛或抗兔IgG/碱性磷酸酶结合物(Kirkegaard and Perry Labs,Gaithersburg,MD)(必要时按生产商推荐的方法稀释500倍)反应。再次在PBST中洗膜，在BCIP/NBT试剂(Kirkegaard and Perry Labs)中简短地保温，然后用dH2O淋洗以检测条带。发现重组表达的MIC1蛋白质与犬新孢子虫和T.gondii多克隆抗血清有特异反应性。
实施例疫苗配制将本发明的犬新孢子虫蛋白(如SAG1)以100μg/ml的浓度与等体积改进的SEAM62佐剂合并，然后轻轻混合以配制抗新孢子虫病的疫苗，并于4℃贮存，以用于初次和强化免疫。给牛初次皮下接种约2ml(总共100μg)疫苗，并于3周后进行一次强化疫苗接种。可在强化免疫接种后两周繁殖牛。也可以按此方式配制并施用含有本发明的GRA1、GRA2、MIC1或MAG1蛋白的疫苗。
于1998年3月19日将下列生物学材料保藏在美国典型培养物保藏中心(ATCC)(12301 Parklawn Drive,Rockville,MD,20852,USA)，并指定为下列登记号质粒ATCC登记号pRC77 209685pRC5 209686pRC102209687pRC340209688下述另一种生物学材料质粒bd304已于1998年11月9日保藏在ATCC(10801 University Blvd,Manassas,VA,20110,USA)，并给出登记号203413。
上文列出的所有专利、专利申请和出版物均全文引入本文作为参考文献。
本发明的范围不只限于所述的特定实施方案，这些方案只是作为本发明个别方面的单一举例说明给出的。功能等同的组合物和方法均在本发明的范围之内。确实，除了本文所示的和描述的内容外，对本发明各种改动对于阅读了上述内容的本领域技术人员来说都是显而易见的。这些改动将落入本发明待批权利要求的范围之内。
序列表<110>Pfizer Products Inc.(所有非美国申请)<120>编码新孢子虫蛋白质的多核苷酸分子<130>PC9943<140>待定<141>1998-12-15<150>60/079,389<151>1998-03-26<160>34<170>patentIn Ver.2.0-beta<210>1<211>1265<212>DNA<213>犬新孢子虫<220><221>CDS<222>(205)..(777)<400>1gtttcatcgt tgaactgccg aagagcttta tgtttttgcc gcgacttctt tttctctccc 60ctgaataaat tgtaccgtgg gtggcgtaca cgtctgaaca cgaactcggc tgggtttgct 120tttgtggacg tgtttttccg gctcaaataa tttcattttc attgttcata cgtgtttgtg 180atctctttta aggcattcag caag atg gtg cgt gtg agc gct att gtt ggg231Met Val Arg Val Ser Ala Ile Val Gly1 5gtt gca gcc tcg gtg gtt ctc tcc ctt tct tcc ggc gtg tac gcg gcc 279Val Ala Ala Ser Val Val Leu Ser Leu Ser Ser Gly Val Tyr Ala Ala10 15 20 25gag gga gcg gaa aaa ccc ttg gga ggc gaa ggt caa gcg cct acc ttg 327Glu Gly Ala Glu Lys Pro Leu Gly Gly Glu Gly Gln Ala Pro Thr Leu30 35 40ttg tca atg cta ggt ggc ggg cgc gcg gga agg ggg ttg tca gtc gga 375Leu Ser Met Leu Gly Gly Gly Arg Ala Gly Arg Gly Leu Ser Val Gly45 50 55caa tca gta gac ctt gac ctg atg ggc aga cgc tac cga gtg acc aga 423Gln Ser Val Asp Leu Asp Leu Met Gly Arg Arg Tyr Arg Val Thr Arg60 65 70tcc gag ggt gcg cca gat gtg crc gag arc tcc gtt ctg gac gcg gat 471Ser Glu Gly Ala Pro Asp Val Leu Glu Ile Ser Val Leu Asp Ala Asp75 80 85ggg aag gct tct cac atc ggc ttt gta agc att ccg gaa gtg atg gac 519Gly Lys Ala Ser His Ile Gly Phe Val Ser Ile Pro Glu Val Met Asp90 95 100 105acc gtg gcg cgc atg cag aag gac gag gga att ttc ctt gat gcg tta 567Thr Val Ala Arg Met Gln Lys Asp Glu Gly Ile Phe Leu Asp Ala Leu110 115 120agt aaa gga gaa aca gta aag gag gcg atc gag gat gtt gct gca gcg 615Ser Lys Gly Glu Thr Val Lys Glu Ala Ile Glu Asp Val Ala Ala Ala125 130 135gaa ggt ctt tct ccc gag cag act gaa aac ctg gag gaa acg gtg gcc 663Glu Gly Leu Ser Pro Glu Gln Thr Glu Asn Leu Glu Glu Thr Val Ala140 145 150gct gta gcg act ctt gtt cgt gac gag atg gaa gtt ctt aaa gat cag 711Ala Val Ala Thr Leu Val Arg Asp Glu Met Glu Val Leu Lys Asp Gln155 160 165gag aag cta gaa gag gat gca gaa aag ctt gcg gga gat tta gaa gct 759Glu Lys Leu Glu Glu Asp Ala Glu Lys Leu Ala Gly Asp Leu Glu Ala170 175 180 185ctt caa ggg caa cat taa tttgcaaagg gattgtcatg tagccatatg 807Leu Gln Gly Gln His190ttcaatcgcc ctcaaaagtc gactggggtg ttttggcaca tgtctgcagt tggtttggat 867cgacggcatg ggttagcgat ggagaaaacg gatcgatggt tgacagttgc cgaaggaaat 927cggttgcgtc gtgtaaggaa agtgtcacgg gggcattgag at5tggaggg gctcttgaag 987ccttcctcgg tggcaccaga ggggcagagc tcaacgcaag cgtggtatat ggagctggag 1047cagtggccgc aacgcagcag ggcggcgtga attacgttgc gttagtgctg gcgtgaaacg 1107tcgtgttctc aacccgagta caatgtagtt tcaggtggtc gttgctcgaa tccgtgtgtc 1167gcgcctgtgt tgtatagtgt ttcgcattat gtggagacgg ggacgttttt aaaaaatcaa 1227aaatgtgtgg caaacctgaa aaaaaaaaaa aaaaaaaa1265<210>2<211>190<212>PRT<213>犬新孢子虫<400>2Met Val Arg Val Ser Ala Ile Val Gly Val Ala Ala Ser Val Val Leu1 5 10 15Ser Leu Ser Ser Gly Val Tyr Ala Ala Glu Gly Ala Glu Lys Pro Leu20 25 30Gly Gly Glu Gly Gln Ala Pro Thr Leu Leu Ser Met Leu Gly Gly Gly35 40 45Arg Ala Gly Arg Gly Leu Ser Val Gly Gln Ser Val Asp Leu Asp Leu50 55 60Met Gly Arg Arg Tyr Arg Val Thr Arg Ser Glu Gly Ala Pro Asp Val65 70 75 80Leu Glu Ile Ser Val Leu Asp Ala Asp Gly Lys Ala Ser His Ile Gly85 90 95Phe Val Ser Ile Pro Glu Val Met Asp Thr Val Ala Arg Met Gln Lys100 105 110Asp Glu Gly Ile Phe Leu Asp Ala Leu Ser Lys Gly Glu Thr Val Lys115 120 125Glu Ala Ile Glu Asp Val Ala Ala Ala Glu Gly Leu Ser Pro Glu Gln130 135 140Thr Glu Asn Leu Glu Glu Thr Val Ala Ala Val Ala Thr Leu Val Arg145 150 155 160Asp Glu Met Glu Val Leu Lys Asp Gln Glu Lys Leu Glu Glu Asp Ala165 170 175Glu Lys Leu Ala Gly Asp Leu Glu Ala Leu Gln Gly Gln His180 185 190<210>3<211>1774<212>DNA<213>犬新孢子虫<400>3tgctagtact ggcgagtgaa atgcgacgct cactgtagcc tccagataca cgacctgttg 60cggagctgac gctctcccca ctagagttca tgagcgatgg ggcgatggta gaccaacggt 120ccctagcgct tcggctgttg cgcggcggct cttaagagcg ggacgaccgc ctttcaggtg 180aaccgcctag tatcccaagc acacgaacat cccactcatg ggctggcgga actgctcgca 240gcggttacgc aaacacagtt gcgacgcaat gagccgtctc aagttgctgt cctcgtctca 300tttcggatcg gttcccaggt cctccggtgc gtctctgtcg gaaggttatt gcaactccgt 360tctgcgctgg gattagttta aatcatttca ttaatttgca gtttcatcgt tgaactgccg 420aagagcttta tgtttttgcc gcgacttctt tttctctccc ctgaataaat tgtaccgtgg 480gtggcgtaca cgtctgaaca cgaactcggc tgggtttgct tttgtggacg tgtttttccg 540gctcaaataa tttcattttc attgttcata cgtgtttgtg atctctttta aggcattcag 600caagatggtg cgtgtgagcg ctattgttgg ggttgcagcc tcggtggttc tctccctttc 660ttccggcgtg tacgcggccg agggagcgga aaaacccttg ggaggcgaag gtcaagcgcc 720taccttgttg tcaatgctag gtggcgggcg cgcgggaagg gggttgtcag tcggacaatc 780agtagacctt gacctgatgg gcagacgcta ccgagtgacc agatccgagg gtgcgccaga 840tgtgctcgag atctcgtaag tagactactg gtgttcaacg aaaaaaaagt acttgcgctg 900tggaatgtcg tctgtgtgtt agctgcatca tgtgataagc aaacatttgt tttcgagcgt 960gtgttgtctc gcgtgctttc agcgttctgg acgcggatgg gaaggcttct cacatcggct 1020ttgtaagcat tccggaagtg atggacaccg tggcgcgcat gcagaaggac gagggaattt 1080tccttgatgc gttaagtaaa ggagaaacag taaaggaggc gatcgaggat gttgctgcag 1140cggaaggtct ttctcccgag cagactgaaa acctggagga aacggtggcc gctgtagcga 1200ctcttgttcg tgacgagatg gaagttctta aagatcagga gaagctagaa gaggatgcag 1260aaaagcttgc gggagattta gaagctcttc aagggcaaca ttaatttgca aagggattgt 1320catgtagcca tatgttcaat cgccctcaaa agtcgactgg ggtgttttgg cacatgtctg 1380cagttggttt ggatcgacgg catgggttag cgatggagaa aacggatcga tggttgacag 1440ttgccgaagg aaatcggttg cgtcgtgtaa ggaaagtgtc acgggggcat tgagatttgg 1500aggggctctt gaagccttcc tcggtggcac cagaggggca gagctcaacg caagcgtggt 1560atatggagct ggagcagtgg ccgcaacgca gcagggcggc gtgaattacg ttgcgttagt 1620gctggcgtga aacgtcgtgt tctcaacccg agtacaatgt agtttcaggt ggtcgttgct 1680cgaatccgtg tgtcgcgcct gtgttgtata gtgtttcgca ttatgtgtag acggggacgt 1740ttttaaaaaa tcaaaaatgt gtggcaaacc tgaa 1774<210>4<21l>1031<212>DNA<213>犬新孢子虫<220><221>CDS<222>(25)..(660)<400>4aaataggggt ttcagcacca cacg atg ttc acg ggg aaa cgt tgg ata ctt 51Met Phe Thr Gly Lys Arg Trp Ile Leu1 5gtt gtt gcc gtt ggc gcc ctg gtc ggc gcc tcg gta aag gca gcc gat99Val Val Ala Val Gly Ala Leu Val Gly Ala Ser Val Lys Ala Ala Asp10 15 20 25ttt tct ggc agg gga acc gtc aat gga cag ccg gtt ggc agc ggt tat147Phe Ser Gly Arg Gly Thr Val Asn Gly Gln Pro Val Gly Ser Gly Tyr30 35 40tcc gga tat ccc cgt ggc gat gat gtt aga gaa tca atg gct gca ccc195Ser Gly Tyr Pro Arg Gly Asp Asp Val Arg Glu Ser Met Ala Ala Pro45 50 55gaa gat ctg cca ggc gag agg caa ccg gag aca ccc atg gcg gaa gct243Glu Asp Leu Pro Gly Glu Arg Gln Pro Glu Thr Pro Thr Ala Glu Ala60 65 70gta aaa cag gca gcg gca aaa gct tat cga tta ctc aag cag ttt act291Val Lys Gln Ala Ala Ala Lys Ala Tyr Arg Leu Leu Lys Gln Phe Thr75 80 85gcg aag gtc gga cag gaa act gag aac gcc tac tac cac gtg aag aaa339Ala Lys Val Gly Gln Glu Thr Glu Asn Ala Tyr Tyr His Val Lys Lys90 95 100 105gcg aca atg aaa ggc ttt gac gtt gca aaa gac cag tcg tat aag ggc 387Ala Thr Met Lys Gly Phe Asp Val Ala Lys Asp Gln Ser Tyr Lys Gly110 115 120tac ttg gcc gtc agg aaa gcc aca gct aag ggc ctg cag agc gct ggc 435Tyr Leu Ala Val Arg Lys Ala Thr Ala Lys Gly Leu Gln Set Ala Gly125 130 135aag agc ctt gag ctt aaa gag tcg gca ccg aca ggc act acg act gcg 483Lys Ser Leu Glu Leu Lys Glu Ser Ala Pro Thr Gly Thr Thr Thr Ala140 145 150gcg ccg act gaa aaa gtg ccc ccc agt ggc ccg cga tca ggt gaa gtt 531Ala Pro Thr Glu Lys Val Pro Pro Ser Gly Pro Arg Ser Gly Glu Val155 160 165cag cgt act cgt aaa gag caa aat gac gtg cag caa acc gca gag atg 579Gln Arg Thr Arg Lys Glu Gln Asn Asp Val Gln Gln Thr Ala Glu Met170 175 180 185ttg gct gag gaa att ctt gag gct ggg ctt aag aag gac gat gga gaa 627Leu Ala Glu Glu Ile Leu Glu Ala Gly Leu Lys Lys Asp Asp Gly Glu190 195 200gga cgg gga acg cca gaa gct gaa gtc aat taa gaaaatcact aaacgtcaag 680Gly Arg Gly Thr Pro Glu Ala Glu Val Asn205 210ttctttatga ctgctgtaca ccaccacccc cctggactgc ttaagacagc taacaagcgt 740tggatttcaa tatcctactt aaggtatgtg gggcggatgt cgtgtcacgg tgtgtatggc 800gttaaaaaac ggcacacggc attaaatgca gtgcaagtat gaattgtgcg caggttgtgt 860gtgacatttt tcggatgtcc tgggctttgt gtgcgtgcgt gggctgcgaa gagattagat 920ttatttcttg cgattgcgat gcgtagtttg ttgcatcgtt atggtcatga aaaaagtcta 980acgacacaca taaacgatgg agcaaattaa aaaaaaaaaa aaaaaaaaaa a 1031<210>5<211>211<212>PRT<213>犬新孢子虫<400>5Met Phe Thr Gly Lys Arg Trp Ile Leu Val Val Ala Val Gly Ala Leu1 5 10 15Val Gly Ala Ser Val Lys Ala Ala Asp Phe Ser Gly Arg Gly Thr Val20 25 30Asn Gly Gln Pro Val Gly Ser Gly Tyr Ser Gly Tyr Pro Arg Gly Asp35 40 45Asp Val Arg Glu Ser Met Ala Ala Pro Glu Asp Leu Pro Gly Glu Arg50 55 60Gln Pro Glu Thr Pro Thr Ala Glu Ala Val Lys Gln Ala Ala Ala Lys65 70 75 80Ala Tyr Arg Leu Leu Lys Gln Phe Thr Ala Lys Val Gly Gln Glu Thr85 90 95Glu Asn Ala Tyr Tyr His Val Lys Lys Ala Thr Met Lys Gly Phe Asp100 105 110Val Ala Lys Asp Gln Ser Tyr Lys Gly Tyr Leu Ala Val Arg Lys Ala115 120 125Thr Ala Lys Gly Leu Gln Ser Ala Gly Lys Ser Leu Glu Leu Lys Glu130 135 140Ser Ala Pro Thr Gly Thr Thr Thr Ala Ala Pro Thr Glu Lys Val Pro145 150 155 160Pro Ser Gly Pro Arg Ser Gly Glu Val Gln Arg Thr Arg Lys Glu Gln165 170 175Asn Asp Val Gln Gln Thr Ala Glu Met Leu Ala Glu Glu Ile Leu Glu180 185 190Ala Gly Leu Lys Lys Asp Asp Gly Glu Gly Arg Gly Thr Pro Glu Ala195 200 205Glu Val Asn210<210>6<211>1263<212>DNA<213>犬新孢子虫<220><221>CDS<222>(130)..(1089)<400>6tctgcgtgca gccttccgtt gttctcgctt gtatcacagg tgcctttgtc gtacataaac 60attgtttcga ttgtagtcta gtcacaccgc actcgtttca tcactggcgc ttttgtttat 120tcatcgaat atg ttt cct cgg gca gtg aga cgc gcc gtc tcg gtg ggt gtg 171Met Phe Pro Arg Ala Val Arg Arg Ala Val Ser Val Gly Val1 5 10ttc gcc gcg ccc gca ctg gtg gcg ttc ttt gac tgt gga act atg gca 219Phe Ala Ala Pro Ala Leu Val Ala Phe Phe Asp Cys Gly Thr Met Ala15 20 25 30tca gaa aaa tca cct cta ctt gtc aat caa gtt gtc acc tgt gac aac 267Ser Glu Lys Ser Pro Leu Leu Val Asn Gln Val Val Thr Cys Asp Asn35 40 45gaa gag aaa tca tca gtt gcc gtc cta cta tca ccg aag ctg aac cac 315Glu Glu Lys Ser Ser Val Ala Val Leu Leu Ser Pro Lys Leu Asn His50 55 60atc acg ctc aag tgc cct gac aat tcg acc gcc gtg ccc gct gct ctt 363Ile Thr Leu Lys Cys Pro Asp Ash Ser Thr Ala Val Pro Ala Ala Leu65 70 75ggt tat cca aca aac agg acc gtc tgc ccg gcg gag tcc gga ggt caa 411Gly Tyr Pro Thr Asn Arg Thr Val Cys Pro Ala Glu Ser Gly Gly Gln80 85 90act tgt aca ggc aag gag ata ccg ttg gaa agc ctg ctt ccc ggg gca 459Thr Cys Thr Gly Lys Glu Ile Pro Leu Glu Ser Leu Leu Pro Gly Ala95 100 105 110aac gat agc tgg tgg tca ggt gtt gat atc aag act ggc gtt aag ctc 507Asn Asp Ser Trp Trp Ser Gly Val Asp Ile Lys Thr Gly Val Lys Leu115 120 125aca att cct gaa gcg agc ttc ccc aca aca tcc aag tcg ttc gac gtc 555Thr Ile Pro Glu Ala Ser Phe Pro Thr Thr Ser Lys Ser Phe Asp Val130 135 140ggc tgc gtc agc agt gat gcc agc aag agt tgt atg gtc aca gtc aca 603Gly Cys Val Ser Ser Asp Ala Ser Lys Ser Cys Met Val Thr Val Thr145 150 155gtg cca ccc aga gcc tca tcg ctt gtc aac ggt gtc gca atg tgc tct 651Val Pro Pro Arg Ala Ser Ser Leu Val Asn Gly Val Ala Met Cys Ser160 165 170tac ggt gca aac gaa act crc ggc cct arc aca ttg tcc gag ggc gga 699Tyr Gly Ala Asn Glu Thr Leu Gly Pro Ile Thr Leu Ser Glu Gly Gly175 180 185 190tct tct acg atg acc ctc gtt tgc ggc acg gat ggg aag cca gtt cct747Ser Ser Thr Met Thr Leu Val Cys Gly Thr Asp Gly Lys Pro Val Pro195 200 205cct gat cct aag cag gtt tgt tct ggg acg acc gtc aag gat tgt aaa795Pro Asp Pro Lys Gln Val Cys Ser Gly Thr Thr Val Lys Asp Cys Lys210 215 220gca aaa ccg ttc act gat gtt ttc cca aaa ttc agt gct gat tgg tgg843Ala Lys Pro Phe Thr Asp Val Phe Pro Lys Phe Ser Ala Asp Trp Trp225 230 235cag gga aaa ccc gac act aag gat ggt gca aaa cta acg atc aag aaa891Gln Gly Lys Pro Asp Thr Lys Asp Gly Ala Lys Leu Thr Ile Lys Lys240 245 250ggt gca ttt cct cca aag gag gaa aag ttt act ctt ggg tgc aag agc939Gly Ala Phe Pro Pro Lys Glu Glu Lys Phe Thr Leu Gly Cys Lys Ser255 260 265 270gta tcg agt ccg gag gtt tac tgt act gtg cag gtg gag gca gag cgc987Val Ser Ser Pro Glu Val Tyr Cys Thr Val Gln Val Glu Ala Glu Arg275 280 285gcg agt gca ggg atc aag tcg tcg gct gaa aat gtt ggt cgc gtt tcc1035Ala Ser Ala Gly Ile Lys Ser Ser Ala Glu Asn Val Gly Arg Val Ser290 295 300ctt ttc gct gta aca att gga ctc gta ggc tcg ata gcg gct ggc gtc1083Leu Phe Ala Val Thr Ile Gly Leu Val Gly Ser Ile Ala Ala Gly Val305 310 315gcg tga gtgacaatcg ttctgctcgc cattcataaa aataatgcaa gacatgttcg 1139Ala320cgttcgtcat gtgtgtcttt atcataaaac aacatttact gattacttgt ggtggtttgc 1199atatgtacaa tcccaaaaac tgctctactg taaagacgtt tagagtaaaa aaaaaaaaaa 1259aaaa 1263<210>7<211>319<212>PRT<213>犬新孢子虫<400>7Met Phe Pro Arg Ala Val Arg Arg Ala Val Ser Val Gly Val Phe Ala1 5 10 15Ala Pro Ala Leu Val Ala Phe Phe Asp Cys Gly Thr Met Ala Ser Glu20 25 30Lys Ser Pro Leu Leu Val Asn Gln Val Val Thr Cys Asp Asn Glu Glu35 40 45Lys Ser Ser Val Ala Val Leu Leu Ser Pro Lys Leu Asn His Ile Thr50 55 60Leu Lys Cys Pro Asp Asn Ser Thr Ala Val Pro Ala Ala Leu Gly Tyr65 70 75 80Pro Thr Asn Arg Thr Val Cys Pro Ala Glu Ser Gly Gly Gln Thr Cys85 90 95Thr Gly Lys Glu Ile Pro Leu Glu Ser Leu Leu Pro Gly Ala Asn Asp100 105 110Ser Trp Trp Ser Gly Val Asp Ile Lys Thr Gly Val Lys Leu Thr Ile115 120 125Pro Glu Ala Ser Phe Pro Thr Thr Ser Lys Ser Phe Asp Val Gly Cys130 135 140Val Ser Ser Asp Ala Ser Lys Ser Cys Met Val Thr Val Thr Val Pro145 150 155 160Pro Arg Ala Ser Ser Leu Val Asn Gly Val Ala Met Cys Ser Tyr Gly165 170 175Ala Asn Glu Thr Leu Gly Pro Ile Thr Leu Ser Glu Gly Gly Ser Ser180 185 190Thr Met Thr Leu Val Cys Gly Thr Asp Gly Lys Pro Val Pro Pro Asp195 200 205Pro Lys Gln Val Cys Ser Gly Thr Thr Val Lys Asp Cys Lys Ala Lys210 215 220Pro Phe Thr Asp Val Phe Pro Lys Phe Ser Ala Asp Trp Trp Gln Gly225 230 235 240Lys Pro Asp Thr Lys Asp Gly Ala Lys Leu Thr Ile Lys Lys Gly Ala245 250 255Phe Pro Pro Lys Glu Glu Lys Phe Thr Leu Gly Cys Lys Ser Val Ser260 265 270Ser Pro Glu Val Tyr Cys Thr Val Gln Val Glu Ala Glu Arg Ala Ser275 280 285Ala Gly Ile Lys Ser Ser Ala Glu Asn Val Gly Arg Val Ser Leu Phe290 295 300Ala Val Thr Ile Gly Leu Val Gly Ser Ile Ala Ala Gly Val Ala305 310 315<210>8<211>2069<212>DNA<213><220><221>CDS<222>(138)..(1520)<400>8tcaatccttt cccgtgctaa cttgtaaaat cgctgctttc gttggttggt tttgtttcac 60gtggctgtta agaggtcgac gcagctgttt aacccgtgcc cctggttctc caggtgatct 120gcatcggatt tgcaaag atg ggc cag tcg gtg gtt ttc gtc atg ctt ttg 170Met Gly Gln Ser Val Val Phe Val Met Leu Leu1 5 10tcg gta ara ttt acc gct ggg gca aaa aca tac gga gaa gcg tcg caa218Ser Val Ile Phe Thr Ala Gly Ala Lys Thr Tyr Gly Glu Ala Ser Gln15 20 25cca tcg gcc tca gca cgt tcg tta cag ggg gcc ctc gat aca tgg tgc266Pro Ser Ala Ser Ala Arg Ser Leu Gln Gly Ala Leu Asp Thr Trp Cys30 35 40cag gag gtt ttt aaa aaa ctg tgc gat gac gga tat tca aaa atg tgt314Gln Glu Val Phe Lys Lys Leu Cys Asp Asp Gly Tyr Ser Lys Met Cys45 50 55att cca gcc aac cag gta gtt gca cga caa ggc ctg ggt aga aaa gac362Ile Pro Ala Asn Gln Val Val Ala Arg Gln Gly Leu Gly Arg Lys Asp60 65 70 75caa caa aag ctc gta tgg cgg tgc tac gat tca gcg gcg ttt ctg gcc410Gln Gln Lys Leu Val Trp Arg Cys Tyr Asp Ser Ala Ala Phe Leu Ala80 85 90gaa ggc gac gaa aac aat gtc ctc agc tgc gtg gac gac tgt ggc gtt458Glu Gly Asp Glu Asn Asn Val Leu Ser Cys Val Asp Asp Cys Gly Val95 100 105tcg ata ccg tgt cct ggc gga gtt gat agg gat aat agt acc cac gct506Ser Ile Pro Cys Pro Gly Gly Val Asp Arg Asp Asn Ser Thr His Ala110 115 120acg cga cat gat gag ctt tcc caa tta atc aag gaa gga gta gtg cgc554Thr Arg His Asp Glu Leu Ser Gln Leu Ile Lys Glu Gly Val Val Arg125 130 135tat tgc agt ggt ttc caa gcg gct gcc aac agc tac tgc aac aaa cga602Tyr Cys Ser Gly Phe Gln Ala Ala Ala Asn Ser Tyr Cys Asn Lys Arg140 145 150 155tat cct ggg act gtt gcg agg aag tcg aag ggc ttc gga cac aag gaa650Tyr Pro Gly Thr Val Ala Arg Lys Ser Lys Gly Phe Gly His Lys Glu160 165 170cca gtt aaa tgg aga tgt tac aag cca gag agc tta tta ttt tcg gtt698Pro Val Lys Trp Arg Cys Tyr Lys Pro Glu Ser Leu Leu Phe Ser Val175 180 185ttt tct gag tgc gtg agt aac tgc gga aca acc tgg tcc tgc cct gga746Phe Ser Glu Cys Val Ser Asn Cys Gly Thr Thr Trp Ser Cys Pro Gly190 195 200gga cga tta ggg aca gcg aca aat cta gac aaa aag cat ttc aca gat794Gly Arg Leu Gly Thr Ala Thr Asn Leu Asp Lys Lys His Phe Thr Asp205 210 215gag tcc ggg att ctc cag gca ctc acc tct gtg ccg aaa gca tgt cca842Glu Ser Gly Ile Leu Gln Ala Leu Thr Ser Val Pro Lys Ala Cys Pro220 225 230 235gta ggc ctt gtt tgc ctc ccg agg gat cag aat ccc ccg gcg tgt tta890Val Gly Leu Val Cys Leu Pro Arg Asp Gln Asn Pro Pro Ala Cys Leu240 245 250gat gat aac ggc aac gtc cca gaa gag gag gga ggg cag ccc gta caa938A5p Asp Asn Gly Asn Val Pro Glu Glu Glu Gly Gly Gln Pro Val Gln255 260 265ccg cgt gsc acg aag ttg ccc gtt gat gat tcg gaa ccg acc gat gaa986Pro Arg Asp Thr Lys Leu Pro Val Asp Asp Ser Glu Pro Thr Asp Glu270 275 280agt gaa act aca cct ggt gga ggt gat gat cag ccg agc cca aaa gag1034Ser Glu Thr Thr Pro Gly Gly Gly Asp Asp Gln Pro Ser Pro Lys Glu285 290 295gac ggg gac aca gac tca cct gat gaa ggt gac cag tcc ggg ggt tca1082Asp Gly Asp Thr Asp Ser Pro Asp Glu Gly Asp Gln Ser Gly Gly Ser300 305 310 315gag tgg tac aaa cag att ccg gaa atc cgt gtc atc ggt gac agc ctg1130Glu Trp Tyr Lys Gln Ile Pro Glu Ile Arg Val Ile Gly Asp Ser Leu320 325 330caa gca atg ctc cac gct ggg cag cag ctg atg gtc acc tat agc tct1178Gln Ala Met Leu His Ala Gly Gln Gln Leu Met Val Thr Tyr Ser Ser335 340 345ccc caa ctc cat gtt agt gtg gga tca tgt cac aaa ctc acg gtg aat1226Pro Gln Leu His Val Ser Val Gly Ser Cys His Lys Leu Thr Val Asn350 355 360ttc tcc gat tat tat ttg tct ttt gac acc acc tca aag tcg ggg tcc1274Phe Ser Asp Tyr Tyr Leu Ser Phe Asp Thr Thr Ser Lys Ser Gly Ser365 370 375gac gaa gtg gaa ctg gac gat gca gcg gga agc gga gag ctc acg ata1322Asp Glu Val Glu Leu Asp Asp Ala Ala Gly Ser Gly Glu Leu Thr Ile380 385 390 395gga ctg gga agc agc ggc cgt gtg act gtt gtc ttc cag tat gcc aca1370Gly Leu Gly Ser Ser Gly Arg Val Thr Val Val Phe Gln Tyr Ala Thr400 405 410aac ggt ggg gga aac aga tat gtt gct tac acc gtc gga gat tct gga1418Asn Gly Gly Gly Asn Arg Tyr Val Ala Tyr Thr Val Gly Asp Ser Gly415 420 425tgc aaa aca att gaa gct gtt ctc ctt cac ggc ctg aat cct gga gcg1466Cys Lys Thr Ile Glu Ala Val Leu Leu His Gly Leu Asn Pro Gly Ala430 435 440aag ctc gtt agg aat acg ata ggc gat aat tct ccg ggt gaa tct gaa1514Lys Leu Val Arg Asn Thr Ile Gly Asp Asn Ser Pro Gly Glu Ser Glu445 450 455ttg taa cgactctttg tgttagtagt agccctccct atacagaatg ggagtgtatt 1570Leu460acattttgtg atcaagggaa gaggagcgat caccacactt gatcacgcgt cgaggtcatt 1630cgtgcggggc tgcagcttta tggtttgatc acgcaagaaa agaagcgcaa cacctgcaag 1690tcgggcatgc gcgagggtcc catccttagt tttttttagt tttttttttg ccttcccgtc 1750cgtccatatt tctcgggtct gtattttcta gcctgagatt ctagcctaga tccaatgcag 1810tatgtcgcct gaagtcatgt taagtggtca gatgtttctg tctcagtgaa gaaaactgtg 1870ttatggtgca ttctgtccga ttttatacgt aattcgtcgt acgttccatt gagttacgtg 1930aggatgcgaa cgcagcaagt gatgtacgac aagttcgtag catggtgaca ctgtagaata 1990caagtgtatt ttacagtcag gcggccggct actacacatt caagctgagt gacgtcgctt 2050caaaaaaaaa aaaaaaaaa 2069<210>9<211>460<212>PRT<213>犬新孢子虫<400>9Met Gly Gln Ser Val Val Phe Val Met Leu Leu Ser Val Ile Phe Thr1 5 10 15Ala Gly Ala Lys Thr Tyr Gly Glu Ala Ser Gln Pro Ser Ala Ser Ala20 25 30Arg Ser Leu Gln Gly Ala Leu Asp Thr Trp Cys Gln Glu Val Phe Lys35 40 45Lys Leu Cys Asp Asp Gly Tyr Ser Lys Met Cys Ile Pro Ala Asn Gln50 55 60Val Val Ala Arg Gln Gly Leu Gly Arg Lys Asp Gln Gln Lys Leu Val65 70 75 80Trp Arg Cys Tyr Asp Ser Ala Ala Phe Leu Ala Glu Gly Asp Glu Asn85 90 95Asn Val Leu Ser Cys Val Asp Asp Cys Gly Val Ser Ile Pro Cys Pro100 105 110Gly Gly Val Asp Arg Asp Asn Ser Thr His Ala Thr Arg His Asp Glu115 120 125Leu Ser Gln Leu Ile Lys Glu Gly Val Val Arg Tyr Cys Ser Gly Phe130 135 140Gln Ala Ala Ala Asn Ser Tyr Cys Asn Lys Arg Tyr Pro Gly Thr Val145 150 155 160Ala Arg Lys Ser Lys Gly Phe Gly His Lys Glu Pro Val Lys Trp Arg165 170 175Cys Tyr Lys Pro Glu Ser Leu Leu Phe Ser Val Phe Ser Glu Cys Val180 185 190Ser Asn Cys Gly Thr Thr Trp Ser Cys Pro Gly Gly Arg Leu Gly Thr195 200 205Ala Thr Asn Leu Asp Lys Lys His Phe Thr Asp Glu Ser Gly Ile Leu210 215 220Gln Ala Leu Thr Ser Val Pro Lys Ala Cys Pro Val Gly Leu Val Cys225 230 235 240Leu Pro Arg Asp Gln Asn Pro Pro Ala Cys Leu Asp Asp Asn Gly Asn245 250 255Val Pro Glu Glu Glu Gly Gly Gln Pro Val Gln Pro Arg Asp Thr Lys260 265 270Leu Pro Val Asp Asp Ser Glu Pro Thr Asp Glu Ser Glu Thr Thr Pro275 280 285Gly Gly Gly Asp Asp Gln Pro Ser Pro Lys Glu Asp Gly Asp Thr Asp290 295 300Ser Pro Asp Glu Gly Asp Gln Ser Gly Gly Ser Glu Trp Tyr Lys Gln305 310 315 320Ile Pro Glu Ile Arg Val Ile Gly Asp Ser Leu Gln Ala Met Leu His325 330 335Ala Gly Gln Gln Leu Met Val Thr Tyr Ser Ser Pro Gln Leu His Val340 345 350Ser Val Gly Ser Cys His Lys Leu Thr Val Asn Phe Ser Asp Tyr Tyr355 360 365Leu Ser Phe Asp Thr Thr Ser Lys Ser Gly Ser Asp Glu Val Glu Leu370 375 380Asp Asp Ala Ala Gly Ser Gly Glu Leu Thr Ile Gly Leu Gly Ser Ser385 390 395 400Gly Arg Val Thr Val Val Phe Gln Tyr Ala Thr Asn Gly Gly Gly Asn405 410 415Arg Tyr Val Ala Tyr Thr Val Gly Asp Ser Gly Cys Lys Thr Ile Glu420 425 430Ala Val Leu Leu His Gly Leu Asn Pro Gly Ala Lys Leu Val Arg Asn435 440 445Thr Ile Gly Asp Asn Ser Pro Gly Glu Ser Glu Leu450 455 460<210>10<211>2278<212>DNA<213>犬新孢子虫<400>10atgggccagt cggtggtttt cgtcatgctt ttgtcggtaa tatttaccgc tggggcaaaa 60acatacggag aaggtaagtc tccagctggt ttgtttgctt tgcaacaccc cccacctgga 120gcgtctcgca actgtagatt gaagaaacta gtggacccgg ttgctggttc ttcaggtacc 180gtagtacatt cattggcaac agtgtagtcc ttttcgcata gtagcaaggc gtcgaactgt 240ttttagtccg gatacaatcg gacgttctgc attgcgtgcg aactgctgtg aggacacctt 300ctgatgcacg gaactgattt tctggatttg tcgggtgttt gcagcgtcgc aaccatcggc 360ctcagcacgt tcgttacagg gggccctcga tacatggtgc caggaggttt ttaaaaaact 420gtgcgatgac ggatattcaa aaatgtgtat tccagccaac caggtagttg cacgacaagg 480cctgggtaga aaagaccaac aaaagctcgt atggcggtgc tacgattcag cggcgtttct 540ggccgaaggc gacgaaaaca atgtcctcag ctgcgtggac gactgtggcg tttcgatacc 600gtgtcctggc ggagttgata gggataatag tacccacgct acgcgacatg atgagctttc 660ccaattaatc aaggaaggag tagtgcgcta ttgcagtggt ttccaagcgg ctgccaacag 720ctactgcaac aaacgatatc ctgggactgt tgcgaggaag tcgaagggct tcggacacaa 780ggaaccagtt aaatggagat gttacaagcc agtaaggagg agctggctag attgcattag 840tctgccctca ccacatcgtc agcgatcgct tcttgtgggg gataggagac atgatcctgg 900gtcgcggaag agatgagcct ggtcctcgtc cgtgttagtg gcagcaaatt aaccccacgg 960aggtggcagg gattatttag catagcgtat gtacgttttc ggtggagggc aggagcacga 1020gataactgta gagatccacg gcctctgtgc ctttccagtt atgttcacac agttttacac 1080tagctgatag cattcacata cgttttacga agttcccgac aaacaccaag aggaaagtgg 1140gggaaatgtt agatttgagg tgcgtactgt tgttgatgtg ttttaggaga gcttattatt 1200ttcggttttt tctgagtgcg tgagtaactg cggaacaacc tggtcctgcc ctggaggacg 1260attaggtgag tttaagattc aggaatagca gaaatagtgc cacgaggtgc agcttcagcc 1320tgtaacgctg cttcttcatc actcgtatcc tggacacccc gagaaaggca tcggattgtt 1380tttcaggatt taccaaacaa acaatgatgc gagtcgagca gttattctgg gatttttttt 1440ctagaatgtg taagccagtt tcaatcgttg gctcatccgg catctttttc ctgttggcgc 1500tcggttactt gcagggacag cgacaaatct agacaaaaag catttcacag atgagtccgg 1560gattctccag gcactcacct ctgtgccgaa agcatgtcca gtaggccttg tttgcctccc 1620gagggatcag aatcccccgg cgtgtttaga tgataacggc aacgtcccag aagaggaggg 1680agggcagccc gtacaaccgc gtgacacgaa gttgcccgtt gatgattcgg aaccgaccga 1740tgaaagtgaa actacacctg gtggaggtga tgatcagccg agcccaaaag aggacgggga 1800cacagactca cctgatgaag gtgaccagtc cgggggttca gagtggtaca aacagattcc 1860ggaaatccgt gtcatcggtg acagcctgca agcaatgctc cacgctgggc agcagctgat 1920ggtcacctat agctctcccc aactccatgt tagtgtggga tcatgtcaca aactcacagt 1980gaatttctcc gattattatt tgtcttttga caccacctca aagtcggggt ccgacgaagt 2040ggaactggac gatgcagcgg gaagcggaga gctcacgata ggactgggaa gcagcggccg 2100tgtgactgtt gtcttccagt atgccacaaa cggtggggga aacagatatg ttgcttacac 2160cgtcggagat tctggatgca aaacaattga agctgttctc cttcacggcc tgaatcctgg 2220agcgaagctc gttaggaata cgataggcga taattctccg ggtgaatctg aattgtaa 2278<210>11<211>4242<212>DNA<213>犬新孢子虫<400>11cgggaattcg attccagccg agttcgtgtt cagacgtgta cgccacccac ggtacaattt 60attcagggga gagaaaaaga agtcgcggca aaaacataaa gctcttcggc agttcaacga 120tgaaactgca aattaatgaa atgatttaaa ctaatcccag cgcagaacgg agttgcaata 180accttccgac agagacgcac cggaggacct gggaaccgat ccgaaatgag acgaggacag 240caacttgaga cggctcattg cgtcgcaact gtgtttgcgt aaccgctgcg agcagttccg 300ccagcccatg agtgggatgt tcgtgtgctt gggatactag gcggttcacc tgaaaggcgg 360tcgtcccgct cttaagagcc gccgcgcaac agccgaagcg ctagggaccg ttggtctacc 420atcgccccat cgctcatgaa ctctagtggg gagagcgtca gctccgcaac aggtcgtgta 480tctggaggct acagtgagcg tcgcatttca ctcgccagta ctagcagcct tggcctttgg 540tagcgttgcg atggcctatg ccagtgcgag cgcgctaaac tactggcagt agacacacca 600tctggtgagc tctycctatg tctaaaacgt gaagatgagc gcgtgtgtgc ggatgacaga 660ggtatcaaga catctgtcag gtagaaattt tcttttaaca gttgaacaat cgtttcgtga 720ctctctggtg gtctgtctgt gtactagatg tactctttcc caagccgctc gaggaacata 780cgtgaagcac ggtggtactt cctgtagcaa aacatagcag gtaaaggtga tgtggttcga 840aactgcagtg tgtactgtac tttggggggt ggcgcacggt tgggcacgcc catttgctag 900gggttcgggg aagggaaggg tgtgtggttg acggtttatc atcagagaaa ctggagtggg 960gacaagatta taatacgtca agctgcaagc cgctgtagtt ggagaaagct gtttttgagg 1020ggcatacttg tttgcgcgga tgatgtacgt atttcaccta aacatgttga aatacgctcg 1080ctgagaaacg gaggcaaaat tcaggaggaa tggggaaggg tacccgtatg gtgagcacgc 1140gttgcaaaag cacaagtagg agaacacgcg acatagaaca actcggcggc catgtgtgta 1200aacggcatta acggatgttt ccacccttac acactctcga tgcgtgggac aatggagtcg 1260atgaaaacga tgcatggttt ggttgcatga ctgtgcgcag cacaatggcg ttcggacgag 1320gcaagagggg actgcacgct gcagtcatct taggcttctt tgtcctcctc gccacatcat 1380ctgtaggatt gggccaaagg tgagtcaaag catgacgtgt tttgctacgt gtaggaacag 1440cacgttgcgg ttcgaccact tgctcagtag ggtcatgcaa cactttgtgc tgattcaact 1500ggtgtgcagg gtgcctcgct acccaagtgt ggagtcactc gaagaaagag ttgccgaggc 1560tctagggcgc cgtagctccg cagcggccag tacccttcca gggagtgaca cgaacatgat 1620atcagatggt cgcgcaggca gggatgaacc aacagcgagc ccagagcatc attccgtgga 1680cgctccgacc acgtctgggg aaggcgaggc agatgctggg aaagtaacgc tgaggaacga 1740tgagggcctt gagggtaata tctcagccga cca5gttcta catccccctc ctgacagtga 1800acacgagggt ttgcaggaac cgggcacgac gcatcaggag gcgcaagaac cagacgcgag 1860tgaagcaatg gactcttccg cgctaccact ttccacgtcg ggtaccacat cctaacgaag 1920tcggttcaac accaggaaca gcgctgcctg ccccgatttt tagcattcca gagctctcac 1980cggaggaagt tgtctacgtt ttacgggttc agggatcagg cgattccgaa attagtttcc 2040aagtaggccg ggtggtgagg cagttggaag ccatcaagag agcatacagg gaggctcacg 2100ggaagctaga agctgaggag ctggagtcgg aaaggggacc gacggtttcg actcggacga 2160aactagttga ctttatcaaa gaaaaccaga gacggctgag ggcggcgttt cagaaggtta 2220agattcagca aaagttggag gagatcgagg aactgttgca gctgtcacac gcactaaaat 2280ctctaggtgc ccgcctgaga ccctgccaaa aaagtaattc cccaatggag gaagagattt 2340gtcgtaagac gaaagctttg ggcgaaatgg ttgcccagaa agcggaggat cttcgtcagc 2400atgcgtcaac tgtctcggct ctgctaggtc gcgaagctgt tgagagacag ttgcggcgtg 2460tcgacagtga acaaccctat gaacaaacag acgccggggt tgcagccaga gcagaggaat 2520ttcggaaggc actggagaaa gcagcttccg gtgcgagaca attcgtgggg accacagcgg 2580acgaaatagt ggaggaagtg aaggaggatg ctcagtacct gcgtgatggt gcgaaagaag 2640tgttgacgaa gagccagcgc gcgctagtag acgcgtttca ggcgacccaa agggctctac 2700tggaggcgaa ggcaaaggag ctcgtagatg ccgcatcaaa ggaagctgaa gacgctcgta 2760agatcttagc ggaacagcca gcgtgattcg ccgaggacga agttggtaat gcacggtgaa 2820tgagggttgg tcatcccaat ccccagcttg atagcgtcac gtgggttttt cgccggggaa 2880acgatcatta gggaggtgat gtatcgcagt aaacatgggc atatcagcac cagttttttt 2940acatgtgagg gatgggatcc agtgtaggtg taagggacag ctgtctttca aatttgggct 3000tcggttgccg ctcccgttct ttcagcatat gtacaggtat gtacagtgaa taagtgcgtg 3060ggccaatgtg ctctcatcaa tcatgtacag aacatatgtt ttggtcatat ctatgcagcg 3120cctgcatgag cccatgccgc tcgtgtttta cgaagccaga tgcggtgccg ccctgtccca 3180gctacacatg ctgtgcacgg ggaacaacgg ccatgttgga aaagtcactg ttttataaat 3240gattgacaac taatgaaaaa gcactcaagc gggaaatgtt tcatgcggtc caaagagcag 3300gggggaaagt cactgtttta taaatgattg tgacaactat ctaatgaaaa agcactcaag 3360cgggaaatgt ttcatgcggt ccaaagagta gggggcgggc gtggtactga tgattaccgc 3420gtaacaatga ccacgccggc gcagatgtcg cagtgctgta gcgtttgatg ttcttttgta 3480tggcggaagg gtgacaaggc aaacggcgag agtcgactta cagactcacc accgggcaac 3540catcggttcc caggtcaata agctggacta ttgtcagcag atgcgatgat aacgcgtgcc 3600atacataaag agcgtacccg tgctagttaa agatgcgcac gcggttctgt tggcagaggt 3660cggaggcttg cctcatggag caaccgaggg ggcgcagttc tgtcttcgtg tcttccgttt 3720gtgtgtttga gaacgaacag atacggcgta tgtgcttgcc ttggtcacag ggagctcacc 3780acaaagcccg tgtagtcggg ggagtactgc tggacacagt ggcgagaata cgcgtgatca 3840atgccggcaa tagagaaatc ggcatgaaat tgtgtagcgg atggcgttct gtatgtcgta 3900caagcgaccc tggatcgtgt gtacccccct acgggcgggc tgccctgtga aggcaatata 3960aaatgtaatc caatgattcg ttttcatgtt acaccagata ttcttaggac gatggtactg 4020accatactag catctgagta gtagtctctc ggtgttcggt ggccaatcta cgactctagc 4080aatgggttcc ctctctaccc taggttccgt agtgtgggca catcacatga tgactgtcga 4140tccagaaatt gatacacgtg catgcttctc agctatgaca attatgattg ctattcctac 4200agcagccaac cggatccgaa ttcttcgccc tatagtgaag tc4242<210>12<211>1892<212>DNA<213>犬新孢子虫<220><221>CDS<222>(122)..(1381)<400>12gaacaatcgt ttcgtgactctc tggtggtc tgtctgtgta ctagatgtac tctttcccaa 60gccgctcgag gaacatacgt gaagcacggt ggtacttcct gtagcaaaac atagcagcac 120a atg gcg ttc gga cga ggc aag agg gga ctg cac gct gca gtc atc tta 169Met Ala Phe Gly Arg Gly Lys Arg Gly Leu His Ala Ala Val Ile Leu1 5 10 15ggc ttc ttt gtc ctc ctc gcc aca tca tct gta gga ttg ggc caa agg217Gly Phe Phe Val Leu Leu Ala Thr Ser Ser Val Gly Leu Gly Gln Arg20 25 30gtg cct cgc tac cca agt gtg gag tca ctc gaa gaa aga gtt gcc gag265Val Pro Arg Tyr Pro Ser Val Glu Ser Leu Glu Glu Arg Val Ala Glu35 40 45gct cta ggg cgc cgt agc tcc gca gcg gcc agt act ctt cca ggg agt313Ala Leu Gly Arg Arg Ser Ser Ala Ala Ala Ser Thr Leu Pro Gly Ser50 55 60gac acg aac atg ata tca gat ggt cgc gca ggc agg gat gaa cca aca361Asp Thr Asn Met Ile Ser Asp Gly Arg Ala Gly Arg Asp Glu Pro Thr65 70 75 80gcg agc cca gag cat cat tcc gtg gac gct ccg acc acg tct ggg gaa409Ala Ser Pro Glu His His Ser Val Asp Ala Pro Thr Thr Ser Gly Glu85 90 95ggc gag gca gat gct ggg aaa gta acg ctg agg aac gat gag ggc ctt457Gly Glu Ala Asp Ala Gly Lys Val Thr Leu Arg Asn Asp Glu Gly Leu100 105 110gag ggt aat atc tca gcc gac cat gtt cta cat ccc cct cct gac agt505Glu Gly Asn Ile Ser Ala Asp His Val Leu His Pro Pro Pro Asp Ser115 120 125gaa cac gag gtc ggt tca aca cca gga aca gcg ctg cct gcc ccg att553Glu His Glu Val Gly Ser Thr Pro Gly Thr Ala Leu Pro Ala Pro Ile130 135 140ttt agc att cca gag ctc tca ccg gag gaa gtt gtc tac gtt tta cgg601Phe Ser Ile Pro Glu Leu Ser Pro Glu Glu Val Val Tyr Val Leu Arg145 150 155 160gtt cag gga tca ggc gat ttc gaa att agt ttc caa gta ggc cgg gtg649Val Gln Gly Ser Gly Asp Phe Glu Ile Ser Phe Gln Val Gly Arg Val165 170 175gtg agg cag ttg gaa gcc atc aag aga gca tac agg gag gct cac ggg 697Val Arg Gln Leu Glu Ala Ile Lys Arg Ala Tyr Arg Glu Ala His Gly180 185 190aag cta gaa gct gag gag ctg gag tcg gaa agg gga ccg acg gtt tcg 745Lys Leu Glu Ala Glu Glu Leu Glu Ser Glu Arg Gly Pro Thr Val Ser195 200 205act cgg acg aaa cta gtt gac ttt atc aaa gaa aac cag aga cgg ctg 793Thr Arg Thr Lys Leu Val Asp Phe Ile Lys Glu Asn Gln Arg Arg Leu210 215 220agg gcg gcg ttt cag aag gtt aag att cag caa aag ttg gag gag atc 841Arg Ala Ala Phe Gln Lys Val Lys Ile Gln Gln Lys Leu Glu Glu Ile225 230 235 240gag gaa ctg ttg cag ctg tca cac gca cta aaa tct cta ggt gcc cgc 889Glu Glu Leu Leu Gln Leu Ser His Ala Leu Lys Ser Leu Gly Ala Arg245 250 255ctg aga ccc tgc caa aaa agt aat tcc cca atg gag gaa gag att tgt 937Leu Arg Pro Cys Gln Lys Ser Asn Ser Pro Met Glu Glu Glu Ile Cys260 265 270cgt aag acg aaa gct ttg ggc gaa atg gtt gcc cag aaa gcg gag gat 985Arg Lys Thr Lys Ala Leu Gly Glu Met Val Ala Gln Lys Ala Glu Asp275 280 285ctt cgt cag cat gcg tca act gtc tcg gct ctg cta ggt cgc gaa gct 1033Leu Arg Gln His Ala Ser Thr Val Ser Ala Leu Leu Gly Arg Glu Ala290 295 300gtt gag aga cag ttg cgg cgt gtc gac agt gaa caa ccc tat gaa caa 1081Val Glu Arg Gln Leu Arg Arg Val Asp Ser Glu Gln Pro Tyr Glu Gln305 310 315 320aca gac gcc ggg gtt gca gcc aga gca gag gaa ttt cgg aag gca ctg 1129Thr Asp Ala Gly Val Ala Ala Arg Ala Glu Glu Phe Arg Lys Ala Leu325 330 335gag aaa gca gct tcc ggt gcg aga caa ttc gtg ggg acc aca gcg gac 1177Glu Lys Ala Ala Ser Gly Ala Arg Gln Phe Val Gly Thr Thr Ala Asp340 345 350gaa ata gtg gag gaa gtg aag gag gat gct cag tac ctg cgt gat ggt 1225Glu Ile Val Glu Glu Val Lys Glu Asp Ala Gln Tyr Leu Arg Asp Gly355 360 365gcg aaa gaa gtg ttg acg aag agc cag cgc gcg cta gta gac gcg ttt 1273Ala Lys Glu Val Leu Thr Lys Ser Gln Arg Ala Leu Val Asp Ala Phe370 375 380cag gcg atc caa agg gct cta ctg gag gcg aag gca aag gag ctc gta1321Gln Ala Ile Gln Arg Ala Leu Leu Glu Ala Lys Ala Lys Glu Leu Val385 390 395 400gat gcc gca tca aag gaa gct gaa gac gct cgt aag arc tta gcg gaa1369Asp Ala Ala Ser Lys Glu Ala Glu Asp Ala Arg Lys Ile Leu Ala Glu405 410 415cag cca gcg tga ttcgccgagg acgaagttgg taatgcacgg tgaatgaggg1421Gln Pro Ala420ttggtcatcc caatccccag cttgatagcg tcacgtgggt ttttcgccgg ggaaacgatc 1481attagggagg tgatgtatcg cagtaaacat gggcatatca gcaccagttt ttttacatgt 1541gagggatggg atccagtgta ggtgtaaggg acagctgtct ttcaaatttg ggcttcggtt 1601gccgctcccg ttctttcagc atatgtacag gtatgtacag tgaataagtg cgtgggccaa 1661tgtgctctca tcaatcatgt acagaacata tgttttggtc atatctatgc agcgcctgca 1721tgagcccatg ccgctcgtgt tttacgaagc cagatgcggt gccgccctgt cccagctaca 1781catgctgtgc acggggaaca acggccatgt tggaaaagtc actgttttat aaatgattga 1841caactaatga aaaagcactc aagcgggaaa tgtttcatgc ggtccaaaga g 1892<210>13<211>419<212>PRT<213>犬新孢子虫<400>13Met Ala Phe Gly Arg Gly Lys Arg Gly Leu His Ala Ala Val Ile Leu1 5 10 15Gly Phe Phe Val Leu Leu Ala Thr Ser Ser Val Gly Leu Gly Gln Arg20 25 30Val Pro Arg Tyr Pro Ser Val Glu Ser Leu Glu Glu Arg Val Ala Glu35 40 45Ala Leu Gly Arg Arg Ser Ser Ala Ala Ala Ser Thr Leu Pro Gly Ser50 55 60Asp Thr Asn Met Ile Ser Asp Gly Arg Ala Gly Arg Asp Glu Pro Thr65 70 75 80Ala Ser Pro Glu His His Ser Val Asp Ala Pro Thr Thr Ser Gly Glu85 90 95Gly Glu Ala Asp Ala Gly Lys Val Thr Leu Arg Asn Asp Glu Gly Leu100 105 110Glu Gly Asn Ile Ser Ala Asp His Val Leu His Pro Pro Pro Asp Ser115 120 125Glu His Glu Val Gly Ser Thr Pro Gly Thr Ala Leu Pro Ala Pro Ile130 135 140Phe Ser Ile Pro Glu Leu Ser Pro Glu Glu Val Val Tyr Val Leu Arg145 150 155 160Val Gln Gly Ser Gly Asp Phe Glu Ile Ser Phe Gln Val Gly Arg Val165 170 175Val Arg Gln Leu Glu Ala Ile Lys Arg Ala Tyr Arg Glu Ala His Gly180 185 190Lys Leu Glu Ala Glu Glu Leu Glu Ser Glu Arg Gly Pro Thr Val Ser195 200 205Thr Arg Thr Lys Leu Val Asp Phe Ile Lys Glu Asn Gln Arg Arg Leu210 215 220Arg Ala Ala Phe Gln Lys Val Lys Ile Gln Gln Lys Leu Glu Glu Ile225 230 235 240Glu Glu Leu Leu Gln Leu Ser His Ala Leu Lys Ser Leu Gly Ala Arg245 250 255Leu Arg Pro Cys Gln Lys Ser Asn Ser Pro Met Glu Glu Glu Ile Cys260 265 270Arg Lys Thr Lys Ala Leu Gly Glu Met Val Ala Gln Lys Ala Glu Asp275 280 285Leu Arg Gln His Ala Ser Thr Val Ser Ala Leu Leu Gly Arg Glu Ala290 295 300Val Glu Arg Gln Leu Arg Arg Val Asp Ser Glu Gln Pro Tyr Glu Gln305 310 315 320Thr Asp Ala Gly Val Ala Ala Arg Ala Glu Glu Phe Arg Lys Ala Leu325 330 335Glu Lys Ala Ala Ser Gly Ala Arg Gln Phe Val Gly Thr Thr Ala Asp340 345 350Glu Ile Val Glu Glu Val Lys Glu Asp Ala Gln Tyr Leu Arg Asp Gly355 360 365Ala Lys Glu Val Leu Thr Lys Ser Gln Arg Ala Leu Val Asp Ala Phe370 375 380Gln Ala Ile Gln Arg Ala Leu Leu Glu Ala Lys Ala Lys Glu Leu Val385 390 395 400Asp Ala Ala Ser Lys Glu Ala Glu Asp Ala Arg Lys Ile Leu Ala Glu405 410 415Gln Pro Ala<210>14<211>20<212>DNA<213>犬新孢子虫<400>14aattaaccct cactaaaggg20<210>15<211>22<212>DNA<213>犬新孢子虫<400>15gtaatacgac tcactatagg gc 22<210>16<211>20<212>DNA<213>犬新孢子虫<400>16gccgcgactt ctttttctct20<210>17<211>20<212>DNA<213>犬新孢子虫<400>17ctcgatcgcc tcctttactg 20<210>18<211>20<212>DNA<213>犬新孢子虫<400>18tgctagtact ggcgagtgaa 20<210>19<211>20<212>DNA<213>犬新孢子虫<400>19caggtttgcc acacattttt 20<210>20<211>21<212>DNA<213>犬新孢子虫<400>20atgtttcctc ctcgggcagt g 21<210>21<211>23<212>DNA<213>犬新孢子虫<400>21tcacgcgacg ccagccgcta tcg 23<210>22<211>20<212>DNA<213>犬新孢子虫<400>22gccctgacaa ttcgaccgcc 20<210>23<211>21<212>DNA<213>犬新孢子虫<400>23cccacaacat ccaagtcgtt c 21<210>24<211>20<212>DNA<213>犬新孢子虫<400>24gttttgcacc atccttagtg 20<210>25<211>19<212>DNA<213>犬新孢子虫<400>25gagagtttgc tttgcaccg19<210>26<211>21<212>DNA<213>犬新孢子虫<400>26ccagccgagt tcgtgttcag a 21<210>27<211>24<212>DNA<213>犬新孢子虫<400>27caacgtggat ccgattcaag cttc 24<210>28<211>20<212>DNA<213>犬新孢子虫<400>28aaagctcttc ggcagttcaa 20<210>29<211>18<212>DNA<213>犬新孢子虫<400>29ccgcgctacc actttcca 18<210>30<211>18<212>DNA<213>犬新孢子虫<400>30gtaatacgac tcactata 18<210>31<211>19<212>DNA<213>犬新孢子虫<400>31ccgcaacgtg ctgttccta19<210>32<211>18<212>DNA<213>犬新孢子虫<400>32catcagagaa actggagt 18<210>33<211>24<212>DNA<213>犬新孢子虫<400>33ggccaagctt gctagtactg gcga 24<210>34<211>31<212>DNA<213>犬新孢子虫<400>34atccaatgca tcttgctgaa tgccttaaaa g3权利要求
1．包含编码新孢子虫GRA1蛋白之核苷酸序列的分离的多核苷酸分子，所说的核苷酸序列选自下列成员SEQ ID NO:1中从大约nt205至大约nt777的开放阅读框(ORF)的核苷酸序列，SEQ ID NO:3中从大约nt605至大约nt1304的ORF的核苷酸序列，和质粒pRC77(ATCC209685)的编码GRA1的ORF的核苷酸序列。
2．权利要求1的一种分离的多核苷酸分子，其包含SEQ ID NO:1或SEQ ID NO:3的核苷酸序列。
3．包含与权利要求1的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。
4．包含编码一种多肽的核苷酸序列的一种分离的多核苷酸分子，所说的多肽同源于包含SEQ ID NO:2的氨基酸序列的多肽。
5．由一种核苷酸序列组成的一种分离的多核苷酸分子，所说的核苷酸序列是权利要求1,3或4的多核苷酸分子的核苷酸序列的基本部分。
6．包含选自下列一组中的核苷酸序列的一种分离的多核苷酸分子SEQ ID NO:1中从大约nt1至大约nt204、SEQ ID NO:1中从大约nt778至大约nt1265,SEQ ID NO:3中从大约nt1至大约nt604,SEQ ID NO:3中从大约nt1305至大约nt1774，及其基本部分。
7．包含编码新孢子虫GRA2蛋白的核苷酸序列的一种分离的多核苷酸分子，所说的核苷酸序列选自下列成员SEQ ID NO:4中从大约nt25至大约nt660的ORF的核苷酸序列，和质粒pRC5(ATCC209686)的编码GRA2的ORF的核苷酸序列。
8．权利要求7的一种分离的多核苷酸分子，其包含SEQ ID NO:4的核苷酸序列。
9．包含与权利要求7的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。
10．包含编码一种多肽的核苷酸序列的一种分离的多核苷酸分子，所说的多肽同源于包含SEQ ID NO:5的氨基酸序列的多肽。
11．由一种核苷酸序列组成的一种分离的多核苷酸分子，所说的核苷酸序列是权利要求7、9或10的多核苷酸分子的核苷酸序列的基本部分。
12．包含选自下列一组中的核苷酸序列的一种分离的多核苷酸分子SEQ ID NO:4从大约nt1至大约nt24,SEQ ID NO:4从大约nt661至大约nt1031，和其基本部分。
13．包含编码新孢子虫SAG1蛋白的核苷酸序列的一种分离的多核苷酸分子，所说的核苷酸序列选自下列成员SEQ ID NO:6中从大约nt130至大约nt1089的ORF的核苷酸序列，和质粒pRC102(ATCC209687)的编码SAG-1的ORF的核苷酸序列。
14．权利要求13的一种分离的多核苷酸分子，其包含SEQ ID NO:6的核苷酸序列。
15．包含与权利要求13的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。
16．包含编码一种多肽的核苷酸序列的一种分离的多核苷酸分子，所说的多肽同源于包含SEQ ID NO:7的氨基酸序列的多肽。
17．由一种核苷酸序列组成的一种分离的多核苷酸分子，所说的核苷酸序列是权利要求13、15或16的多核苷酸分子的核苷酸序列的基本部分。
18．包含选自下列一组中的核苷酸序列的一种分离的多核苷酸分子SEQ ID NO:6从大约nt1至大约nt129,SEQ ID NO:6从大约nt1090至大约nt1263，和其基本部分。
19．包含编码新孢子虫MIC1蛋白的核苷酸序列的一种分离的多核苷酸分子，所说的核苷酸序列选自下列成员SEQ ID NO:8中从大约nt138至大约nt1520的ORF的核苷酸序列，SEQ ID NO:10的ORF的核苷酸序列，和质粒pRC340(ATCC209688)的编码MIC1的ORF的核苷酸序列。
20．权利要求19的一种分离的多核苷酸分子，其包含SEQ ID NO:8或SEQ ID NO:10的核苷酸序列。
21．包含与权利要求19的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。
22．包含编码一种多肽的核苷酸序列的一种分离的多核苷酸分子，所说的多肽同源于包含SEQ ID NO:9的氨基酸序列的多肽。
23．由一种核苷酸序列组成的一种分离的多核苷酸分子，所说的核苷酸序列是权利要求19、21或22的多核苷酸分子的核苷酸序列的基本部分。
24．包含选自下列一组中的核苷酸序列的一种分离的多核苷酸分子SEQ ID NO:8从大约nt1至大约nt137,SEQ ID NO:8从大约nt1521至大约nt2069，和其基本部分。
25．包含编码新孢子虫MAG1蛋白的核苷酸序列的一种分离的多核苷酸分子，所说的核苷酸序列选自下列成员SEQ ID NO:11中从大约nt1305至大约nt2786的ORF的核苷酸序列，SEQ ID NO:12中从大约nt122至大约nt1381的ORF的核苷酸序列，和质粒bd304(ATCC203413)的编码MAG1的ORF的核苷酸序列。
26．权利要求25的一种分离的多核苷酸分子，其包含SEQ ID NO:11或SEQ ID NO:12的核苷酸序列。
27．包含与权利要求25的多核苷酸分子的核苷酸序列同源的核苷酸序列的一种分离的多核苷酸分子。
28．包含编码一种多肽的核苷酸序列的一种分离的多核苷酸分子，所说的多肽同源于包含SEQ ID NO:13的氨基酸序列的多肽。
29．由一种核苷酸序列组成的一种分离的多核苷酸分子，所说的核苷酸序列是权利要求25、27或28的多核苷酸分子的核苷酸序列的基本部分。
30．包含选自下列一组中的核苷酸序列的一种分离的多核苷酸分子SEQ ID NO:11中从大约nt1至大约nt1304、SEQ ID NO:11中从大约nt2787至大约nt4242、SEQ ID NO:12中从大约nt1至大约nt121、SEQ ID NO:12中从大约nt1382至大约nt1892，和其基本部分。
31．一种分离的多核苷酸分子，其包含SEQ ID NO:11中从大约nt127至大约nt703的核苷酸序列。
32．选自含SEQ ID NO:14至26和28至34及其互补物之组的寡核苷酸分子。
33．包含下述多核苷酸分子的重组载体(a)含有编码犬新孢子虫GRA1、GRA2、SAG1、MIC1和MAG1蛋白的核苷酸序列的多核苷酸分子；(b)含有与(a)中所述核苷酸序列同源的核苷酸序列的多核苷酸分子；或者由作为(a)或(b)所述核苷酸序列的基本部分的核苷酸序列组成的多核苷酸分子。
34．权利要求33的重组载体，其选自于质粒pRC77(ATCC209685)、质粒pRC5(ATCC209686)、质粒pRC102(ATCC209687)、质粒pRC340(ATCC209688)和质粒bd304(ATCC203413)。
35．权利要求33的重组载体，其还包含含有编码载体或融合对象之核苷酸序列的多核苷酸分子，从而使重组载体的表达导致产生融合蛋白，所说的融合蛋白含有融合到由权利要求33的重组载体编码的多肽上的载体或融合对象。
36．包含权利要求33、34或35的重组载体的被转化的宿主细胞。
37．选自下列一组中的已基本纯化或分离的多肽(a)犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAGI蛋白；(b)具有与犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白同源的氨基酸序列的多肽；(c)由犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白或与之同源的多肽的基本部分组成的多肽；(d)包含(a)、(b)或(c)的蛋白质或多肽的融合蛋白；以及(e)(a)、(b)、(c)或(d)的蛋白质或多肽的类似物或衍生物。
38．权利要求37的多肽，其中GRA1蛋白含有SEQ ID NO:2的氨基酸序列；GRA2蛋白含有SEQ ID NO:5的氨基酸序列；SAG1蛋白含有SEQ ID NO:7的氨基酸序列；MIC1蛋白含有SEQ ID NO:9的氨基酸序列；MAG1蛋白含有SEQ ID NO:13的氨基酸序列。
39．与选自于GRA1、GRA2、SAG1、MIC1和MAG1的犬新孢子虫蛋白特异性反应的分离的抗体。
40．包含可用于新孢子虫基因失活的多核苷酸分子的遗传构建体，其包含(a)具有本来与编码犬新孢子虫GRA1、GRA2、SAG1、MIC1或MAG1蛋白的核苷酸序列相同的核苷酸序列、或者具有所说核苷酸序列的基本部分，但该核苷酸序列还包含一个或多个失活突变的多核苷酸分子；或(b)包含天然原位侧接于新孢子虫GRA1、GRA2、MIC1、SAG1或MAG1基因的ORF的核苷酸序列的多核苷酸分子；这样，用(a)或(b)的遗传构建体转化新孢子虫细胞即导致GRA1、GRA2、MIC1、SAG1或MAG1基因失活。
41．权利要求40的遗传构建体，其还包含一个选择标记。
42．权利要求40的遗传构建体，其中相应基因是由于同源重组过程而失活。
43．经权利要求40的遗传构建体转化而被修饰，使得其内GRA1、GRA2、MIC1、SAG1或MAG1基因或其某种组合被失活的新孢子虫细胞。
44．制备经修饰的新孢子虫细胞的方法，其包括用权利要求40的遗传构建体转化新孢子虫细胞，并选择由于这种转化而表达选自GRA1-、GRA2-、SAG1-、MIC1-或MAG1-的突变表型的被转化细胞。
45．一种抗新孢子虫病的疫苗，其包含免疫有效量的成分，所说的成分包含(a)权利要求37的多肽，(b)包含编码权利要求37之多肽的核苷酸序列的多核苷酸分子，或(c)权利要求43的经修饰的新孢子虫细胞；以及兽医可接受的载体。
46．权利要求45的疫苗，其中被修饰的新孢子虫细胞是活细胞。
47．权利要求45的疫苗，其中被修饰的新孢子虫细胞是已失活的细胞。
48．权利要求45的疫苗，其还含有佐剂或细胞因子。
49．权利要求48的疫苗，其中佐剂选自下列成员RIB1佐剂系统、明矾、矿物质凝胶、水包油乳剂、油包水乳剂、嵌段共聚物、QS-21、SAF-M、AMPHIGEN佐剂、皂苷、Quil A、单磷酸类脂A、Avridine类脂胺佐剂、SEAM62和SEAM1/2。
50．权利要求45的疫苗，其还包含免疫有效量的第二种成分，所述第二种成分能够诱导对抗会给哺乳动物带来痛苦的疾病或病理状况的保护性反应。
51．权利要求50的疫苗，其中第二种成分能够诱导或有助于诱导抗选自下列一组病原体的保护性反应牛疱疹病毒、牛呼吸道合胞病毒、牛病毒性腹泻病毒、副流感病毒Ⅰ、Ⅱ或Ⅲ型、钩端螺旋体、弯曲杆菌、金黄色葡萄球菌、无乳链球菌、支原体、克雷伯氏菌、沙门氏菌、冠形病毒、轮状病毒、狂犬病毒、溶血巴氏杆菌、出血败血性巴氏杆菌、梭状芽胞杆菌、破伤风类毒素、大肠杆菌、隐孢菌、艾美球虫和毛滴虫。
52．制备抗新孢子虫病的疫苗的方法，其包括将免疫有效量的(a)权利要求37的多肽，(b)具有编码权利要求37的多肽的核苷酸序列的多核苷酸分子，或(c)权利要求43的被修饰的新孢子虫细胞与兽医可接受的载体合并。
53．疫苗接种哺乳动物以对抗新孢子虫病的方法，其包括给哺乳动物施用权利要求45的疫苗。
54．用于给哺乳动物接种疫苗以抗新孢子虫病的药盒，其包含一个容器，其中含有免疫有效量的(1)权利要求37的多肽，或(b)包含编码权利要求37的多肽的核苷酸序列的多核苷酸分子，或(c)权利要求43的被修饰的新孢子虫细胞。
55．权利要求54的药盒，其还包含含有兽医可接受的载体或稀释剂的第二个容器。
全文摘要
本发明提供了包含编码犬新孢子虫GRA1、GRA2、MIC1、SAG1和MAG1蛋白之核苷酸序列的多核苷酸分子,以及重组载体、被转化的宿主细胞和重组表达的蛋白质。本发明进一步提供了包含犬新孢子虫的双向GRA1/MAG1启动子之核苷酸序列的多核苷酸分子。本发明进一步提供基于本发明之多核苷酸分子的遗传构建体,该构建体可用来制备被修饰的新孢子虫细胞株系以用于抗新孢子虫病的疫苗中。
文档编号A61P25/00GK1232087SQ9910438
公开日1999年10月20日申请日期1999年3月26日优先权日1998年3月26日
发明者D·A·布雷克, R·A·玛杜拉, B·A·杜尔特施, B·R·克里施南, S·C·约德申请人:辉瑞产品公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D.A.布雷克;R.A.玛杜拉;B.A.杜尔特施;B.R.克里施南;S.C.约德
技术所有人：辉瑞产品公司
我是此专利的发明人

上一篇：含新型颜料的化妆品组合物的制作方法
上一篇：小儿止咳贴的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。