Icam-4的材料和方法

文档序号:976470阅读:442来源:国知局
专利名称:Icam-4的材料和方法
技术领域
概括地说,本发明涉及细胞粘附分子,更具体地说,涉及一种DNA的克隆和表达,该DNA编码一个迄今未知的多肽,此多肽与细胞粘附分子ICAM-1、ICAM-2和ICAM-R具有结构相关性,被定名为ICAM-4。
背景技术
最近十多年的研究已深刻地阐明了参与体内细胞-细胞相互作用的一些分子过程,特别是与免疫系统中细胞的运动和激活有关的过程,近来,又阐明了与神经系统中细胞的发育和正常生理功能有关的过程。一般地,可参阅Springer,自然,346425-434(1990),关于免疫系统的细胞,以及Yoshihara等,神经科学研究,1083-105(1991)和Sonderegger和Rathjen,细胞生物学杂志,1191387-1394(1992),关于神经系统的细胞。细胞表面蛋白质,以及特别是所谓的细胞粘附分子(“CAM”)都已经是药物学研究和开发的对象,作为其目标,它们参与白细胞外渗到炎症部位和运动到远隔的靶组织的过程,以及神经细胞分化和复杂的神经网络的形成过程。对细胞粘附分子的分离和表征,编码这种分子的DNA序列的克隆和表达,以及适合于炎症过程及神经系统发育和发挥功能的治疗药物和诊断试剂,这些也已经是许多美国和国外申请的专利证书的主题。参阅Edwards,当前治疗学专利评论,(Current Opinion in Therapeutic Patents),1(11)1617-1630(1991),特别是其中引用的已发表的“专利文献参考”。
对于本发明背景的主要兴趣在于以前确定和表征的细胞粘附过程中的某些介质,‘白细胞整合蛋白’,LFA-1,MAC-1和gp 150.95(据WHO的命名法原来被分别称为CD18/CD11a,CD18/CD11b和CD18/CD11c)它们构成存在B淋巴细胞,T淋巴细胞,单核细胞和粒细胞上的细胞表面蛋白杂二聚体“整合蛋白”的一个亚科。参阅例如Springer,同上p429的表1。其它一些涉及白细胞激活,粘附,活动性等等伴随炎症过程发生的事件的单键粘附分子(CAM)也是我们的兴趣所在。例如,目前认为,在作为炎症特征的白细胞外渗之前,在白细胞上组成性表达的聚合蛋白的激活过程就已经发生了,并接着发生整合蛋白(例如LFA-1)与一个或两个不同的细胞间粘附分子(ICAM)之间的紧密配体/受体相互作用,这两个粘附分子是表达在血管内皮细胞表面和其它白细胞上的,被称为ICAM-1和ICAM-2。
象迄今已表征的其它CAM一样[例如在1990年11月15日公开的PCT WO 90/13300中所述的血管粘附分子(VCAM-1),以及在Newman等,科学,2471219-1222(1990)和1991年7月25日公开的PCT WO 91/10683中所述的血小板内皮细胞粘附分子(PECAM-1)],ICAM-1和ICAM-2在结构上与免疫球蛋白基因总科(Superfamily)的其它成员同源,其中每种分子的细胞外部分是由具有类似羧基末端基元的许多结构域组成。“典型”的类免疫球蛋白结构域含有一个环形结构,通常是由二个半胱氨酸之间的二硫键在每个环的末端锚定而成。ICAM-1包含5个类免疫球蛋白结构域;ICAM-2由于细胞的分布状态而不同于ICAM-1,包含有2个这样的结构域;PECAM-1包含6个;VCAM包含6个或7个,取决于拼接的变异,等等。此外,CAM典型地包含一个据信是参与分子在细胞表面定向的疏水“跨膜”区,以及一个羧基末端“细胞质”区。CAM动态分布的模型图通常显示,这种分子在跨膜区锚定在细胞膜中,其细胞质“尾巴”伸入到细胞质中,而一个或多个类免疫球蛋白环从细胞表面向外伸出。
许多神经细胞表达带有细胞外类免疫球蛋白结构域的表面受体,该结构域与ICAMs在结构上有相似性。参阅例如,Yoshihara等,同上。除了类Ig结构域之外,神经系统的许多粘附分子在其细胞外结构域还含有衔接重复的类纤维粘附蛋白序列。
已提出细胞间粘连分子的多种治疗应用,包括以ICAM-1结合人鼻病毒的能力为前提的用途。例如,1992年1月29日公开的欧洲专利申请486 257 A,涉及开发ICAM-1的多聚体(multimeric)构型和形式(包括全长度分子形式的被截短的分子形式),它们被认为具有更高的配体/受体结合能力,特别是对病毒,对结合了抗原和病原如恶性疟原虫(plasmodium falciparum)的淋巴细胞的结合。
以类似的方式,已提出了与细胞间粘附分子免疫学相关的蛋白质的多种应用。例如,1991年11月14日公开的WO 91/16928,涉及人化嵌合体抗-ICAM-1抗体以及它们在治疗特异性和非特异性炎症,病毒感染和气喘中的应用。1992年3月19日公开的WO 92/04034中描述了抗ICAM-1抗体及其片段,在治疗内毒素休克中是有用的。1992年4月16日公开的WO 92/06119涉及用抗-ICAM-1抗个体型抗体和抗体片段抑制ICAM-1依赖性炎症应答。
尽管通过对细胞间粘附蛋白如ICAM-1和淋巴细胞相互作用整合蛋白如LFA-1的鉴别和表征,对细胞粘附现象的本质已有所认识,但是对它的描述还远未完成。一般认为,在炎症过程和目标淋巴细胞在体内运行的过程中,还涉及有多种其它的蛋白质。例如,在以下专利中公开了对ICAM-相关蛋白质ICAM-R的克隆和表达美国专利申请序列号07/827,689,07/889,724,07/894,061和08/009,266,以及相应公开的PCT申请WO 93/14776(1993年8月5日公开)。这些专利申请的公开内容在此特别引入作为参考,ICAM-R的DNA的氨基酸序列已在SEQ ID NO.4中列出。已发现这种新的配体可以在人淋巴细胞、单核细胞和粒细胞上表达。
本专利申请特别感兴趣的还在于另一个类ICAM表面分子,它被确定为具有不同于任何已知ICAM分子的组织特异性表达。Mori等,[美国国家科学院院刊(USA)843921-3925(1987)]报导过对家免脑中的一个端脑特异性抗原的确定,发现它特别与单克隆抗体271A6有免疫反应活性。这个表面抗原被命名为端脑素(telencephalin)。Imamura等[神经科学通讯,119118-121(1990)],同一个多克隆抗体测定其定位表达,证实端脑素在猫视觉皮层的表达表现出组织上的差异,还报导说,端脑素的表达是随发育进程而可变的。Oka等,[神经科学3593-103(1990)]随后报导,用单克隆抗体271A6分离出了端脑素。在出版物中报导了该表面分子的分子量大约是500kD,并且该分子是由4个亚单位组成,每个亚单位的天然分子量是130kD,经N-聚糖酶处理后变成大约100kD。Yoshihiro等[神经科学,研究增刊,18,p.S83(1994)]在日本神经科学协会的第十七届年会上(1993,12月7-9日在日本Nagoya召开),以及1993年11月9日在华盛顿特区召开的神经科学协会第二十三届年会上[神经科学协会摘要19(1-3)p.646(1993)],报导了家兔端脑素的cDNA和氨基酸序列。由报告中推导出的氨基酸序列表明,具有9个细胞外类免疫球蛋白(Ig)结构域的130kD端脑素是一个完整的膜蛋白。其远端的八个结构域显示出与其它ICAM的类Ig结构域有同源性。Yoshihare等,在神经元(neuron)12543-553(1994)中也报导了与此相同的结果。
因此,本领域需要继续发现参与人细胞-细胞相互作用的另外一些蛋白质,并且特别需要提供用于根据其氨基酸序列对这些蛋白质进行特异性确定和表征的信息。但是,为了使这些分子达到可以构成开发治疗和诊断药剂基础的程度,有必要对编码它们的DNA进行阐明。尤其需要这样一些基本的信息,它们能用于大批量生产蛋白质,用于对天然产生它们的细胞进行鉴别,以及用于制备抗体物质或其它对其参与的配体/受体结合反应具有特异性激活和/或抑制作用的新颖结合蛋白质的信息。
发明简述本发明一方面提供纯化并分离的多聚核苷酸(例如DNA序列、RNA转录本及其反义寡聚核苷酸),它编码新的多肽“ICAM-4”及其多肽变异体(包括片段缺失、替代和添加的类似物),该多肽及其变异体显示一种或多种对ICAM-4有特异性的配体/受体结合生物学活性和/或免疫学特性。ICAM-4特异性配体/受体结合生物学活性包括ICAM-4的细胞外结构域的细胞质结构域(例如在细胞-细胞的粘附和/或信号的转递过程中)与其它分子的相互作用。本发明的优选DNA序列包括基因组序列和cDNA序列,以及完全或部分化学合成的DNA序列。目前优选的多聚核苷酸如SEQ ID NO1所示,它编码了大鼠ICAM-4。发明人试图获得本发明DNA序列的生物学复制物(即体内或体外制得的分离的DNA序列的拷贝)。本发明还提供自主复制的重组构建体,例如掺入了ICAM-4序列的质粒载体和病毒DNA载体,特别是这样一种载体,其中编码ICAM-4或ICAM-4变异体的DNA是经操作与内源性或外源性表达控制DNA序列连接的。
根据本发明的另一方面,以能使目的多肽在其内表达的方式,用本发明的DNA序列稳定地转化宿主细胞,特别是单细胞宿主细胞如原核细胞和真核细胞。表达这种ICAM-4和ICAM-4变异体产物的宿主细胞可用于各种有用的目的。就此表达的产物而言,它们是“展示”在宿主细胞的表面,所以这种细胞可能构成有价值的免疫原,用于开发与ICAM-4和ICAM-4变异体进行特异性免疫反应的抗体物质。本发明的宿主细胞在用于大批量生产ICAM-4和ICAM-4变异体的方法中特别有用,其中所述细胞生长在适合的培养基中,目的多肽产物可从细胞中或者从细胞生长于其中的培养基中分离出来。
本发明的新的ICAM-4虽然可以作为分离物从天然细胞得到,但是,同ICAM-4变异体产物一道,优选地是通过包括本发明宿主细胞的重组体技术制备。在SEQ ID NO2中列出了ICAM-4多肽的目前优选的氨基酸序列。取决于被选择作为生产重组体的宿主细胞和/或分离后加工过程不同,产物可能以完全或部分地糖基化形式,部分或完全的去糖基化形式或者非糖基化的形式得到。本发明的ICAM-4变异体可能包括水溶性或水不溶性单体、多聚体或环状ICAM-4片段,它们包含有上述列举的一个或多个结构域的全部或一部分,并具有ICAM-4的生物学或免疫学特性,包括例如,对ICAM-4的结合配偶体结合的能力如/或抑制ICAM-4与天然结合配偶体结合的能力。本发明的ICAM-4变异体还可以包括多肽类似物,其中的一个或多个特定的氨基酸被删去或被替代了(1)对特异于ICAM-4的一种或多种生物学活性或免疫学特性没有损失,并优选地增强,(2)特异性地丧失了特殊的配体/受体结合功能。发明人试图构建包含有能促进多聚体形成的其他氨基酸(如赖氨酸或半胱氨酸)残基的多肽类似物。
被本发明包含的还有对ICAM-4或ICAM-4变异体具有特异性(即对于与ICAM-4结构相关的ICAM-1,ICAM-2和ICAM-R细胞间粘附分子无活性)的抗体物质(例如单克隆抗体,多克隆抗体,抗体片段,单链抗体,嵌合抗体,CDR-嫁接抗体等等)和其它结合蛋白质(如多肽和肽)。本发明还包括特异性分泌本发明单克隆抗体的杂交瘤细胞系。本发明优选的杂交瘤细胞包括如下的几种127A、127H、173E、179I和179H。用分离的天然或重组体ICAM-4或ICAM-4变异体,或者用在其表面表达这种产物的细胞,都可形成抗体物质。另外,本发明的结合蛋白质对确定结合位点结构的特征(例如,表位和/或对ICAM-4氨基酸序列中修饰部分的结合特性的敏感度)也是有用的。
组合物形式的结合蛋白质对免疫以及纯化本发明多肽和确定在其表面呈现此多肽的细胞都是有用的。显然,它们对调节(即阻断,抑制或刺激)涉及ICAM-4的配体/受体结合生物学活性也是有用的,特别是对调节那些与特异性和非特异性免疫系统应答有关的ICAM-4效应器功能是有用的。本发明还试图构建对抗ICAM-4抗体物质有特异性的抗个体型抗体,并应用这种抗个体型抗体物质调节免疫反应。用于对细胞表面和体液如血清或脑脊液内的ICAM-4进行检测和定量测定的方法,可能包括例如用单个抗体底物的方法或用多个抗体底物的“夹心”测定方式。在检测体液内的ICAM-4时,本发明的抗体对判断神经病理学疾病的发生也是有用的,因为它可能与循环的ICAM-4的浓度增加相关联。这种神经病理学疾病包括,但不局限于,由各种疾病例如血栓形成,栓塞等等引起的大脑局部缺血(即麻痹)。
本发明的DNA和氨基酸序列的公开所提供的信息的科学价值是显而易见的。作为一组实施例,对ICAM-4的cDNA序列的知识,可用于通过DNA/DNA杂交来分离编码ICAM-4的基因组DNA序列和确定ICAM-4表达控制调节序列如启动子、操纵子等。以本发明的DNA序列和在严格的条件下实施的DNA/DNA杂交方法,预计同样能够分离编码ICAM-4等位变异体的DNA,还能分离编码共同具有一个或多个对ICAM-4特异性的生物学和/或免疫学特性的其他结构相关蛋白质的DNA,以及分离编码与来自其它种类的ICAM-4同源的蛋白质的DNA。本发明的DNAs在DNA/RNA杂交测定中,对测定细胞合成ICAM-4的能力是有用的。通过本发明还能得到与调节通常表达ICAM-4的那些细胞表达ICAM-4相关的反义多聚核苷酸。作为另一组实施例,对ICAM-4的DNA和氨基酸序列的认识,使有可能通过重组方式来产生ICAM-4变异体,例如以ICAM-4蛋白质序列和免疫球蛋白重链恒定区和/或铰链区的存在为特征的杂交融合蛋白(有时被称为“免疫粘附的”)。参阅Capon等,自然,337525-531(1989),Ashkenasi等,P.N.A.S.(USA),8810535-10539(1991),以及1989年4月6日公开的PCT WO 89/02922。ICAM-4变异体融合蛋白还可以包括例如,ICAM-4的特定的细胞外结构域和其它的细胞粘附分子的某些部分。
本发明的DNA还可以用于确定未被翻译的DNA序列,该序列特异性地启动经操作连接于启动子结构域的多聚核苷酸的表达。在例如基因移植的情况下,确定和运用这种启动子序列是特别需要的,在某一限定的神经环境中,基因转移可能特别需要异源性基因表达。本发明还包括含有本发明启动子的载体,以及嵌合基因构建体,其中本发明的启动子经操作连接于一个异源多聚核苷酸序列和一个转录终止信号。
本发明提供的DNA和氨基酸序列信息,还可用于对ICAM-4的结构和功能进行系统的分析,并可对那些在细胞外和细胞内与之相互作用的分子进行确认。本发明的抗ICAM-4单克隆抗体的个体型可代表这种分子的特征,并可以模仿天然结合蛋白(肽和多肽),通过这些天然结合蛋白型,可调节ICAM-4在细胞间和细胞内的活性,或者通过它使ICAM-4可调节细胞间和细胞内的一些过程。另外,它们还可以代表ICAM-4活性的新类型的调节剂。抗个体型抗体本身又可以代表具有生物学活性的一类新型ICAM-4等效物。用于确定调节ICAM-4活性的抗体或其它化合物的体外测定方法可以包括例如,固定化ICAM-4或与ICAM-4结合的天然配体,可测定地标记非固定化的结合配偶体,将这种结合配偶体共同温育,然后测定待测化合物对标记结合量的影响,其中与不存在待测化合物的标记结合量相比较,存在待测化合物的标记结合量减少,表明该待测物是ICAM-4结合抑制剂。
本发明提供的DNA序列信息还可用于通过同源重组或“敲出”(knockout)方案[参阅例如Kapecchi,科学,2441288-1292(1989)],培育不能表达功能性ICAM-4蛋白的啮齿类动物,或表达变异体ICAM-4蛋白的啮齿类动物。这样的啮齿类动物可用作研究ICAM-4和ICAM-4调节剂体内活性的实验模型。
发明详述1993年8月5日提交的母美国专利申请系列号08/102,852公开的内容,被特别引入作为参考。该专利申请的实施例特别涉及如下方面设计和构建用于PCR扩增ICAM相关DNA的寡核苷酸探针;用该探针与编码ICAM-1和ICAM-2的DNA同源,但与之不同的人基因组片段;以该基因组片段筛选cDNA文库,从而分离另外的ICAM-R编码序列;筛选cDNA文库,从而分离出编码ICAM-R的全长度的人cDNA序列;对ICAM-R的DNA和氨基酸序列信息进行表征,特别是与ICAM-1和ICAM-2相关的序列信息;培育表达ICAM-R的哺乳动物宿主细胞;评定ICAM-R参与涉及CD18依赖性途径和CD18非依赖性途径的粘附过程的指标;用ICAM-R诱导的肽抑制细胞对ICAM-R的粘附;表达ICAM-R的变异体;制备和鉴定抗ICAM-R抗体及其片段;绘制被抗ICAM-R单克隆抗体识别的ICAM-R抗原决定部位图谱;确定ICAM-R和编码其RNA的分布状态和生物化学特征;确定在同型细胞-细胞粘附中和在免疫细胞激活/再生过程中的ICAM-R;以及确定ICAM-R的细胞质结构域的不同的磷酸化和细胞骨架联系。还公开了对编码啮齿类ICAM的DNA的鉴定结果,当时看来是人ICAM-R的大鼠同源物,并且用这种DNA构建和表达了编码谷胱甘肽-S-转移酶融合蛋白的DNA。在母专利申请(U.S.S.N.08/102,852)实施例6中,可以找到如何确定这种啮齿类动物DNA的详细描述,并且在此作为实施例1被重新提出。因为多数编码啮齿类动物ICAM的序列已被确定了,显然啮齿类动物ICAM DNA不能编码人ICAM-R的大鼠同源物,但是事实上编码了一种新的多肽,在此被定名为ICAM-4。为了理解确定ICAM-4的经过,提供了时间表,随后是本发明的详细描述。
第一个啮齿类动物基因组ICAM-4序列被确定为编码与人ICAM-R(在此是SEQ ID NO4)的结构域2(在此的SEQ ID NO3和U.S.S.N.08/102,852的SEQ ID NO23)同源的一个区。第二个是重叠的基因组DNA(在此的SEQ ID NO5和U.S.S.N.08/102,852的SEQ ID NO26),也被确定为编码SEQ ID NO3的结构域2和ICAM-1的序列。用SEQ ID NO3作探针,一个啮齿类动物脾cDNA(在此的SEQ ID NO6和U.S.S.N.08/102,852中的SEQ ID NO25)被确定为编码从2到5的结构域以及以前没有被看作是ICAM结构域的第五结构域。此时,这些被新确定的啮齿类动物DNA看来编码一个人类ICAM-R的啮齿类动物同源物,但是要使这些DNA的3’区与其它ICAM匹配被证明是困难的。
随后从大鼠脾细胞文库中分离出的一个1kb cDNA克隆,以及RT-PCR片段的扩增表明,cDNA和基因组克隆的一部分还没有被确定序列。另一个RT-PCR扩增产物(SEQ ID NO7)证实了这个遗漏。已决定从基因组和cDNA克隆中,通过用EcoRI对克隆进行消化,切出177bp的一个片段,以便从λ噬菌体中分离出这些序列,用于DNA测序研究。通过借助这些其它的序列对SEQ ID NOs5和6进行再分析,使有可能对最初分离的基因组和cDNA克隆测定出更精确,更完整的序列,该序列在此如SEQ ID NOs8和9所示以修正的形式给出。
为了确定完整的ICAM-4编码序列,分离出了大鼠脑cDNA(SEOID NO10),并通过cDNA末端(5’RACE)的5’快速扩增来测定5’末端序列,此扩增产物在SEQ ID NO11中列出。综合来自RT-PCR克隆(SEQ ID NO7),脑cDNA(SEQ ID NO10)和RACE扩增产物(SEQ ID NO11)的资料,可以对ICAM-4(SEQ ID NO1)的完整编码序列进行确定。
本发明将通过下列实施例进行说明。更具体地说,实施例1涉及克隆啮齿类动物部分ICAM-4 DNA。实施例2描述对啮齿类动物ICAM-4转录过程的核酸印迹(Northern blot)分析。实施例3描述对全长啮齿类动物ICAM-4 cDNA的分离过程。实施例4涉及在脑组织中啮齿类动物ICAM-4的原位杂交。实施例5涉及在原核生物中产生ICAM-4融合蛋白。实施例6描述对大鼠ICAM-4/GSE融合蛋白有特异性的单克隆抗体的制备。实施例7描述在杆状病毒表达系统中对可溶性大鼠ICAM-4蛋白质的表达。实施例8涉及制备对在杆状病毒系统中表达的大鼠ICAM-4具有特异性的单克隆抗体。实施例9描述对大鼠ICAM-4的表达的免疫细胞化学分析。实施例10涉及对编码人基因组ICAM-4的DNA的克隆。实施例11涉及编码人ICAM-4的cDNA的克隆。实施例12描述对人ICAM-4的表达的核酸印迹分析。实施例13涉及人ICAM-4/GST融合蛋白质的产生。实施例14涉及对人ICAM-4具有免疫特异性的单克隆抗体的制备。实施例15描述建立一种俘获测定法用于测定特定流体中可溶性ICAM-4的浓度。实施例16将这种俘获测定法用于对中风病人血清中的ICAM-4浓度进行测定。实施例17涉及对大鼠癫痫模型中ICAM-4转录的测定。实施例18涉及人ICAM-4的启动子区的克隆。
实施例1大鼠ICAM相关DNA的克隆A.大鼠基因组ICAM相关的结构域2 DNA的分离以一个通过PCR从编码人ICAM-3结构域2的DNA产生的[32P]-标记探针,对在λEMBL 3中构建的大鼠基因组文库进行筛选。该探针的序列被列举在SEQ ID NO12中。将序列文库的噬菌斑转移到Hybond N+尼龙膜上(Amersham,Arlington Heights,IL)。按标准的方法对全部cDNA和基因组序列库进行筛选。在含有40-50%甲酰胺5倍稀释的Denhardt’s位,5倍稀释的SSPE液和1.0%SDS的溶液中,在42℃进行预杂交和杂交过程。加入探针([32P]标记的),使其浓度为每毫升杂交液含105-106cpm。杂交16-18小时之后,将尼龙膜在室温下,在含有0.1%SDS的2X SSPE中彻底清洗,随后在-80℃暴露于X-射线胶片过夜。对阳性噬菌斑作一轮或多轮杂交处理,而得到克隆的噬菌体。将从阳性克隆裂解液制备的DNA亚克隆进入pBS+并进行测序。
对第一个编码大鼠ICAM相关的结构域2的基因组克隆的鉴定结果是,它是与其它ICAM家族成员中的结构域2同源的(参阅例如,美国专利申请系列号08/102,852的表1),但是不同于以前报导的大鼠ICAM-1的核苷酸序列[Kita,等,生物化学生物物理学报,1131108-110(1992)]或小鼠ICAM-2的核苷酸序列[Xu,等,免疫学杂志,1492560-2565(1992)]。在本申请的共未决母申请中,作为表明是大鼠ICAM-R变异体的形式,公开了这个克隆的核酸序列和推导出的氨基酸序列,并分别作为SEQ ID NOs23和24列举在专利U.S.S.N.08/102,852中。在此,同样的这些序列分别列举在SEQ ID NO3和13中。
第二个基因组克隆,是重叠的克隆,也用相同的探针进行了鉴定,测定表明含有SEQ ID NO3的ICAM结构域2序列和编码至少部分大鼠ICAM-1的5’DNA。在本申请的共未决母申请中,作为SEQ IDNO26列举了这个克隆的核酸序列,并在此,作为SEQ ID NO5被列举。此第二个克隆显示,第一个克隆的ICAM-相关的基因片段和编码大鼠ICAM-1的基因,是位于大鼠同一染色体上,彼此不超过5kb。
B.分离大鼠ICAM相关的cDNA为了确定对ICAM-相关多肽的一个较完整的蛋白质编码序列,用编码结构域2序列的,来自在上述A部分(SEQ ID NO3)确定的大鼠基因组克隆的[32P]标记DNA,对大量来自大鼠和小鼠各种细胞类型的cDNA序列文库进行了筛选,细胞类型包括大鼠的巨噬细胞(Clontech,Palo Alto,CA),外周血淋巴细胞(PBL)(Clontech),T细胞(自用构建的)和脾细胞(Clontech),小鼠的PBL(Clontech),T细胞(自用构建的)和B细胞(自用构建的)。
在大鼠脾细胞cDNA序列文库中(Clontech)鉴定出一株克隆,它包含5个类Ig结构域,其中4个是与ICAM-1和ICAM-R中的结构域2到结构域5同源的。但是,这株克隆包含编码近似第5类Ig结构域的3’DNA,这是在任何其它ICAM多肽中,以前尚未被鉴定过的。此外,这个含有特殊3’序列的克隆,随后被测定是位于结构域4和5之间的部分基因内区(以下将论述),这暗示此克隆是一个未成熟的或异常拼接的转录产物。该独特结构域的存在以及测定表明3’区不能适当地与其它已知的ICAM匹配,都暗示ICAM相关的DNA可能编码一个新的大鼠ICAM多肽。此克隆的核酸序列,在本申请的母申请中以SEQ ID NO25被列举出,在此,这个脾细胞cDNA克隆的核酸序列被列举在SEQ IDNO6中。
C.对大鼠cDNA和基因组DNA的再分析在1993年8月5日申请了美国专利申请序列号08/102,852之后,测定表明,在部分的大鼠脾细胞cDNA克隆(母申请中的SEQ ID NO25和在此的SEQ ID NO6)和大鼠肝细胞基因组克隆(母申请的SEQ ID NO26和在此的SEQ ID NO5)中遗漏了一个内部177bp EcoRI片段,它是每个克隆的一部分,但是在亚克隆步骤中丢失了,是在将序列文库插入物借助EcoRI的消化作用从λ载体移出,并连接到一个测序载体上的时候丢失的。观察表明,cDNA和基因组克隆可能遗漏了一个编码片段,显然是由于大鼠基因组序列和cDNA序列能与各种RT-PCR扩增产物相匹配,包括SEQ ID NO7,它在大鼠序列中显示有一个缺漏处。
用脾细胞cDNA克隆(SEQ ID NO6)作为探针,对来源于脾细胞序列文库的cDNA进行后续的分离和序列匹配,提供的第一个指标是,在脾细胞cDNA和基因组克隆的一个区段没有被确定序列。这种想法显然得到了进一步证实根据用5’引物(RRD3 5’Xho,含有5’XhoI限制性位点以促进克隆过程,列举在SEQ ID NO14中),和3’引物(RRD5 3’Hind,含有HindIII位点以促进克隆过程,列举在SEQ IDNO15中),对跨越结构域3到结构域5的RT-PCR片段进行扩增。
GAACTCGAGGCCATGCCTCCACTTTCC(SEQ ID NO14)CCATAAGCTTTATTCCACCGTGACAGCCAC(SEQ ID NO15)这二个DANs序列显然表明,在测序之前cDNA和基因组克隆就已经丢失了一个片段,对RT-PCR DNA测序(下面将要论述)之后,这种想法得到进一步支持。可以得出结论,在测序之前用EcoRI限制性消化除去cDNA和基因组片段,将导致177bp片段的缺失,在用琼脂糖凝胶对来自λ噬菌体序列的克隆进行分离时,不能观察测定出这个片段。随后的序列分析确定了二个EcoRI位点的位置,在二个最初的克隆中,它们位于177bp片段的两侧。
177bp EcoRI片段,在如SEQ ID NO9列举的大鼠部分cDNA克隆中,是位于核苷酸719和896之间,而在如SEQ ID NO8列举的部分基因组克隆中,是位于核苷酸2812和2989之间。
D.通过RT-PCR克隆分离的DNART-PCR被用于对大鼠ICAM相关的基因产生更完整的序列信息。来自基因组克隆(SEQ ID NO3)的序列信息,可用于设计与蛋白编码区的5’区互补的有义引物,如对cDNA克隆的测定所示,并且可用于设计反义引物,它可以被设计成与cDNA克隆(SEQ IDNO6)中的编码序列的3’区到该编码序列互补。
用于PCR反应的模板cDNA按如下方法制备,将从大鼠脾细胞分离的poly A+RNA大约2μg,在10μl体积中,以65℃加热变性。变性处理之后,加入0.1μl RNasin(Invitrogen,San Diego,CA),5μl 5XRTase缓冲液(BRL,Bethesda,MD),2μl随机六聚体(pd(N)6,100μl/ml)(Pharmacia,Piscataway,NJ),6μl dNTPs(各2mM)和2μl AMV RTase(BRL),此反应物在42℃温育60-90分钟。将反应物贮存于-20℃备用。
最初的一系列实验是用于鉴定在用大鼠脾细胞cDNA作模板的PCR反应中,产生扩增产物的寡聚核苷酸引物对。在PCR中,不同的5’有义引物与一个3’引物配对,此引物是被设计成与一个内部的编码序列互补,该3’引物被定名为RRD2 3-1,如SEQ ID NO16所示。
AACGTGCGGAGCTGTCTG(SEQ ID NO16)(在下述最终分离的RT-PCR产物,SEQ ID NO7中,引物RRD23-1对应于核苷酸719到736)。类似的情况是,不同的3’反义引物与一个5’引物配对,此引物是被设计成与另一个内部的编码序列互补,在这些反应中的5’引物被定名为RGen 3900S,并被列举在SEQ IDNO17中。
ACGGAATTCGAAGCCATCAACGCCAGG(SEQ ID NO17)(在下述SEQ ID NO7中,引物RGen 3900S对应于核苷酸1719到1736)。根据扩增产物的分子大小和这些产物与部分cDNA克隆杂交的能力,确定了一对引物是最有效的,并被用于随后的PCR扩增。此5’引物被定名为RGen 780S(SEQ ID NO18),此3’引物被定名为RGen 4550AS(SEQ ID NO19)。
CATGAATTCCGAATCTTGAGTGGGATG(SEQ ID NO18)ATAGAATTCCTCGGGACACCTGTAGCC(SEQ ID NO19)(在下述SEQ ID NO7中,引物RGen 780S对应于核苷酸1到18,引物RGen45 50AS相应于核苷酸2197到2214)。
在各种条件下将此引物对用于PCR,以便得到最佳的扩增。在二个不同的退火温度,运用了总共15个改变pH和Mg++浓度的不同的PCR缓冲液,来自每个反应的产物样品,在1%琼脂糖凝胶上进行分离。因为通过对来自任何反应条件的溴化乙锭染色凝胶的可视性检验,都不能检测出任何扩增产物,所以运用了更灵敏的Southern(DNA)杂交技术来检测PCR产物。
通过电泳将等分量扩增的DNA分离,再用常规的Southern印迹吸附技术将它转移到Hybond N+尼龙膜上,然后与用[32P]标记的完整大鼠cDNA杂交。杂交的条件基本上同上述A部分中用于序列文库筛选的条件。放射自显影显示,在二个反应中,已经产生了少量大约2.2kb的DNA,并且,二个反应的扩增产物的剩余部分可在琼脂糖凝胶上分离开。尽管据可视性检验没有显示任何区带,但从凝胶上还是洗脱出了2.2kb区带,并且在另一个PCR反应中被用作模板,此PCR反应的条件是,用同样的引物(SEQ ID NO18和19),含有1mM Mg++的Tris-HCl缓冲液,pH8.0,以及55℃退火温度。来自次级PCR的扩增产物在凝胶中是可见的,可被洗脱出,并克隆进入质粒pBS+(Stratagene,LaJolla,CA)用于序列分析。
生成的RT-PCR克隆被测定含有2214bp,列示在SEQ ID NO7中。该克隆能编码在大鼠脾细胞cDNA克隆中发现的结构域2到结构域6,还能编码一个附加的氨基末端结构域1,一个附加的羧基末端结构域7,以及似乎是另一个羧基末端结构域8的164bp。与结构域1紧邻的5’区是一个附加的144bp序列,推测是来自引导区和第一区之间的基因内区。这个克隆不含有5’引导序列或3’跨膜的和细胞质内区。除了以前在脾cDNA克隆中确定的结构域6之外,RT-PCR克隆中的第7和第8结构域也支持如下假设此克隆是新的啮齿类动物ICAM。
实施例2Northern(RNA)印迹分析法为了进一步研究这种可能性,即在实施例1中鉴定的ICAM-相关的克隆编码了一种如独特的类Ig结构域所示的新的ICAM多肽,用Northern印迹分析法对组织特殊性表达进行了检测,以使能够与以前报导的人ICAM表达模式相比较[ICAM-1,Dustin等,免疫学杂志,137245-254(1986),ICAM-2,Staunton等,自然,33961-64(1989),ICAM-R,de Fourgerolles和Springer,实验医学杂志,175185-190(1992)]。
用STAT 60 RNA分离试剂(Tel-test“B”,Inc,FriendswoodTexas),按照厂商提供的方案,分别从大鼠的肺,脑,脊髓,肝,消化道,胸腺,淋巴结和脾制备细胞总RNA。用低聚dT纤维素柱,从总RNA中分离纯化出Poly A+RNA。在1%甲醛琼脂糖凝胶上,将从每种组织得到的RNA大约5μg进行分离,然后转移至hybond-C硝酸纤维素膜上(Amersham)。
将来自实施例1的,相应于结构域2到4(在SEQ ID NO6中的核苷酸1到724)的大鼠脾cDNA片段,亚克隆进入pBluescript SK+(Stratagene),并按照厂商(Boehringer Mannheim,Indianapolis,IN)提供的方案,用32P-标记的UTP和大约500ng线性化的模板,通过体外转录产生一个反义RNA探针。将膜结合RNA在含有下列成分的溶液中进行预杂交50%甲酰胺,5×SSC,1×PE(50mM Tris-HCl,pH7.5,0.1%焦磷酸钠,0.2%聚乙烯吡咯烷酮,0.2%ficoll,5mM EDTA,1%SDS)和150μg/ml的变性处理过的鲑鱼精DNA。放射标记的探针通过煮沸变性处理后,加入到该预杂交液中,使其最后浓度为1×106cpm/ml。在65℃杂交处理16-18小时。然后在65℃,在含有0.1%SDS的2×SSC中对膜进行洗涤,随后对X-射线胶片曝光3-16小时。
RNA印迹分析表明,实施例1中确定的ICAM-相关的cDNA只在大鼠脑中被表达,这是一种对任何其它ICAM多肽以前尚未报导过的组织特异性。这种表达模式,加上尚不知存在于其它ICAM多肽中的独特的类Ig结构域,都表明该ICAM相关的克隆是ICAM蛋白质家族的一个新成员,被命名为ICAM-4。
最初鉴定的cDNA克隆在大鼠脾细胞序列文库中被检测出的事实暗示,脾细胞中的一个子系统可能以低水平表达ICAM-4。但是,在许多血细胞生成cDNA序列文库中未能检测出适当拼接的克隆,这使人怀疑是否ICAM-4蛋白真的能在除脑以外的组织中被表达。对ICAM-4cDNA在脾细胞中被检测出的一种解释是,PCR的灵敏度可能扩增了痕迹量的转录本,即使这些组织并不能表达所编码的蛋白质。
实施例3全长大鼠ICAM-4 cDNA的分离A.对大鼠脑cDNA克隆的确定鉴于ICAM-4的组织特异性表达,脑组织mRNA被用于分离编码ICAM-4的全长cDNA的目的。对二个探针作放射性标记,第一个是与实施例1中鉴定的脾细胞cDNA克隆(SEQ ID NO7)的结构域1到结构域2互补,第二个是与其结构域3到结构域5互补,并用这二个探针在以前自用构建的λgt 10中筛选大鼠脑cDNA序列文库。杂交条件如实施例1中所述,对阳性噬菌斑作一轮或多轮筛选处理,得到克隆的噬菌体。
鉴别出9个阳性克隆,以其中两个与两个探针杂交。最长的两个克隆,称作克隆7,含有2550bp,它们编码在cDNA探针中发现的5个类Ig结构域的4个结构域。此外,克隆7还编码在探针中没有发现的其它4个类Ig结构域。对假定的跨膜结构域和细胞质结构域鉴定表明,其后面连有一个终止密码子,一个聚腺苷酸化信号,和一个聚A尾部。测定表明,通过与RT-PCR克隆(SEQ ID NO7)相比较,克隆7缺少至少一个5’类Ig结构域,并缺少一个引导序列;对此序列文库再次筛选没有得到任何含有这些序列的更长的克隆。克隆7的核酸序列被列举在SEQ ID NO10中。
B.5’末端的测定为了分离结构域1和其它5’序列,运用了被称为cDNA末端5快速扩增(RACE)的PCR技术[PCR方案方法和应用指南,Innis等(eds)学术出版社纽约(1990)pp28-38]可通过使用5’RACE试剂盒(Clontech)进行。该技术使用了一个与第二引物配对的内部引物,此第二引物是与一个接合于cDNA序列文库分子5’末端的连接子序列互补的。因此,运用这种引物对的PCR可扩增并促进对此插入序列的鉴定。然后重叠的序列信息可以用于产生完整的基因序列。
在一个以该试剂盒的寡聚核苷酸和一个基于内部ICAM-4序列的反义引物进行的PCR试验中,使用了来自大鼠脑的准备用于RACE的cDNA(由试剂盒提供)。3’反义引物,被称为Spot 714AS,是根据ICAM-4结构域4序列设计的,被列举在SEQ ID NO20中。
CARGGTGACAAGGGCTCG(SEQ ID NO20)随后对由这个引物对得到的扩增产物,用试剂盒提供的相同5’引物进行次极PCR试验,此5’引物是同一个与ICAM-4结构域1中的一部分互补的3’引物配对的引物。第2个3’引物被定名为RRACE2,并列举在SEQID NO21中。
TATGAATTCAGTTGAGCCACAGCGAGC(SEQ ID NO21)每个用于次极PCR的引物都含有一个EcoRI位点,以便使产生的扩增产物容易克隆进pBS+(Stratagene)。生成的含有基因5’末端的质粒DNA,可通过对大鼠ICAM-4结构域1和2探针的杂交来鉴别,相应于SEQID NO7中的核苷酸1到736。从生成的扩增产物还可确定结构域1和疏水引导区的部分序列信息。
来自5’RACE法的产物是一个长度为222bp的DNA片段,含有以甲硫氨酸为起始的60bp上游区,82bp的引导序列,和80bp来自结构域1的序列。此扩增产物被列举在SEQ ID NO11中。
C.大鼠ICAM-4的全长序列根据由5’RACE法得到的序列信息(SEQ ID NO11),构建了一个全长ICAM-4的复合克隆,RT-PCR克隆(SEQ ID NO7)和脑cDNA克隆7(SEQ ID NO10)。对大鼠ICAM-4的全长基因测定表明,它含有2985bp(碱基对),带有一个单开口的解读结构,它是编码一个推测的含917个氨基酸的蛋白质的结构。假定的Kozak序列位于引导序列中的甲硫氨酸残基的上游。在27个氨基酸的疏水引导序列的后面是9个类Ig结构域,一个跨膜区和含有58个氨基酸的细胞质尾部。该复合ICAM-4 cDNA被列举在SEQ ID NO1中,该推测的氨基酸序列数列举在SEQ ID NO2中。
象其它ICAM多肽一样,ICAM-4也包含细胞外结构域,跨膜结构域和细胞质结构域。在细胞外结构域,ICAM-4的氨基末端是包括氨基酸1到氨基酸27的一个引导序列,随后是9个类免疫球蛋白Ig结构域,这是ICAM-4独有的特征,对于ICAM-1,ICAM-2和ICAM-R,是分别包含5个,2个和5个细胞外类Ig结构域。在ICAM-4,结构域1包含氨基酸28到118,结构域2包含氨基酸119到224,结构域3包含氨基酸225到321,结构域4包含氨基酸322到405,结构域5包含氨基酸406到488,结构域6包含氨基酸489到569,结构域7包含氨基酸570到662,结构域8包含氨基酸663到742,和结构域9包含氨基酸743到830。在每个结构域内,都有一种由半胱氨酸残基之间的二硫键形成特征性“环形”结构,通常位于该结构域氨基酸序列相对的两端。ICAM-4的其他结构特征包括含有氨基酸831到859的跨膜区和含有氨基酸860到917的细胞质区。
对于大鼠ICAM-4内每个结构域的氨基酸序列与ICAM家族其它成员对应性的比较,仅限于同人的ICAM-1,ICAM-2和ICAM-R相应的序列,因为对于啮齿类动物所有三个同源物的序列资料以前都未见报导。在第一结构域,啮齿类动物ICAM-4显示有21%,30%和28%分别与人ICAM-1,ICAM-2和ICAM-R相同。第二结构域保存更多,氨基酸与ICAM-1,-2,和-3相同的百分数分别是60,42,和62。结构域3-5显示与ICAM-1相同的百分数是48,49,和40,而对于ICAM-R分别是60,59,和29。有趣的是,大鼠ICAM-4结构域6到8与结构域5最相似(有29%-42%完全相同),可能是由于基因片段的复制造成。第9和最后一个细胞外结构域与其它ICAM结构域匹配很差,但人VCAM-1的第3和第6结构域有22%相同,VCAM-1是参与细胞粘附的蛋白质Ig家族的另一个成员。细胞质结构域的尾部由58个氨基酸组成。这比ICAM家族其它成员的都长,在人ICAM-1,-2,和3中,分别包含28,26,和37个氨基酸。正如第9结构域一样,大鼠ICAM-4细胞质结构域的尾部与人VCAM-1细胞质结构域的尾部最相似,只包含19个氨基酸。大鼠ICAM-4的大约19个膜氨基酸,与VCAM-1共用7个相同的氨基酸残基(37%)。
最后,将与LFA-1(CD11a/CD18)的结合功能绘制成ICAM中第一结构域的基因排列图。Vonderheide等,[细胞生物学杂志,125215-222(1994)]鉴定了一个认为是与整合蛋白结合有关的序列基元。尽管在结构域1中大鼠ICAM-4的其它ICAM之间仅有相当低的相似,但是这个结合序列基元被保留了,表明大鼠ICAM-4可能是LFA-1或者其它整合蛋白的一个配体。
实施例4在脑组织中的原位杂交为了将表达ICAM-4的特异性脑组织定位,采用了以ICAM-4结构域1和ICAM-4结构域3到4作反义RNA探针的原位杂交技术。对这些探针通过体外转录用35S-标记的UTP作了标记。
杂交之前,将正常大鼠脑的冰冻组织切片在4%多聚甲醛中固定20分钟,然后作漂洗和脱水处理,再使被固定的RNA在70℃,在2×SSC,70%甲酰胺中变性处理2分钟。在50℃,将组织切片在含有下列成分的溶液中杂交过夜50%甲酰胺,0-3M NaCl,20mM Tris-HCl,pH7.4,5mM EDTA,10%硫酸葡聚糖,1×Denhardt,0.5mg/ml的酵母RNA,10mM DTT和浓度为50000cpm/μl的探针。组织玻片在室温下,在4×SSC,10mM DTT中洗一次,60分钟,60℃下在50%甲酰胺,2×SSC,10mM DTT中洗一次,40分钟,再在室温下,分别在2×SSC和1×SSC中洗一次,各30分钟。用平行的实验确定杂交的特异性,按相同的方案进行,但是还包括在60℃,在50%甲酰胺,1×SSC,10mM DTT中,更严格地洗40分钟。洗片之后,将组织玻片在NTB2乳胶(Kodak,Rochester,NY)中浸一下,再曝光2至21天,然后显影和作计数染色。阴性对照包括从ICAM-4结构域1产生的有义探针和ICAM-4结构域3到4的有义RNA探针,此外还包括一个人免疫缺损病毒(HIV-1)RNA探针。
脑组织中的检测信号主要位于灰质,最强的信号在大脑皮层和海马的灰质中。此杂交分布图与ICAM-4主要在大脑神经细胞中表达相符合。
实施例5ICAM-4融合蛋白的产生为了产生针对ICAM-4多肽片段特异性的单克隆抗体,先用原核生物表达载体pGEX(Pharmacia,Alameda,CA)产生大鼠ICAM-4/谷胱甘肽S-转移酶(GST)融合蛋白。
将相应于结构域1 5’和3’末端的和结构域2 5’和3’末端的PCR引物,用于扩增编码各个结构域的DNA片段。产生的片段再被分别克隆进入pGEX-2T的EcoRI位点,DNA序列分析证实了其正确的取向和读出结构。随后根据它们产生适当分子量融合蛋白的能力,筛选转化体。
细菌在含有1%SDS的PBS中经超声波处理溶菌之后,ICAM-4结构域1/GST和ICAM-4结构域2/GST融合蛋白都存留在可溶性组分之中。将来自100ml培养物的可溶性组分在带有SDS的染料中煮沸,并在10%预制的聚丙烯酰胺-SDS凝胶上进行分离。然后将凝胶在冰冷却的0.4M KCl中染色,并切下融合蛋白带。在透析管内的含有25mMTris-HCl和192mM甘氨酸的缓冲液中,通过电洗脱法将融合蛋白从凝胶切片中洗脱出。用OD280测定大致的蛋白质浓度,制剂的纯度可在用考马斯蓝染色的SDS-PAGE上测定。
实施例6针对大鼠ICAM-4/GST融合蛋白的单克隆抗体的制备用在福氏完全佐剂(FCA)中乳化的40-50μg ICAM-4结构域2/GST融合蛋白(实施例5中所述的),通过皮下注射免疫Balb/c小鼠。二周后,用相同的蛋白质,但是在福氏不完全佐剂中乳化的蛋白质,再次通过皮下注射免疫小鼠。在第二次免疫的二周之后,再给予最后二次腹膜内注射免疫,用的是无佐剂的可溶性抗原,中间相隔二周。通过ELISA法测定每只免疫小鼠血清与大鼠ICAM-4特异性反应的能力。此ICAM-4是如下所述用杆状病毒表达系统产生的。
从#1654小鼠无菌取出脾脏,置于10ml无血清的RPMI 1640液中。向此RPMI(Gibco,Burlington,Ottawa,Canada)液中补加2mM L-谷酰胺,1mM丙酮酸钠,100单位/ml青霉素,和100μg/ml链霉素,然后在此溶液中,通过用二块显微镜玻片的粗糙末端研磨脾组织,而形成单细胞悬液。细胞悬液用无菌的70目Nitek细胞滤器(BectonDickinson,Parsippany,NJ)过滤,用RPMI液洗二次,每次以200×g离心5分钟。将从第二次洗液得到的沉淀再悬浮在20ml无血清的RPMI液中。用同样的方法制备取自三只正常Balb/c小鼠的胸腺细胞。
在融合之前,使NS-1骨髓瘤细胞在加有11%Fetalclone血清(FBS)(Hyclone Laboratories,Logan,Utah)的RPMI中,维持在对数生长时相3天。收获时,在200×g离心细胞5分钟,沉淀如上面所述洗涤二次。洗过之后,在无血清的RPMI中,将细胞悬液配成10ml的最后体积。取20μl等分量,用无血清RPMI作1∶50稀释,再取20μl等分量稀释液与用0.85%盐水(Gibco)配制的0.4%锥虫兰染色剂20μl混合,转入血细胞计数器(Baxter Healthcare,Deerfield,IL),作细胞计数。用大约2.425×108个脾细胞与4.85×107个NS-1细胞结合,离心此混合物,弃去上清液。轻轻弹击离心管,使离心沉淀松动,混匀,然后加入用75mM Hepes,pH8.0(Boehringer Mannheim,Indianapolis,IN)配制的50%PEG 1500 2ml,加注时同时搅拌,1分钟以上加完。随后,在超过7分钟的时间内加入另外14ml无血清RPMI。细胞悬液在200×g离心10分钟,弃去上清液。将沉淀再次悬浮在含有下列成分的200ml RPMI中15%FBS,100μM次黄嘌呤钠,0.4μM氨基喋呤,16μM胸腺嘧啶脱氧核苷(HAT)(Gibco),25单位/ml IL-6(Bochringer Mannheim)和1.5×106个胸腺细胞/ml。先将此悬液置于225cm2的培养瓶内(Corning,Essex,UnitedKingdom)37℃培养4小时,然后以200μl/孔分配到10×96平底孔组织培养板(Corning)中。对培养板中的细胞在融合后的第3,4,5,和6天作换液饲养,方法是用20G注射针(Becton Dickinson)从每孔吸出大约100μl培养液,每孔再加入上述培养液,但其中仅含10单位/mlIL-6,不含胸腺细胞。
最后通过抗原固定化ELISA法对融合培养板进行筛选,方法如下。用Immulon 4酶联板(Dynatech,Cambridge,MA),以100ng/孔结构域1-GST或结构域2-GST融合蛋白(以50mM碳酸盐缓中液配制),在4℃包被过夜。对此酶联板以100μl/孔PBS新鲜配制的0.5%皮肤胶原蛋白(Sigma,St.Louis,MO),在37℃封闭30分钟。封闭完成之后,将此酶联板用含有0.05%吐温20的PBS(PBST)洗3次,然后分别加入取自每个融合细胞孔的杂交瘤细胞悬液,50μl/孔。39℃培育30分钟后,如上所述洗涤酶联板之后,加入1∶3500稀释的辣根过氧化物酶标记羊抗小鼠IgG(Fc)(Jackson ImmunoResearch,WestGrove,Pennsylvania)50μl/孔。将此酶联板再次培育30分钟,再用PBST洗4次。加入由1mg/ml邻苯二胺(Sigma)和0.1μl/ml 30%H2O2组成的,在100mM柠檬酸,pH4.5中配制的底物液,100μl/孔。允许生色反应进行10分钟,然后加入50μl/孔15%H2SO4,使反应停止。然后在自动酶联板测定仪(Dynetech)上,在490nm测定光吸水度。
然后,将对结构域2-GST蛋白,而不是结构域1-GST蛋白的阳性反应孔,通过针对杆状病毒上清液(在下面描述的ELISA测定进行筛选。ELISA试验步骤同上所叙,不同的是Immulon 4酶联板最初是用在50mM碳酸盐缓冲液中1∶4稀释的杆状病毒上清液包被过夜。通过在RPMI,15%FBS,100μM次黄嘌呤钠,16μM胸腺嘧啶脱氧核苷和10单位/ml IL-6中作连续双倍稀释,对其中三个孔(103A,103B和103F)克隆2到3次。4天后肉眼观测各克隆板孔,记录最低密度孔的克隆数量。7至10天后,对每次克隆选出的孔再用ELISA法针对结构域1-GST蛋白和结构域2-GST蛋白,或者杆状病毒上清液进行测定。
对杂交瘤细胞产生的单克隆抗体用ELISA法作同型性测定。对Immulon 4酶联板(Dynatech)用在50mM碳酸盐缓冲液,pH9.6中1∶5000稀释的羊抗-小鼠IgA,IgG,或IgM(Organon Teknika,Durham,NC),50μl/孔,在4℃包被。然后用PBS配制的1%BSA,在37℃对各孔封闭30分钟,用PBST洗3次。对每个孔加入1∶10稀释的杂交瘤细胞培养上清液50μl,培育,并如上洗涤。最后一次洗涤之后,加入50μl/孔辣根过氧化物酶标记的兔抗小鼠IgG1,G2a,G2b,或G3(Zymed,San Francisco,CA)(在加有1%正常羊血清的PBST中作1∶1000稀释)。同上培育,用PBST洗4次,然后加入100μl底物液,5分之后加入50μl 15%H2SO4停止生色反应,在酶联板测定仪(Dynatech)上,在490nm测定光吸收度。
结果表明,抗体103A,103B,和103F都是IgG1同型物。这些抗体随后将用于免疫细胞化学分析,免疫印迹测定和用于杆状病毒表达蛋白质的纯化。
实施例7用杆状病毒表达大鼠ICAM-4杆状病毒表达系统(Invitrogen)被用于产生相应于ICAM-4结构域1至6的可溶性蛋白质。因为当时对ICAM-4的引导序列尚不知道,所以构建了含有在适当的解读结构中,把3’融合到ICAM-1引导序列的ICAM-4编码序列的表达结构。关于构建ICAM-1/ICAM-4表达质粒的具体详情如下所述。
用引入了几个特征以便促进融合质粒构建的引物,通过PCR扩增了编码5个类Ig结构域的大鼠ICAM-1 DNA。5’寡核苷酸引物除了在引导序列中第一个甲硫氨酸的上游有一个一致的Kozak序列外,还含有HindIII和BglII位点。3’寡聚核苷酸引物包含有一个6个组氨酸后紧连有一个终止密码子的一个HindIII克隆位点的编码序列。将PCR扩增产物克隆进入HindIII-消化的pBS+载体,序列分析证实了这种适当的结构。对ICAM-1引导序列中的内部SmaI位点和载体的多克隆区(3’到ICAM-1类Ig结构域5)中的另一个SmaI位点进行消化切割,将除去绝大多数ICAM-1编码序列。在做完这些操作之后,这种线性化的,具有平末端的载体内包含有一部分上游多克隆区(在多克隆区中原始HindIII位点的那些限制性5’位点),Kozak序列和绝大多数ICAM-1引导序列。
用经过消化处理,使之能够将这些序列克隆进入上述线性化载体的引物,通过PCR将大鼠ICAM-4结构域1到结构域6的编码序列进行扩增。5’寡核苷酸引物包含有一个EcoRV位点和为完成ICAM-1引导序列需要的密码子。3’寡核苷酸引物包含有对6个组氨酸残基的密码子,一个终止密码子和HingIII和EcoRV限制性位点。用EcoRV消化由此PCR的扩增产物,产生一个具平末端的序列,然后将它整合进入具平末端的,SmaI消化的pBS+线性化载体内。将含有ICAM-1引导序列5’到ICAM-4结构域1至6的完整序列,从具有BglII/HindIII消化位点的结构中除去,并且将纯化的ICAM-1/ICAM-4融合序列直接克隆进入BglII/HindIII消化的pBluesac III载体(Invitrogen)。
通过ELISA试验对该重组病毒产生的蛋白质进行鉴定,开始是用,以实施例5中所述的大鼠ICAM-4结构域2/GST融合蛋白免疫小鼠的免疫血清。在下面的工作中,从那些小鼠产生的单克隆抗体,将被用于纯化由重组杆状病毒在SF9细胞中产生的ICAM-4蛋白。
实施例8针对杆状病毒表达的大鼠ICAM-4的单克隆抗体的制备如实施例7中所述,使大鼠ICAM-4结构域1-6在杆状病毒表达系统中表达。该重组蛋白用单克隆抗体103A(如实施例6中所述)纯化。
简言之,将30mg纯化的单克隆抗体103A(溶于100mM硼酸钠,500mM氯化钠溶液内)偶联于3g溴化氰活化Sepharose 4B上(Pharmacia.Piscataway,NJ)。在此Sepharose柱上,将含有重组大鼠ICAM-4(结构域1-6)的杆状病毒上清液加样上柱,在4℃过夜。先用无钙、镁的磷酸盐缓冲盐水(CMF-PBS)洗柱,然后用50mM柠檬酸,500mM NaCl,pH4.0的溶液洗脱结合物。样品用1/10体积的pH10Tris液中和,贮存于-20℃。在SDS-PAGE上分离的纯化蛋白质,显示高于90%的纯度,迁移在大约80kD的分子量位置。
用纯化的重组大鼠ICAM-4结构域1-6蛋白质,按在实施例6中所述的类似方法免疫小鼠。来自1945号小鼠的脾用于127号融合。融合方案同实施例6中所述。通过ELISA法对重组ICAM-4蛋白筛选融合细胞孔。第二次筛选使用了对大鼠脑组织切片的免疫细胞化学法(如下面实施例9中所述)。从这株融合细胞中还克隆出了另外四个对大鼠ICAM-4特异性的抗体127A,127E,127F,和127H。大鼠脑组织切片上每种抗体的免疫细胞化学染色结果与用单克隆抗体103A(见实施例9)观察到的结果相同。测定了这些单克隆抗体结合D1/GST和D2/GST融合蛋白的能力(在实施例5中所述)。单克隆抗体127A识别D1/GST融合蛋白,单克隆抗体127H识别D2/GST融合蛋白。这二个不同的结合特异性,以及其它的特点如不与二个GST蛋白质,暗示至少有3个不同的抗原决定部位可被这批抗体识别。杂交瘤细胞127A和127H,分别于1995年5月31和1995年6月1日存于美国典型培养物保藏中心,12301 Parklawn Drive,Rockville,Maryland 20852,保藏号分别为HB11905和HB11911。
实施例9大鼠ICAM-4表达的免疫细胞化学以单克隆抗体103A作免疫细胞化学实验,用于定位大鼠脑内的蛋白质产物。
将取自正常成年雌性Lewis大鼠的脑作矢向切开,在无RNase的1XPBS中,在冰浴上洗30分钟。在Tek II组织坩锅(cryomolds)(MilesLaboratories,Inc.Naperville,IL)内加入少量O.C.T.化合物(Miles,Inc,Elkhart,IN),然后将脑组织块放入其中。脑组织块放在坩锅中心部位,再加满OCT化合物,然后将坩锅放入装有2-甲基丁烷(AldrichChemical Company,Inc,Milwaukee,WI)的容器内,再把此容器放入液氮中。在坩锅内的组织块和OCT被冷冻后,将组织块存于-80℃备用于切片。
作6μm厚度的组织切片,切片贴于涂有Vectabond(VectorLaboratories,Inc.Burlingame,CA)的载玻片上,在室温下于空气中干燥过夜待用。切片在室温下,在乙醚(Malinckrodt,Paris,KY)中固定5分钟。当载玻片从乙醚中取出之后,让试剂蒸发掉。在室温下,用在1×PBS(仅用磷酸钠盐配制)中配制的50%正常大鼠血清(Sigma)和2%牛血清白蛋白(BSA)(Sigma)150μl封闭每块切片30分钟。封闭完成后,小心地从切片上吸去封闭液,将纯化的抗体103A上清液在封闭液中作1∶10稀释,对每块组织切片加150μl。将组织载玻片置于温盒内,在4℃培育过夜。
第二天从切片上轻轻吸去抗体溶液,组织载玻片在1×PBS中洗3次,每次4分钟。从组织载玻片上吸去残留的PBS,用含有10%正常大鼠血清和2%BSA的1×PBS,将第2抗体,大鼠抗小鼠-生物素标记抗体(Jackson Immuno-Research Laboratories)作1∶100稀释,对组织切片各加100μl。在室温下温育反应1小时。切片在1×PBS中洗2次,每次4分钟,然后用EIite大鼠IgG Vectastain ABC试剂盒(VectorLaboratories,Inc.Burlingame,CA),将按照其产品说明书配制的ABC试剂100μl加到每个切片上。在室温下温育30分钟。温育反应之后,组织玻片在1×PBS中洗2次(每次4分钟),然后对每个组织切片加Vector VIP过氧化物酶底物液(Vector Laboratories,Inc.Burlingame,CA)150μl,作用大约10分钟。显色之后,组织切片在流水下漂洗5分钟,用Meyer’s苏木精(Sigma)作计数染色20秒,再在缓慢的流水中漂洗5分钟。作组织载玻片通过梯度乙醇作系列脱水,最后通过二甲苯,并用Accumount 60(Stephens Scientific,Riverdale,NJ)封片。
用单克隆抗体(mAb)103A作用过的大鼠脑组织切片的免疫细胞化学显示,大鼠ICAM-4是被表达在海马的神经细胞内。染色式样暗示,这种蛋白质可能被限制在神经的突起(树突)中。脑组织切片按同样的方式,以无关抗体或仅用第二步试剂染色时,不显示出以MAb103染色所见到的明显的表达式样。
实施例10人ICAM-4基因组DNA的克隆在从基因组DNA克隆大鼠ICAM-4的过程中,发现ICAM-1和ICAM-4定位在彼此相距5kD的位置,这个资料被用于克隆人同源ICAM-4的目的。
基因组系统公司(Genome Systems Inc)用人ICAM-1结构域3引物,即一个设计与人ICAM-1结构域3互补的正常义引物(H-1/D3 S)和一个设计与人ICAM-3互补的反义引物(H-1/D3 AS),通过PCR扩增了人P1序列文库中的片段。这些引物被分别列举在SEQID NOs22和23。
CCGGGTCCTAGAGGTGGACACGCA(SEQ ID NO22)TGCAGTGTCTCCTGGCTCTGGTTC(SEQ ID NO23)对被称为1566和1567的两个克隆进行了鉴定和进一步分析。两个P1克隆都含有大约75-95kb的基因组DNA插入片段。将克隆用BamHI消化后,用琼脂糖凝胶电泳分离,再转移印迹到尼龙膜上。在42℃,在低强度(30%甲酰胺)或高强度(60%甲酰胺)下,以放射标记的人ICAM-1,ICAM-3或大鼠ICAM-4探针,进行DNA印迹杂交试验,杂交液的其它成分如实施例1中所述。低强度杂交组在室温下用含有0.1%SDS的2×SSPE洗。高强度杂交组在65℃用含有0.1%SDS的0.2×SSPE洗。膜被洗过后,对X-射线胶片曝光3.5小时。
不同的杂交结果表明,人ICAM-1包含在5.5kb BamHI片段上,而人ICAM-3定位于4.0kb和1.5kb BamHI片段。人ICAM-1和ICAM-R片段被亚克隆进入pBS+,用局部序列分析法证实了它们的相同性。
将在高强度条件下与大鼠ICAM-4杂交的7.0kb BamHI片段进行亚克隆,并通过RsaI限制性消化作进一步切割。鉴定了三个与大鼠ICAM-4杂交的RsaI片段,并测定了它们的序列。根据它们与大鼠ICAM-4的同源性,显示这些片段包含有结构域2,3,4,5,以及部分结构域6。
实施例11人ICAM-4 cDNA的克隆以对应于人ICAM-4结构域2-5(实施例10中所述)的基因组DNA片段用作探针,筛选λgt10人海马cDNA序列库(Clontech,PaloAlto,CA)。序列文库的筛选方案基本上同实施例1所述。
在此序列文库中发现的最长的人ICAM-4克隆(18号)仅有992bp(SEQ ID24),大致对应于预测的3kb基因的中间部分。将此来自克隆18(SEQ ID24)的992bp DNA插入片段,用作筛选λZAPII人海马cDNA序列文库(Stratagent,La Jolla,CA)的探针。这个序列文库产生了许多阳性克隆。最长的克隆,34号有2775bp(SEQ ID25)。根据与全长大鼠ICAM-4的匹配情况,预测这个克隆在结构域1的5’末端漏失了引导序列和大约30bp。在3’末端漏失了poly A+,但翻译终止密码子仍存在。
以对应于开始的3个结构域的DNA片段(克隆34号中的核苷酸1到840)作探针,筛选来自人大脑皮层的λgt 10 cDNA序列文库(Clontech,Palo Alto,CA)。鉴定出一个克隆,16-1(SEQ ID26),具有1557bp,并且包含39bp的5’未转录DNA,一个引导序列和全部5个结构域的序列信息。重叠克隆34号(SEQ ID25)和16-1(SEQ ID26),被用于产生全长人ICAM-4序列(SEQ ID27)的复合体。
全长的基因长度为2927bp,编码一个924个氨基酸的蛋白质。ICAM-4核苷酸序列被列举在SEQ ID NO27,其氨基酸序列被列举在SEQ ID NO28。序列与全长大鼠ICAM-4基因(SEQID11)的匹配性表明,总的DNA序列一致性为82%,在氨基酸水平的一致性为85%。在大鼠和人之间,保存了九个类Ig蛋白质细胞外结构域结构。引导序列从氨基酸1延伸到28,结构域1从氨基酸29到117,结构域2从氨基酸118到224,结构域3从氨基酸225到320,结构域4从氨基酸321到405,结构域5从氨基酸406到488,结构域6从氨基酸489到570,结构域7从氨基酸571到663,结构域8从氨基酸664到743,结构域9从氨基酸744到837,跨膜区从氨基酸838到857,以及细胞质尾部从氨基酸858到924。
人ICAM-4(HuICAM-4),除了在遗传上与ICAM-1和ICAM-R相关联外,还显示出某些共同的结构特征,可将它们共同分类为一类分子。一个结构域通过HuICAM-4与其它ICAM家族成员的结构域匹配性,可显示其同源性变异程度。HuICAM-4的结构域1氨基酸序列,与ICAM1,2和3相比,一致性分别为21%,30%和26%。HuICAM-4的结构域3,与ICAMs1和3的相同分别为50%和65%。HuICAM-4的结构域4与ICAM-1和3的一致性分别为54%和64%。HuICAM-4的结构域5-8与ICAM-1和3的5个结构域最为相似,对ICAM-1结构域5其一致性范围为33-47%,对于ICAM-R结构域5,其一致性范围为21-31%。HuICAM-4的9个结构域与ICAM家族的其它成员匹配不佳,但与HuICAM-1的结构域3的结构域6相类似(分别有24%和23%相同)。
实施例12人ICAM-4表达的Northern分析从Clontech(Palo Alto,CA)购买了两种人多组织Northern(MTN)印迹物。将这些含有来自人不同的16种组织的poly A+RNA至少2μg的印迹物在变性甲醛1.2%琼脂糖凝胶上展开,并转移到尼龙膜上。印迹斑点在42℃,在10ml含有下列成分的溶液中预杂交3小时5×SSPE,10×Denhardts溶液,50%甲酰胺,2%SDS和100μg/ml变性的鲑鱼精DNA。然后再在上述溶液中,在42℃与放射性标记的人ICAM-4探针(18号克隆,SEQ ID24)杂交16小时。第二天,印迹斑点先在室温下以0.1×SSC/0.1%SDS溶液洗,然后在50℃下洗。在-80℃将印迹斑点对X-射线胶片曝光24小时。分析结果显示在如下表1中。
只有包含脑RNA的印迹泳道与ICAM-4探针杂交了,在大约3kb位置显示出一条单独的带。较长时间的曝光(5天)证实,只有脑显示出可检出水平的信息。为了确定是否所有的印迹泳道都含有可比较量的类似性质的RNA,用相同的印迹斑点与对照β-肌动蛋白探针杂交。从印迹斑点上通过用煮沸的0.1%SDS溶液处理15分钟,脱去ICAM-4探针,随后用厂商提供的β-肌动蛋白探针,按同样的方法进行检测。除了含量稍有不同,所有印迹泳道都显示含有高品质的RNA。
表1人ICAM-4表达的组织RNA印迹分析探针组织ICAM-4β-肌动蛋白心脏 - +++脑 + ++胎盘 - +++肺 - +++肝 - +++骨骼肌 - ++++肾 - +++胰腺 - ++脾 - +++胸腺 - +++前列腺 - +++睾丸 - +++卵巢 - +++小肠 - +++结肠 - +++外周血白细胞 - +++从Clontech购买了另外两个RNA印迹物,它们含有来自人脑16个不同亚区的poly A+RNA(如表2所示)。以用于组织分析的类似的方法对印迹物进行探测,结果显示在表2。含有RNA的质和量,可通过用β肌动蛋白探针对印迹斑点探测来验证。
所有显示ICAM-4表达的结构域,都是端脑的一部分,仅丘脑是例外,它被认为是间脑的一部分。海马和大脑皮层显示具有最高水平的表达。所有情况下其转录本大小都相同,为3kb。ICAM-4表达的精细组织分布暗示,启动子区可能含有使其范围产物具有观测到的进化性立体表达的成分。利用这些资料,总的来说,可以对神经基因表达的控制有更深入的了解。
表2人ICAM-4表达的脑细胞类型RNA印迹分析探针脑区ICAM-4β-肌动蛋白杏仁核 ++ +++尾状核 ++ +++胼胝体 ++++海马 ++ +++下丘脑 -+++黑质 -+++丘脑下核 ++++丘脑 ++++小脑 -+++大脑皮质 +++ +++髓质 -+++脊髓 -+++枕极 ++ +++额叶 ++ +++颞叶 ++ +++豆状核 ++ +++实施例13人ICAM-4/IgG融合蛋白的产生为了生产蛋白质用于产生单克隆抗体和用于在粘附测定中鉴定潜在的ICAM-4配体,构建了人ICAM-4/IgG1融合蛋白表达质粒。制备了二个构建体,第一个包含表达HuICAM-4结构域1-3的DNA,第二个包含表达HuICAM-4结构域4-8的DNA。二者都连接于在载体pDCS1中的人IgG1 Fc区,此载体用巨细胞病毒(CMV)的启动子启动表达过程,并用来自IgG4的信号序列促进分子分泌。
设计了用于产生亚克隆必需的DNA片段的PCR引物(如以下SEQID NOs29-32所示)。对于结构域1 5’末端“正常义”引物(HI4-D1(S)SEQ ID NO29)被设计成补足了在克隆34号中漏失的结构域1 30个碱基对。引物HI4-DI(S)(SEQ ID NO29)和HI4-D3(AS)(SEQ ID NO30)被用于产生编码人ICAM-4的结构域1-3的DNA片段,这个片段相应于SEQ ID NO1中从核苷酸130到核苷酸996的一个区。引物HI4-D3(S)(SEQ ID NO31)和HI4-D8(AS)(SEQ ID NO32)被用于产生编码人ICAM-4的结构域4-8的DNA片段,此片段相应于SEQ ID NO30中从核苷酸997到核苷酸2268的一个区。每个5’引物编码一个BamHI限制性位点(GGATCC,下面用黑体字所示),每个3’(反义)引物含有一个XhoI位点(CTCGAG,下面用黑体字所示),以便促进对IgG1基因亚克隆5’。所有的寡核苷酸在5’末端都含有隔离物核苷酸(下面加线的)使之能够进行限制性消化。
HI4-Dl(S) (SEQ ID NO29)GTACTTACAGGATCCGCGGTCTCGCAG-GAGCCCTTCTGGGCGGACCTACAGCCTGCGTGGCGTTCHI4-D3(AS) (SEQ ID NO30)ATTTCTCTCGAGGATGGTCACGTTCTCCCGGHI4-D4(S) (SEQ ID NO31)ATTTCTGGATCCTACAGCTTCCCGGCACCACTCHI4-D8(AS) (SEQ ID NO32)ATTTCTCTCGAGTTCCACGCCCACAGTGACGGPCR反应在50μl体积内进行,用Perkin Elmer提供的含有AmpliTaq酶的缓冲液。加入的引物最后浓度为10μg/ml,含有的4种dNTP浓度为2mM。反应连续进行30个循环变性(94℃,4分钟),退火(50℃,2分钟),及延伸(72℃,1分钟)。在琼脂糖凝胶上观测PCR产物,以每个反应的一个等分量产物用于亚克隆进入载体pCRII(Invitrogen,SanDiego,CA)。通过序列分析以便发现扩增过程中产生的可能错误,并确定正确的取向。用BamHI和XhoI对适当克隆进行消化,产生的片段用琼脂糖凝胶电泳分离。将纯化的片段连接到被事先用BamHI和XhaI消化处理过的pDCS1载体中,对形成的质粒测定序列,以确定正确的取向和读出结构。
在将表达质粒暂时转染进入COS7细胞,并从培养基中分离出分泌的蛋白质之后,得到了人ICAM-4结构域1-3和4-8/IgG1融合蛋白。转染操作方法如下将有大约50-60%连生的粘连COS7细胞用CMF-PBS洗,接着,在含有6μl 0.25M氯奎(Sigma,St.Louis,MO)的7.5ml无血清DMEM培养基(Gibco,Gaithersburg,MD)中,使细胞与10-15μg质粒DNA相接触。再加入另外7.5ml含有150μl DEAE右旋糖酐(50mg/ml)(Sigma,St.Louis,MO)的无血清培养基,平皿先培养2-3小时,然后移去培养基,以PBS配制的10%DMSO(Mallinckrodt,McGaw Park,Illinois)代替。培育1分钟后,移去DMSO溶液,以含有5%FBS的新鲜培养基代替。每个转录都包括多个培养皿,将表达相同蛋白质的细胞培养基合并,用于蛋白质分离。
每三天收集培养基一次,共收集3-4次。用0.4-0.8ml Procep A柱(Bioprocessing Ltd,England)纯化蛋白质,柱子先用35mM Tris,150mM NaCl,PH7.5液进行了预平衡。培养基分二次加样上柱,流速为每小时小于60个柱体积的容量。用20倍柱体积的Tris/NaCl缓冲液,20倍体积的0.55M二乙醇胺pH8.5液,以及20倍体积的50mM柠檬酸,pH5.0液,各洗柱一次。然后用50mM柠檬酸,pH3.0液洗脱融合蛋白被收集在1ml的洗脱组分中,并将每个组分用1/10体积的1M Tris,pH9.5液中和。以OD280测定蛋白质的浓度,用SDS-PAGE测定蛋白质的纯度。
发现来自牛IgG(存在于FBS中)的显著污染。尽管预测结构域1-3融合蛋白比结构域4-8融合蛋白小,但二种蛋白都迁移到大约90kD。对此观测结果的一种可能的解释是,较小的结构域1-3融合蛋白与较大的结构域4-8融合蛋白相比,可能被更多地糖基化了。
这种纯化的蛋白质除了用于产生单克隆抗体外(如下所运),还将在粘附测定法中用于鉴定ICAM-4配体。
实施例14单克隆抗体的制备将在实施例13中所述的纯化蛋白质,用实施例6中所述的免疫方案,用于产生单克隆抗体。
来自2250号小鼠(用HuICAM-4 D1-3/IgG1免疫的)的脾用于172号融合,来自2272号小鼠(用HuICAM-4 D4-8/IgG1免疫的)的脾用于173号融合。融合方案同实施例6所述。用每种HuICAM-4/IgG1融合蛋白,通过ELISA法(基本同实施例6所述)对融合板进行筛选。对仅识别免疫原蛋白的融合孔中的上清液考虑进行克隆。对人海马切片的免疫细胞化学实验被用作第二级筛选法。
每个融合孔中免疫细胞化学试验阳性的一个初始克隆,将被进一步克隆。二个克隆的一个在克隆中不能生长,仅保留了一个候选克隆继续进行,即克隆173E,它是来自HuICAM-4 D4-8/IgG免疫的小鼠。杂交瘤细胞173E已于1995年6月1日保藏于美国典型培养物保藏中心,12301 Parklawn Drive,Rockville,Maryland 20852,保藏号HB11912。
从用相应于结构域1-3的可溶性ICAM-4片段免疫的小鼠得到的另一个融合体,发现有6个克隆(179A,179B,179D,179H,179I和179K)对HuICAM-4结构域1到3(D1-3)是特异性的。179系列中的所有6个抗体都结合于齿状回中的树突,以及多形细胞层和锥体细胞层的树突。除了树突之外,单克隆抗体179A还能使这些结构域的神经细胞体结合染色。
另一些融合体也同样产生与特殊的ECAM-4区具有特异性免疫活性的另一些抗体。
实施例15俘获测定法的建立对来自融合体179的6个单克隆抗体,以各种组合形式测定它们在溶液中俘获和识别可溶性ICAM-4的能力。为了检测正常和疾病状态下人体液中可溶性ICAM-4的水平,建立了如下所述的测定法。
用抗体179I,以3μg/ml的浓度,在37℃,每孔125μl,包被Immulon4(Dynatech)96孔酶联板2小时。吸去抗体溶液,用含有在无钙,无镁PBS(CFF-PBS)中配制的5%Teleostean胶原蛋白的封闭液300μl,在室温下封闭每个孔30分钟。吸去封闭液,每孔加入在Ommi稀释剂(CMF-PBS,含1%胶原蛋白和0.05%吐温20)中稀释的样品液100μl,此混合物在35℃温育30分钟。用PBST(CMF-PBS,含0.05%吐温20)洗酶联板3次。用NHS-LC-生物素(Pierce),按照厂商提供的方案,将抗体179H在1.5mg/ml下生物素化,作1∶2000稀释后加入各孔(100μl/孔)。得到的混合液在37℃温育30分钟,用PBST洗板3次。对每个孔加入链亲合素-HRP(Pierce)(100μl,0.25μg/ml),此混合物在37℃温育30分钟。用PBST洗板4次,然后加入在缓冲基质(含有1M柠檬酸的13.6g/L三水合醋酸钠,pH调至5.5,临用前加入150μl/L 30%H2O2)中1∶100稀释的四甲基联苯胺(Sigma)(以DMSO配制的10mg/ml贮备液)100μl。反应在室温下,在黑暗中进行30分钟,然后加入50μl/孔15%H2SO4,终止反应。在450nm测定光吸收度。
结果表明,本测定法能够在低至5-10ng/ml的浓度下检测可溶性HuICAM-4 D1-3重组蛋白,曲线的线性范围在10-100ng/ml。未观察到对HuICAM-4 D4-8的交叉反应性,当这个蛋白区以1μg/ml和10μg/ml用此法检测时未见交叉反应。
实施例16对中风病人血清中可溶性ICAM-4的测定为了评价在神经性疾病和状态下ICAM-4的作用,对来自28名患急性中风病人的血清和20名年青健康志愿者(未作年龄匹配)的血清,用上述的检测法进行了测定,以比较可溶性ICAM-4血清浓度的差别。
结果表明,在健康志愿者的血清中没有可测定浓度的ICAM-4。但是,28名急性中风病人中的20名,血清中含有可测定浓度的ICAM-4。来自阳性中风病人的检测信号表明血清中的浓度相当于5-38ng/ml标准品(可溶性ICAM-4 D1-3重组体蛋白)。
实施例17癫痫模型大鼠海马中的ICAM-4 mRNA含量对大鼠用一种产生激发性致癫痫动物模型中方法处理[Lothman,et al.Brain Res.36083-91(1985)],然后测定其海马中表达的大鼠ICAM-4 mRNA含量。在此模型中,对大鼠的海巴通过在脑中该结构域的埋藏电极,给予持续的惊厥下电刺激,逐渐引起严重的行为发作。激发过程包括每天给予12次刺激,每隔1天刺激一次,连续8天。一旦完全被激发后,一次刺激就能引起与人癞痫类似的行为发作和组织学改变。对完全被激发的大鼠每天给予2次刺激,持续二周以上,在最后一次刺激的24小时后将动物活杀。取出海马,切开用于RNA制备。
用鈲盐/苯酚/氯仿抽取方法[Chomezynski和Sacchi,Anal.Biochem 162156-159(1987)],从每个样本中制备总RNA。先在变性甲醛琼脂糖凝胶上分离RNA,然后转移到尼龙膜上,并与放射标记的大鼠ICAM-4和甘油醛-3-磷酸脱氢酶(GAPDH)特异性DNA探针杂交。GAPDH是一个基础表达基因,通常被用作对照,来确定凝胶泳道间RNA加入量的差异。ICMA-4/GAPDH比率的波动被解释为ICAM-4表达水平的改变。用磷酸琼脂对ICAM-4和GAPDH杂交带进行定量,并测定ICAM-4/GAPDH的比率。
与被激发的待测组动物(n=5)相比较,未被激发的对照动物(n=5)中,ICAM-4/GAPDH比率显著升高,表明由于激发过程,使ICAM-4被调低了。但是,应该注意到,由于对照组动物没有受到任何假激发处理,因此存在这样一种可能性,即ICAM-4 mRNA含量的调整是对与激发有关的外科处理的反应。
实施例18对人ICAM-4上游调节DNA的克隆和分析ICAM-4基因的表达在空间和时间上都受到调控,表达仅局限于脑的最前部或最下面的结构域,即端脑部分。为了试图鉴定负责ICMA-4局限性转录调控的基因序列,对核苷酸5’区到人ICAM-4编码序列进行了检测。
对一个来自7.0kb基因组BamHI片段(实施例10中所述)的2607个碱基对的BamHI/PstI片段进行了序列测定,发现在ATG起始密码子的上游含有1684个核苷酸。此上游区完整的序列列举在SEQ IDNO33中。关于ICAM-4编码区的位置,在ATG起始密码子(在SEQ ID NO33中编号为核苷酸1685-1687的)中的“A”被称为+1核苷酸,与A+1核苷酸紧邻的核苷酸5’被称为-1。这样,完整的序列被显示为从核苷酸-1684延伸到核苷酸+3,相应于序列表中核苷酸1到核苷酸1687的编号。
根据此基因组HuICAM-4序列,合成了寡聚核苷酸,用于通过PCR产生上游调控区内各种长度的DNA分子。列举在表3中的每个寡聚核苷酸都包含一个隔离区(以斜体字显示),约6-10bp,以便能对PCR产物进行酶促消化,每个寡聚核苷酸还包含一个NheI或HindIII,限制性位点(黑体字所示),以及一个特异性杂交引物序列(下面加线的)。寡核苷酸的名字含有指明它在上游调控区内位置的数字。在PCR扩增过程中,如表4所示,寡核苷酸被配对,产生含有特异性上游调控区的DNA片段。
表3用于扩增HuICAM-4上游区的PCR引物HI4-19(AS)C4GAACTAAGCTTACAGGAGGCGAGGAGAGCGCGAG(SEQ ID NO34)HI4-114CAACAATGCTAGCCAAGCGCAACTCTGTCTC(SEQ ID NO35)HI4-149CAACAATGCTAGCCTTGGAAACCAAGTTACC(SEQ ID NO36)HI4-206 CAACAATGCTAGCAGGAGCTTAGCGCACGCTCG(SEQ ID NO37)HI4-270 CAACAATGCTAGCCATGCCGGCCTCCACGTAG(SEQ ID NO38)HI4-408CAACAATGCTAGCGTCCAGCTTATTATCATG(SEQ ID NO39)HI4-480 CAACAATGCTAGCCTTAGTCCCCAAATGTATC(SEQ ID NO40)HI4-560 CAACAATGCTAGCGGAGAAGGATCAGTGAG(SEQ ID NO41)HI4-817 CAACAATGCTAGCCTCCACCCACCGAGCAGAAG(SEQ ID NO42)
在每个寡核苷酸内产生的限制性位点和隔离,为酶促消化和后续的将各个PCR产物克隆进入pGL3基本载体(Promega,Madison,WI)的步骤作好了准备,这种载体在紧靠多克隆位点(MCS)的下游含有一个荧光素酶受体基因。被克隆进入此载体MCS区的启动子活性,在被转染的细胞系内,驱动荧光素酶受体基因的表达,来自被表达的荧光素酶的发光,可以被测定作为启动子活性的指标。pGL3基本载体没有启动子,因此可用作阴性对照,而含有一个SV 40启动子的pGL3载体可作为阳性对照。每个表达结构的序列可通过限制性分析的DNA测序来验证。
用Transfection MBS哺乳动物转染试剂盒(Stratagene,La Jolla,CA),按照厂商提供的方案,将含有表4中所述各种扩增序列的质粒转染进入哺乳动物细胞。将每种质粒引入二种不同的细胞系,COS 7细胞和NT 2前体细胞(Ntera 2/D1,来自Stratagene)。COS 7细胞是通常使用的,以SV 40转化过的猴类成纤维细胞系,这样使它们更适合于在以阳性对照pGL3启动子载体转染的细胞中,驱动在SV 40启动子控制下的基因表达。NT 2前体细胞是一个指定的神经前体细胞系,虽然它们不表达ICAM-4,但它们可能比表达ICAM-4的细胞类型更具有代表生特征。
表4配对的引物和被扩增的结构域寡聚核苷酸对相应的上游调控区HI4-19(AS)和HI4-114-19→-114HI4-19(AS)和HI4-149-19→-149HI4-19(AS)和HI4-206-19→-206HI4-19(AS)和HI4-270-19→-270HI4-19(AS)和HI4-408-19→-408HI4-19(AS)和HI4-480-19→-480HI4-19(AS)和HI4-560-19→-560HI4-19(AS)和HI4-817-19→-817
用6孔平底组织培养板(Falcon),每孔接种2.5×105个细胞。每孔用5μg质粒DNA转染COS 7细胞和NT 2细胞,每个作平行的双份。将此细胞在37℃培养48小时,使细胞裂解后,用荧光素酶测定系统(Promega)测定荧光素酶的活性。
综合在表5中的实验结果显示,在NT 2细胞中,ICAM-4上游调控区的-408到-19和-480到-19区,具有高水平的启动子活性。因为NT 2细胞来自于神经元,所以它们可能表达识别ICAM-4启动子的某些转录因子,在其它类型的细胞未见这种情况。用含有核苷酸-560到-19的质粒转染,在COS细胞转染子中得到了最高水平的启动子活性。虽然阳性对照pGL3启动子载体很适合转染COS细胞,但在NT2细胞中都显示非常低的启动子活性,这说明有一类细胞特别偏爱某些启动子序列。
表55’ICAM-4区启动子活性上游区 发光COSNT2-114至-19 0.003 0.376-149至-19 0.008 0.628-206至-19 0.443 0.622-270至-19 0.056 1.140-408至-19 0.401 7.970-480至-19 0.274 4.630-560至-19 3.227 1.232-817至-19 0.035 4.453pGL3 Promoter Vector 29.070 0.063pGL3 Basic Vector 0.008 0.014因为正常情况下COS 7或NT2都不表达ICAM-4,所以将用初始培养的海马神经细胞重复些相同的实验,这种神经细胞确能表达ICAM-4,也必然表达对ICAM-4启动子活性所需要的转录机制。通过将在此所述的各个启动子构建体及其它构建体,转染到更自然的细胞环境中,有可能更精确地确定在上游调控区是什么分子负责密切地调控脑中的ICAM-4基因。
以上阐述的实施例都与本发明目前优选的实施方案有关,对于本领域的技术人员,预期将会有许多与之有关的改进和改变方案。因此,仅在所附的权利要求中出现的限定,才应该属于本发明的范围。
序列表(1)一般资料(i)申请人Gallatin,W.MichaelKilgannon,Patrick D.
(ii)发明名称ICAM-4材料和方法(iii)序列数42(iv)相关地址(A)收信人Marshall,O’Toole,Gerstein,Murray & Borun(B)街道233 South Wacker Drive,6300 Sears Tower(C)城市Chicago(D)州Illinois(E)国家United States ofAmerica(F)邮编60606-6402(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,Version#1.25(vi)当前申请数据(A)申请号(B)提交日期(C)分类(vii)在先申请数据(A)申请号US 07/827,689(B)提交日期27-JAN-1992(vii)在先申请数据(A)申请号US 07/889,724(B)提交日期26-MAY-1992(vii)在先申请数据(A)申请号US 07/894,061(B)提交日期05-JUN-1992
(vii)在先申请数据(A)申请号US 08/009,266(B)提交日期22-JAN-1993(vii)在先申请数据(A)申请号US 08/102,852(B)提交日期05-AUG-1993(vii)在先申请数据(A)申请号US 08/245,295(B)提交日期18-MAY-1994(vii)在先申请数据(A)申请号US 08/485,604(B)提交日期07-JUN-1995(viii)律师/代理人资料(A)姓名WILLIAMS,JR.JOSEPH A.
(B)注册号38,659(C)参考/登记号27866/33321(ix)通讯资料(A)电话312-474-6300(B)电传312-474-0448(C)电报25-3856(2)SEQ ID NO1的资料(i)序列特征(A)长度2988个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置61..2814
(xi)序列描述SEQ ID NO1AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA60ATG CCG GGG CCT TCA CCA GGG CTG CGC CGA ACG CTC CTC GGC CTC TGG 108Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp1 5 10 15GCT GCC CTG GGC CTG GGG ATC CTA GGC ATC TCA GCG GTC GCG CTA GAA 156Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala Val Ala Leu Glu20 25 30CCT TTC TGG GCG GAC CTT CAG CCC CGC GTG GCG CTC GTG GAG CGC GGG 204Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Leu Val Glu Arg Gly35 40 45GGC TCG CTG TGG CTC AAC TGC AGC ACT AAC TGT CCG AGG CCG GAG CGC 252Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60GGT GGC CTG GAG ACC TCG CTA CGC CGA AAC GGG ACC CAG AGG GGT CTG 300Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80CGC TGG CTG GCT CCA CAG CTG GTG GAC ATC CGA GAG CCT GAA ACC CAG 348Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95CCG GTC TGC TTC TTC CGC TGC GCG CGC CGC ACA CTC CAA GCG CGT GGG 396Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110CTC ATC CGA ACT TTC CAG CGA CCG GAT CGG GTA GAG CTA GTG CCT CTG 444Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Val Pro Leu115 120 125CCT CCT TGG CAG CCT GTA GGT GAG AAC TTC ACC TTG AGC TGC AGG GTC 492Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140CCG GGG GCA GGA CCC CGA GCG AGC CTC ACA TTG ACC TTG CTG CGA GGC 540Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160GGC CAG GAG CTG ATT CGC CGA AGT TTC GTA GGC GAG CCA CCC CGA GCT 588Gly Gln Glu Leu Ile Arg Arg Ser Phe Val Gly Glu Pro Pro Arg Ala165 170 175CGG GGT GCG ATG CTC ACC GCC ACG CTC CTG GCG CGC AGA GAG GAT CAC 636Arg Gly Ala Met Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190AGG GCC AAT TTC TCA TGC CTC GCG CTT GAC CTC CTG CGG CCA CAC GGC 684Arg Ala Asn Phe Ser CYs Leu Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205TTG GGA CTG TTT GCA AAC AGC TCA GCC CCC AGA CAG CTC CGC ACG TTT 732Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe210 215 220GCC ATG CCT CCA CTT TCC CCG AGC CTT ATT GCC CCA CGA TTC TTA GAA 780Ala Met Pro Pro Leu Ser Pro Ser Leu Ile Ala Pro Arg Phe Leu Glu225 230 235 240
GTG GGC TCA GAA AGG CCG GTG ACT TGC ACT TTG GAT GGA CTG TTT CCT628Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro245 250 255GCC CCA GAA GCC GGG GTT TAC CTC TCT CTG GGA GAT CAG AGG CTT CAT876Ala Pro Glu Ala Gly Val Tyr Leu Ser Leu Gly Asp Gln Arg Leu His260 265 270CCT AAT GTG ACC CTC GAC GGG GAG AGC CTT GTG GCC ACT GCC ACA GCT924Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala Thr Ala Thr Ala275 280 285ACA GCA AGT GAA GAA CAG GAA GGC ACC AAA CAG CTG ATG TGC ATC GTG972Thr Ala Ser Glu Glu Gln Glu Gly Thr Lys Gln Leu Met Cys Ile Val290 295 300ACC CTC GGG GGC GAA AGC AGG GAG ACC CAG GAA AAC CTG ACT GTC TAC1020Thr Leu Gly Gly Glu Ser Arg Glu Thr Gln Glu Asn Leu Thr Val Tyr305 310 315 320AGC TTC CCG GCT CCT CTT CTG ACT TTA AGT GAG CCA GAA GCC CCC GAG1068Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu325 330 335GGA AAG ATG GTG ACC GTA AGC TGC TGG GCA GGG GCC CGA GCC CTT GTC1116Gly Lys Met Val Thr Val Ser Cys Trp Ala Gly Ala Arg Ala Leu Val340 345 350ACC TTG GAG GGA ATT CCA GCT GCG GTC CCT GGG CAG CCC GCT GAG CTC1164Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu355 360 365CAG TTA AAT GTC ACA AAG AAT GAC GAC AAG CGG GGC TTC TTC TGC GAC1212Gln Leu Asn Val Thr Lys Asn Asp Asp Lys Arg Gly Phe Phe Cys Asp370 375 380GCT GCC CTC GAT GTG GAC GGG GAA ACT CTG AGA AAG AAC CAG AGC TCT1260Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn Gln Ser Ser385 390 395 400GAG CTT CGT GTT CTG TAC GCA CCT CGG CTG GAT GAC TTG GAC TGT CCC1308Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro405 410 415AGG AGC TGG ACG TGG CCA GAG GGT CCA GAG CAG ACC CTC CAC TGC GAG1356Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu His Cys Glu420 425 430GCC CGT GGA AAC CCT GAG CCC TCC GTG CAC TGT GCA AGG CCT GAC GGT1404Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Pro Asp Gly435 440 445GGG GCG GTG CTA GCG CTG GGC CTG TTG GGT CCA GTG ACC CGT GCC CTC1452Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460GCG GGC ACT TAC CGA TGT ACA GCA ATC AAT GGG CAA GGC CAG GCG GTC1500Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gln Gly Gln Ala Val465 470 475 480AAG GAT GTG ACC CTG ACT GTG GAA TAT GCC CCA GCG CTG GAC AGT GTA1548Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495
GGC TGC CCA GAA CGT ATT ACT TGG CTG GAG GGG ACA GAG GCA TCG CTT1596Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510AGC TGT GTG GCA CAC GGG GTC CCA CCA CCT AGC GTG AGC TGT GTG CGC1644Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg515 520 525TCT GGA AAG GAG GAA GTC ATG GAA GGG CCC CTG CGT GTG GCC CGG GAG1692Ser Gly Lys Glu Glu Val Met Glu Gly Pro Leu Arg Val Ala Arg Glu530 535 540CAC GCT GGC ACT TAC CGA TGC GAA GCC ATC AAC GCC AGG GGA TCA GCG1740His Ala Gly Thr Tyr Arg Cys Glu Ala Ile Asn Ala Arg Gly Ser Ala545 550 555 560GCC AAA AAT GTG GCT GTC ACG GTG GAA TAT GGT CCC AGT TTT GAG GAG1788Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Ser Phe Glu Glu565 570 575TTG GGC TGC CCC AGC AAC TGG ACT TGG GTA GAA GGA TCT GGA AAA CTG1836Leu Gly Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Lys Leu580 585 590TTT TCC TGT GAA GTT GAT GGG AAG CCG GAA CCA CGC GTG GAG TGC GTG1884Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Val595 600 605GGC TCG GAG GGT GCA AGC GAA GGG GTA GTG TTG CCC CTG GTG TCC TCG1932Gly Sar Glu Gly Ala Ser Glu Gly Val Val Leu Pro Leu Val Ser Ser610 615 620AAC TCT GGT TCC AGA AAC TCT ATG ACT CCT GGT AAC CTG TCA CCG GGT1980Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly625 630 635 640ATT TAC CTC TGC AAC GCC ACC AAC CGG CAT GGC TCC ACA GTC AAA ACA2028Ile Tyr Leu Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr645 650 655GTC GTC GTG AGC GCG GAA TCA CCG CCA CAG ATG GAT GAA TCC AGT TGC2076Val Val Val Ser Ala Glu Ser Pro Pro Gln Met Asp Glu Ser Sar Cys660 665 670CCG AGT CAC CAG ACA TGG CTG GAA GGA GCC GAG GCT ACT GCG CTG GCC2124Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Leu Ala675 680 685TGC AGT GCC AGA GGC CGC CCC TCT CCA CGC GTG CGC TGT TCC AGG GAA2172Cys Ser Ala Arg Gly Arg Pro Ser Pro Arg Val Arg Cys Sar Arg Glu690 695 700GGT GCA GCC AGG CTG GAG AGG CTA CAG GTG TCC CGA GAG GAT GCG GGG2220Gly Ala Ala Arg Leu Glu Arg Leu Gln Val Ser Arg Glu Asp Ala Gly705 710 715 720ACC TAC CTG TGT GTG GCT ACC AAC GCG CAT GGC ACG GAT TCA CGG ACC2268Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr725 730 735GTC ACT GTG GGT GTG GAA TAC CGG CCT GTG GTG GCT GAG CTG GCA GCC2316Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala740 745 750
TCG CCC CCA AGC GTG CGG CCT GGC GGA AAC TTC ACT CTG ACC TGC CGT 2364Sar Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg755 760 765GCA GAG GCC TGG CCT CCA GCC CAG ATC AGC TGG CGC GCG CCC CCG GGA 2412Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly770 775 780GCT CTC AAC CTC GGT CTC TCC AGC AAC AAC AGC ACG CTG AGC GTG GCG 2460Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala785 790 795 800GGT GCC ATG GGC AGC CAT GGT GGC GAG TAT GAG TGC GCA GCC ACC AAT 2508Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn805 810 815GCG CAT GGG CGC CAC GCA CGG CGC ATC ACG GTG CGC GTG GCC GGT CCA 2556Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro820 825 830TGG CTG TGG GTC GCT GTG GGC GGT GCG GCA GGG GGC GCG GCG CTG CTG 2604Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu835 840 845GCC GCA GGG GCC GGC CTG GCC TTC TAC GTG CAG TCC ACC GCT TGC AAG 2652Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys850 855 860AAG GGA GAG TAC AAC GTC CAG GAG GCT GAG AGC TCA GGC GAG GCG GTG 2700Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Sar Sar Gly Glu Ala Val865 870 875 880TGT CTC AAT GGC GCG GGC GGG ACA CCG GGT GCA GAA GGC GGA GCA GAG 2748Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu885 890 895ACC CCC GGC ACT GCC GAG TCA CCT GCA GAT GGC GAG GTT TTC GCC ATC 2796Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile900 905 910CAG CTG ACA TCT TCC TGAGCCTGTA TCCAGCTCCC CCAGGGGCCT CGAAAGCACA 2851Gln Leu Thr Ser Ser915GGGGTGGACG TATGTATTGT TCACTCTCTA TTTATTCAAC TCCAGGGGCG TCGTCCCCGT2911TTTCTACCCA TTCCCTTAAT AAAGTTTTTA TAGGAGAAAA AAAAAAAAAA AAAAAAAAAA2971AAAAAAAAAA AAAAAAA 2988(2)SEQ ID NO2的资料(i)序列特征(A)长度917个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2
Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Thr Leu Leu Gly Leu Trp1 5 10 15Ala Ala Leu Gly Leu Gly Ile Leu Gly Ile Ser Ala Val Ala Leu Glu20 25 30Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Leu Val Glu Arg Gly35 40 45Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Val Pro Leu115 120 125Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160Gly Gln Glu Leu Ile Arg Arg Ser Phe Val Gly Glu Pro Pro Arg Ala165 170 175Arg Gly Ala Met Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190Arg Ala Asn Phe Ser Cys Leu Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205Leu Gly Leu Phe Ala Asn Ser Ser Ala Pro Arg Gln Leu Arg Thr Phe210 215 220Ala Met Pro Pro Leu Ser Pro Ser Leu Ile Ala Pro Arg Phe Leu Glu225 230 235 240Val Gly Ser Glu Arg Pro Val Thr Cys Thr Leu Asp Gly Leu Phe Pro245 250 255Ala Pro Glu Ala Gly Val Tyr Leu Ser Leu Gly Asp Gln Arg Leu His260 265 270Pro Asn Val Thr Leu Asp Gly Glu Ser Leu Val Ala Thr Ala Thr Ala275 280 285Thr Ala Sar Glu Glu Gln Glu Gly Thr Lys Gln Leu Met Cys Ile Val290 295 300Thr Leu Gly Gly Glu Ser Arg Glu Thr Gln Glu Asn Leu Thr Val Tyr305 310 315 320Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Glu Ala Pro Glu325 330 335Gly Lys Met Val Thr Val Sar Cys Trp Ala Gly Ala Arg Ala Leu Val340 345 350
Thr Leu Glu Gly Ile Pro Ala Ala Val Pro Gly Gln Pro Ala Glu Leu355 360 365Gln Leu Asn Val Thr Lys Asn Asp Asp Lys Arg Gly Pne Phe Cys Asp370 375 380Ala Ala Leu Asp Val Asp Gly Glu Thr Leu Arg Lys Asn Gln Ser Ser385 390 395 400Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Leu Asp Cys Pro405 410 415Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu His Cys Glu420 425 430Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Pro Asp Gly435 440 445Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460Ala Gly Thr Tyr Arg Cys Thr Ala Ile Asn Gly Gln Gly Gln Ala Val465 470 475 480Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510Ser Cys Val Ala His Gly Val Pro Pro Pro Ser Val Ser Cys Val Arg515 520 525Ser Gly Lys Glu Glu Val Met Glu Gly Pro Leu Arg Val Ala Arg Glu530 535 540His Ala Gly Thr Tyr Arg Cys Glu Ala Ile Asn Ala Arg Gly Ser Ala545 550 555 560Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Ser Phe Glu Glu565 570 575Leu Gly Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Lys Leu580 585 590Phe Ser Cys Glu Val Asp Gly Lys Pro Glu Pro Arg Val Glu Cys Val595 600 605Gly Ser Glu Gly Ala Ser Glu Gly Val Val Leu Pro Leu Val Ser Ser610 615 620Asn Ser Gly Ser Arg Asn Ser Met Thr Pro Gly Asn Leu Ser Pro Gly625 630 635 640Ile Tyr Leu Cys Asn Ala Thr Asn Arg His Gly Ser Thr Val Lys Thr645 650 655Val Val Val Ser Ala Glu Ser Pro Pro Gln Met Asp Glu Ser Ser Cys660 665 670Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Thr Ala Leu Ala675 680 685
Cys Ser Ala Arg Gly Arg Pro Ser Pro Arg Val Arg Cys Sar Arg Glu690 695 700Gly Ala Ala Arg Leu Glu Arg Leu Gln Val Ser Arg Glu Asp Ala Gly705 710 715 720Thr Tyr Leu Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr725 730 735Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala740 745 750Ser Pro Pro Ser Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg755 760 765ALa Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Gly770 775 780Ala Leu Asn Leu Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala785 790 795 800Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Ala Thr Asn805 810 815Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro820 825 830Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu835 840 845Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala Cys Lys850 855 860Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Sar Gly Glu Ala Val865 870 875 880Cys Leu Asn Gly Ala Gly Gly Thr Pro Gly Ala Glu Gly Gly Ala Glu885 890 895Thr Pro Gly Thr Ala Glu Ser Pro Ala Asp Gly Glu Val Phe Ala Ile900 905 910Gln Leu Thr Ser Ser915(2)SEQ ID NO3的资料(i)序列特征(A)长度315个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(ix)特征(A)名称/关键词CDS(B)位置1..315
(xi)序列描述SEQ ID NO3CCG GAT CGG GTA GAG CTA GTG CCT CTG CCT CCT TGG CAG CCT GTA GGT48Pro Asp Arg Val Glu Leu Val Pro Leu Pro Pro Trp Gln Pro Val Gly1 5 10 15GAG AAC TTC ACC TTG AGC TGC AGG GTC CCG GGG GCA GGA CCC CGA GCG96Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala20 25 30AGC CTC ACA TTG ACC TTG CTG CGA GGC GGA CAG GAG CTG ATT CGC CGA144Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg35 40 45AGT TTC GTA GGC GAG CCA CCC CGA GCT CGG TGT GCG ATG CTC ACC GCC192Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala50 55 60ACG GTC CTG GCG CGC AGA GAG GAT CAC AGG GAC AAT TTC TCA TGC CTC240Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu65 70 75 80GCG GAG CTT GAC CTG CGG ACA CAC GGC TTG GGA CTG TTT GCA AAC AGC288Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Sar85 90 95TCA GCC CCC AGA CAG CTC CGC ACG TTT315Ser Ala Pro Arg Gln Leu Arg Thr Phe100 105(2)SEQ ID NO4的资料(i)序列特征(A)长度1781个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置16..1659(xi)序列描述SEQ ID NO4CAGCTCCTCTG TCAGA ATG GCC ACC ATG GTA CCA TCC GTG TTG TGG CCC AGG51Met Ala Thr Met Val Pro Ser Val Leu Trp Pro Arg1 5 10GCC TGC TGG ACT CTG CTG GTC TGC TGT CTG CTG ACC CCA GGT GTC CAG 99Ala Cys Trp Thr Leu Leu Val Cys Cys Leu Leu Thr Pro Gly Val Gln15 20 25GGG CAG GAG TTC CTT TTG CGG GTG GAG CCC CAG AAC CCT GTG CTC TCT 147Gly Gln Glu Phe Leu Leu Arg Val Glu Pro Gln Asn Pro Val Leu Ser30 35 40
GCT GGA GGG TCC CTG TTT GTG AAC TGC AGT ACT GAT TGT CCC AGC TCT195Ala Gly Gly Ser Leu Phe Val Asn Cys Ser Thr Asp Cys Pro Ser Ser45 50 55 60GAG AAA ATC GCC TTG GAG ACG TCC CTA TCA AAG GAG CTG GTG GCC AGT243Glu Lys Ile Ala Leu Glu Thr Ser Leu Ser Lys Glu Leu Val Ala Ser65 70 75GGC ATG GGC TGG GCA GCC TTC AAT CTC AGC AAC GTG ACT GGC AAC AGT291Gly Met Gly Trp Ala Ala Phe Asn Leu Ser Asn Val Thr Gly Asn Ser80 85 90CGG ATC CTC TGC TCA GTG TAC TGC AAT GGC TCC CAG ATA ACA GGC TCC339Arg Ile Leu Cys Ser Val Tyr Cys Asn Gly Ser Gln Ile Thr Gly Ser95 100 105TCt AAC ATC ACC GTG TAC GGG CTC CCG GAG CGT GTG GAG CTG GCA CCC387Ser Asn Ile Thr Val Tyr Gly Leu Pro Glu Arg Val Glu Leu Ala Pro110 115 120CTG CCT CCT TGG CAG CCG GTG GGC CAG AAC TTC ACC CTG CGC TGC CAA435Leu Pro Pro Trp Gln Pro Val Gly Gln Asn Phe Thr Leu Arg Cys Gln125 130 135 140GTG GAG GGT GGG TCG CCC CGG ACC AGC CTC ACG GTG GTG CTG CTT CGC483Val Glu Gly Gly Ser Pro Arg Thr Ser Leu Thr Val Val Leu Leu Arg145 150 155TGG GAG GAG GAG CTG AGC CGG CAG CCC GCA GTG GAG GAG CCA GCG GAG531Trp Glu Glu Glu Leu Ser Arg Gln Pro Ala Val Glu Glu Pro Ala Glu160 165 170GTC ACT GCC ACT GTG CTG GCC AGC AGA GAC GAC CAC GGA GCC CCT TTC579Val Thr Ala Thr Val Leu Ala Sar Arg Asp Asp His Gly Ala Pro Phe175 180 185TCA TGC CGC ACA GAA CTG GAC ATG CAG CCC CAG GGG CTG GGA CTG TTC627Ser Cys Arg Thr Glu Leu Asp Met Gln Pro Gln Gly Leu Gly Leu Phe190 195 200GTG AAC ACC TCA GCC CCC CGC CAG CTC CGA ACC TTT GTC CTG CCC GTG675Val Asn Thr Ser Ala Pro Arg Gln Leu Arg Thr Phe Val Leu Pro Val205 210 215 220ACC CCC CCG CGC CTC GTG GCC CCC CGG TTC TTG GAG GTG GAA ACG TCG723Thr Pro Pro Arg Leu Val Ala Pro Arg Pne Leu Glu Val Glu Thr Ser225 230 235TGG CCG GTG GAC TGC ACC CTA GAC GGG CTT TTT CCA GCC TCA GAG GCC771Trp Pro Val Asp Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala240 245 250CAG GTC TAC CTG GCG CTG GGG GAC CAG ATG CTG AAT GCG ACA GTC ATG819Gln Val Tyr Leu Ala Leu Gly Asp Gln Met Leu Asn Ala Thr Val Met255 260 265AAC CAC GGG GAC ACG CTA ACG GCC ACA GCC ACA GCC ACG GCG CGC GCG867Asn His Gly Asp Thr Leu Thr Ala Thr Ala Thr Ala Thr Ala Arg Ala270 275 280GAT CAG GAG GGT GCC CGG GAG ATC GTC TGC AAC GTG ACC CTA GGG GGC915Asp Gln Glu Gly Ala Arg Glu Ile Val Cys Asn Val Thr Leu Gly Gly285 290 295 300
GAG AGA CGG GAG GCC CGG GAG AAC TTG ACG GTC TTT AGC TTC CTA GGA 963Glu Arg Arg Glu Ala Arg Glu Asn Leu Thr Val Phe Ser Phe Leu Gly305 310 315CCC ATT GTG AAC CTC AGC GAG CCC ACC GCC CAT GAG GGG TCC ACA GTG 1011Pro Ile Val Asn Leu Ser Glu Pro Thr Ala His Glu Gly Ser Thr Val320 325 330ACC GTG AGT TGC ATG GCT GGG GCT CGA GTC CAG GTC ACG CTG GAC GGA 1059Thr Val Ser Cys Met Ala Gly Ala Arg Val Gln Val Thr Leu Asp Gly335 340 345GTT CCG GCC GCG GCC CCG GGG CAG ACA GCT CAA CTT CAG CTA AAT GCT 1107Val Pro Ala Ala Ala Pro Gly Gln Thr Ala Gln Leu Gln Leu Asn Ala350 355 360ACC GAG AGT GAC GAC GGA CGC AGC TTC TTC TGC AGT GCC ACT CTC GAG 1155Thr Glu Ser Asp Asp Gly Arg Ser Phe Phe Cys Ser Ala Thr Leu Glu365 370 375 380GTG GAC GGC GAG TTC TTG CAC AGG AAC AGT AGC GTC CAG CTG CGA GTC 1203Val Asp Gly Glu Phe Leu His Arg Asn Ser Ser Val Gln Leu Arg Val385 390 395CTG TAT GGT CCC AAA ATT GAC CGA GCC ACA TGC CCC CAG CAC TTG AAA 1251Leu Tyr Gly Pro Lys Ile Asp Arg Ala Thr Cys Pro Gln His Leu Lys400 405 410TGG AAA GAT AAA ACG AGA CAC GTC CTG CAG TGC CAA GCC AGG GGC AAC 1299Trp Lys Asp Lys Thr Arg His Val Leu Gln Cys Gln Ala Arg Gly Asn415 420 425CCG TAC CCC GAG CTG CGG TGT TTG AAG GAA GGC TCC AGC CGG GAG GTG 1347Pro Tyr Pro Glu Leu Arg Cys Leu Lys Glu Gly Ser Ser Arg Glu Val430 435 440CCG GTG GGG ATC CCG TTC TTC GTC AAC GTA ACA CAT AAT GGT ACT TAT 1395Pro Val Gly Ile Pro Phe Phe Val Asn Val Thr His Asn Gly Thr Tyr445 450 455 460CAG TGC CAA GCG TCC AGC TCA CGA GGC AAA TAC ACC CTG GTC GTG GTG 1443Gln Cys Gln Ala Ser Ser Ser Arg Gly Lys Tyr Thr Leu Val Val Val465 470 475ATG GAC ATT GAG GCT GGG AGC TCC CAC TTT GTC CCC GTC TTC GTG GCG 1491Met Asp Ile Glu Ala Gly Ser Ser His Phe Val Pro Val Phe Val Ala480 485 490GTG TTA CTG ACC CTG GGC GTG GTG ACT ATC GTA CTG GCC TTA ATG TAC 1539Val Leu Leu Thr Leu Gly Val Val Tnr Ile Val Leu Ala Leu Met Tyr495 500 505GTC TTC AGG GAG CAC CAA CGG AGC GGC AGT TAC CAT GTT AGG GAG GAG 1587Val Phe Arg Glu His Gln Arg Ser Gly Ser Tyr His Val Arg Glu Glu510 515 520AGC ACC TAT CTG CCC CTC ACG TCT ATG CAG CCG ACA GAA GCA ATG GGG 1635Ser Thr Tyr Leu Pro Leu Thr Ser Mer Gln Pro Thr Glu Ala Met Gly525 530 535 540GAA GAA CCG TCC AGA GCT GAG TGACGCTGGG ATCCGGGATC AAAGTTGGCG 1686Glu Glu Pro Ser Arg Ala Glu545GGGGCTTGGC TGTGCCCTCA GATTCCGCAC CAATAAAGCC TTCAAACTCC CAAAAAAAAA1746AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAA 1781
(2)SEQ ID NO5的资料(i)序列特征(A)长度4900个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO5CCGAACGCTC CTCGGCCTCT GGTCTNCTCT GGNCCTGGGG ATCCTAGGCA TCTCAGGTAA60GAAGAGCCCG CCCGTGGAGC NAGGTGGATA AGGCGGGGGC GGAATTGAAG GACCAGAGAG120GGCGGCCCGG GTGTCCCCCT CCAGGCTCCG CCCTCTTCTA GCTTCCCACG CTTCTGTCAC180CACCTGGAGN TCGGGGCTTC TCCCCGTCCT TCCTCCACCC CAACACACCT CAATCTTTCA240GANCTGAACC CAGCACCTTT TCTGGANTNG GGGNNTTGCA CCTAACCTGT CTCAGGAGAN300ACTGTGGCTC TCCTGTCCTC TCCTGCTCTG TNATGCCCTA TGGTTCACAG ACTGGCATCA360TCCCTATTCA TGATCCTCAA AGACNCCATC TCCTCAACTG TCATAACTCA GAGCTCTATT420CCCCCTCCAC CTGGAGCCCT GGAAACCGGC TTTCTAGGGC TTTTCTCCGC GGTTCTTTCC480CGGAGTTCAG CGTTGTGGCT TTTTGTCCAA GTTACTCAAG TTTGGGGACA ATCTCCTTTA540AGCCTTTGAC TCAGTCTCAT TTCCACTTTG CTTTTGCCCC AAGCCTCTGT GTCTCTCCCC600CATTTCCTGA CGATCTGTCA GAGTCTTAAG AGTGATTTGG TTCCCCATCC CCCCTCCAAC660TGGAGTCTCC TCCTCACTAT TGATGTGTGC ATCTGAGACC CCCATCCCCG CACCGAGTTT720CCCCATCTCT GTCAGTAAAG AGCAAGGCTT CCAGAGACAA CCCTCTAATA GCGCGTCAGT780CCCGAATCTT GAGTGGGATG CGGGACTCCC GTGCTATTTC TTGGCGGAGG TCTTTCCTGG840TCCTTATGGA CACCCCTGGT TTGGGATATG GGGGCCGCTA AGATTTCAGA GATGGGGTCC900CTAGGCTGAG NCCGCGTTTT CCCGGGCAGC GGTCGCGCTA GAACCTTTCT GGGCGGACCT960TCAGCCCCGC GTGGCGCTCG TGGAGCGCGG GGGCTCGCTG TGGCTCAACT GCAGCACTAA1020CTGTCCGAGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTA CGCCGAAACG GGACCCAGAG1080GGGTCTGNAC TGNCTGGCTC GACAGCTGGT GGACATCCGA GANCCTGAAA CCCAGCCGGT1140CTGCTTCTTC CNCTGCGCGC GCCGCACACT CCAAGCGCGT GGGCTCATCC GAACTTTCCG1200TGAGTTCAGG GTGGGCACNC CCCTTGGGTC TCTGGACCTC CCCCTCAAGC TCCTCCCACC1260CGCCCTCTGA TCCTCCTGCT TGTCTGGAAA GTACTACAGC TGGCTAGAGC GGAGTTTTTG1320GTCCCTTGCA GAGCGACCGG ATCGGGTAGA GCTAGTGCCT CTGCCTCCTT GGCAGCCTGT1380AGGTGAGAAC TTCACCTTGA GCTGCAGGGT CCCGGGGGCA GGACCCCGAG CGAGCCTCAC1440
ATTGACCTTG CTGCGAGGCG GCCAGGAGCT GATTCGCCGA AGTTTCGTAG GCGAGCCACC1500CCGAGCTCGG GGTGCGATGC TCACCGCCAC GGTCCTGGCG CGCAGAGAGG ATCACAGGGC1560CAATTTCTCA TGCCTCGCGG AGCTTGACCT GCGNCCACAC GGCTTGGGAC TGTTTGCANA1620CAGCTCAGCC CCCAGACAGC TCCGCACGTT TGGTGAGTGT GGACCCTAAC TGACAGATTT1680TAAGAAGTTT AGGGCAGCCA GGCGTGGTGG CATGGTGTCG TAGGCCCTAA GTCCCAGCCC1740AAGCAGANCT AAGNCGGATC TCTTGTGAAT TAAAAGTCTA GCTCGTCTAC ATAACGAGGN1800CTGCATAGTT AAATCCCCCA AAAGTCTAAG CAGCTAGCCC TTACTTCCAA CACAAGTACT1860AGCTTAAGTA CTTTCTCCTG TGAGCTTTTT CCTTTATGTA TTTACTCGTT GAGAGAAAAA1920GAGAGTGTGT GTACGTGCCT TTATGCACAT GCCGCAGTGC TTGTATGGAA GTTAAAGAAT1980AAGGAGGCGT TCTGCCCTTC CATCCTGTGG GTCCTAGGGG TGGTATTAGC TCCTCAGGCT2040TTGTTAGTNA CAAGCGCCTA GGCTTGGGGA GCCATCTCGC CCGCTCCTCT GTATCTTTAG2100GGTGAAACCA GACAATGCAT GCAAATTGGT TGATCAACAC TGAATGTTTA GTTCGTAAAT2160TCAAGCTCTG TTCTTTGTCT TCCTCAGCCA TGCCTCCACT TTCCCCCGAG CCTTATTGCC2220CCACGATTCT TAGAAGTGGG CTCAGAAAGG CCGGTGACKT GCACTTTGGA TGGACTGTTT2280CCTGCCCCAG AAGCCGGGGT TTACTTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG2340ACCCTCGACG GGGAGAGCCT TGTGGCCACT GCCACAGCTA CAGCAAGTGA AGAACAGGAA2400GGCACCAAAC AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA2460AACCTGACTG TCTACAGTAA GGGGAATCCA ACAAGACCTT CAATAGCTCA GACTGGGGCT2520GGGGCTGGGT CTGGGTCTGG GGCCAGAGTC TCACAAAGGC GGAGCCTATA AAGTGGGCGG2580GACCTCCACA CCAGAACAAG CCGGGCGGGA GAGTTCCAGG GCAGGAGCAG ATAGAAGTTG2640GAAATTAATA GATTGGGTTG AGTTCCCTGA GTGGGGAGTG AACCCCACCC AATTCTCTGT2700CCCCAGGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA2760TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAA2820GGACCCTCTT ACCGGCCCCA TCTTTAACCT TATCGTATCC CCTCTGCCTC ATGCCCGCAG2880ACGCACCTCG GCTGGATGAC TTGGACTGTC CCAGGAGCTG GACGTGGCCA GAGGGTCCAG2940AGCAGACCCT CCACTGCGAG GCCCGTGGAA ACCCTGAGCC CTCCGTGCAC TGTGCAAGGC3000CTGACGGTGG GGCGGTGCTA GCGCTGGGCC TGTTGGGTCC AGTGACCCGT GCCCTCGCGG3060GCACTTACCG ATGTACAGCA ATCAATGGGC AAGGCCAGGC GGTCAAGGAT GTGACCCTGA3120CTGTGGAATG TGAGTAGGGG GAGGTGGGCA TGCTTATCCC TTTAAGGTCA CGGAGTGTAC3180TGGGAGACTG GCTATACGGA AAGGAAAGAA GCCTAGGTTC AGCAGGGATT GGGAAAACAC3240TGAAGGAAAG TGGTGTGGTG TTTACAAACT TAACGGTGGT AACTGGGCAC GGTCTGGCAA3300AAACAGACAG CCAAGAGAGT GTGCCTGGGA AGCTGCAATG GGGGCTTTGT GGGAATTGGT3360CAACAGCACC CTGAGATCTC AGGAAAGGGG CCTGAAGTTA TCTCCAGAAC CCATGTGAAG3420
GCAGGAAGAG AGAACGCCCA CCTTTTCCTG CTCCCCCCAA CCCCCCCCCA CATATCACAC3480GGAGTATATA AATAAATAAA ATGGCTCCTG CCGGAGGGAG TGAGAAGCTG TCTCCTGCAG3540GCTCAGAGCA GTGGTAGTGC ATGCCTTTAA TCCCAGCACT CGGTAGGCAA AGGCAGGCAG3600ATCTCTGTGA ATGTGGGGCC AGCCTGGTCT GTACAGAGAA ATCCTGTCTC AAAACAAACC3660AGCAAAGAAA CAAAACCAAA ATCAATTCCA GATGCCCCAG CGCTGGACAG TGTAGGCTGC3720CCANGACGTA TTACTTGNCT GGAGGGGACA GAGGCATCGC TTAGCTGTGT GGCACACGGG3780GTCCCACCAC CTAGCGTGAG CTGTGTGCGC TCTGGAAAGG AGGAAGTCAT GGAAGGGCCC3840CTGCGTGTGG CCCGGGAGCA CGCTGGCACT TACCGATGCG AAGCCATCAA CGCCAGGGGA3900TCAGCGGNCA AAAATGTGGC TGTCACGGTG GAATGTGAGT AGGGGTGGCT ACGGAAATGT3960CCACACCTGC GTCCTCTGTC CTCAGTGTGA ACTCCTATTT CCCTGCTTCC TAGATGGTCC4020CAGTTNTGAG GAGTTGGGCT GCCCCAGCAA CTGGACTTGG GTAGAAGGAT CTGGAAAACT4080CTTTTCCTGT GAAGTTGATG GGAAGCCGGA ACCACGCGTG GAGTGCGTGG GCTCGGAGGG4140TGCAAGCGAA GGGGTAGTGT TGCCCCTGGT GTCCTCGAAC TCTGGTTCCA GAAACTCTAT4200GACTCCTGGT AACCTGTCAC CGGGTATTTA CCTCTGCAAC GCCACCAACC GGCATGGCTC4260CACAGTCAAA ACAGTCGTCG TGAGCGCGGA ATGTGAGCAG GGGCCCAGGT GGGCGGAGAG4320TACCGGGTGT CCCAGGATCT TTTCTTTCCC TGATGCCCCT CCTTATGGTG GCTGATCTGC4380AGCACCGCCA CAGATGGATG AATCCAGTTG CCCGAGTCAC CAGACATGGC TGGAAGGAGC4440CGAGGCTACT GCGCTGGCCT GCAGTGACAG GGGNCGCCCC TCTCCACGCG TGCGCTGTTC4500CAGGGAAGGT GCAGCCAGGC TGGAGAGGCT ACAGGTGTCC CGAGAGGATG CGGGGACCTA4560CCTGTGTGTG GCTACCAACG CGCATGGCAC GGATTCACGG ACCGTCACTG TGGGTGTGGA4620ATGTGAGTGA GGACAGCGCT GAATGAAGAC GACTCAGACC GCCAGAAAAG TGCCTTGAGG4680CCTGGGATGT ATGATCCAGT GGGTAGAATG CTCAATTAGC ACTCACTAAA ATGTATATTC4740TATTCCTAAT ACTCTTTAAT TTTANCCTTT GGGAGGCAGA GACAGGCAGA TCTCTGTTCC4800GGGATAACCT GCTCTCTGTC TAGGACAGCT TGGTCTACAG AGGGGNTACA GGCCCCCCCT4860CCCAAGATTG NATAGCAACC CTCTGGCTCC CTGTCTCTCT 4900(2)SEQ ID NO6的资料(i)序列特征(A)长度1295个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA
(xi)序列描述SEQ ID NO6NGAATTCCGG CGGATCGGGT AGAGCTAGTG CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG60AACTTCACCT TGAGCTGCAG GGTCCCGGGG GCAGGACCCC GAGCGAGCCT CACATTGACC120TTGCTGCGAG GCGGCCAGGA GCTGATTCGC CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT180CGGGGTGCGA TGCTCACCGC CACGGTCCTG GCGCGCAGAG AGGATCACAG GGCCAATTTC240TCATGCCTCG CGGAGCTTGA CCTGCGGCCA CACGGCTTGG GACTGTTTGC AAACAGCTCA300GCCCCCAGAC AGCTCCGCAC GTTTGCCATG CCTCCACTTT CCCCGAGCCT TATTGCCCCA360CGATTCTTAG AAGTGGGCTC AGAAAGGCCG GTGACTTGCA CTTTGGATGG ACTGTTTCCT420GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG GGAGATCAGA GGCTTCATCC TAATGTGACC480CTCGACGGGG AGAGCCTTGT GGCCACTGCC ACAGCTACAG CAAGTGAAGA ACAGGAAGGC540ACCAAACAGC TGATGTGCAT CGTGACCCTC GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC600CTGACTGTCT ACAGCTTCCC GGCTCCTCTT CTGACTTTAA GTGAGCCAGA AGCCCCCGAG660GGAAAGATGG TGACCGTAAG CTGCTGGGCA GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA720ATTCCAAGGA CCCTCTTACC GGCCCCATCT TTAACCTTAT CGTATCCCCT CTGCCTCATG780CCCGCAGACG CACCTCGGCT GGATGACTTG GACTGTCCCA GGAGCTGGAC GTGGCCAGAG840GGTCCAGAGC AGACCCTCCA CTGCGAGGCC CGTGGAAACC CTGAGCCCTC CGTGCACTGT900GCAAGGCCTG ACGGTGGGGC GGTGCTAGCG CTGGGCCTGT TGGGTCCAGT GACCCGTGCC960CTCGCGGGCA CTTACCGATG TACAGCAATC AATGGGCAAG GCCAGGCGGT CAAGGATGTG1020ACCCTGACTG TGGAATATGC CCCAGCGCTG GACAGTGTAG GCTGCCCAGA ACGTATTACT1080TGGCTGGAGG GGACAGAGGC ATCGCTTAGC TGTGTGGCAC ACGGGGTCCC ACCACCTAGC1140GTGAGCTGTG TGCGCTCTGG AAAGGAGGAA GTCATGGAAG GGCCCCTGCG TTTTGGCCGG1200GAGCACGCTG GCACTTACCG ATGCGAAGCC ATCAACGCCA GGGGATCAGC GGCCAAAAAT1260GTGGCTGTCA CGGTGGAATA TGGTCCCCGG AATTC 1295(2)SEQ ID NO7的资料(i)序列特征(A)长度2214个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO7
CGAATCTTGA GTGGGATGCG GGACTCCCGT GCTATTTCTT GGCGGAGGTC TTTCCTGGTC60CTTATGGACA CCCCTGGTTT GGGATATGGG GGCCGCTAAG ATTTCAGAGA TGGGGTCCCT120AGGCTGAGCC CGCGTTTTCC CGGGCAGCGG TCGCGCTAGA ACCTTTCTGG GCGGACCTTC180AGCCCCGCGT GGCGCTCGTG GAGCGCGGGG GCTCGCTGTG GCTCAACTGC AGCACTAACT240GTCCGAGGCC GGAGCGCGGT GGYCTGGAGA CCTCGCTACG CCGAAACGGG ACCCAGAGGG300GTCTGCGCTG GCTGGCTCGA CAGMTGGTGG ACATCCGAGA GCCTGAAACC CAGTCGGTCT360GCTTCTTCCG CTGGGCGCGC CGCACACTCC AAGNGAGTGG GCTCATCCGA ACTTTCCAGC420GACCGGATCG GGTAGAGCTA GTGCCTCTGN CTCCTTGGCA GCCTGTAGGT GAGAACTTCA480CCTTGAGCTG CAGGGTCCCG GGGGCAGGAC CCCGAGCGAG CCTCACATTG ACCTTGCTGC540GAGGCGGCCA GGAGCTGATT CGCCGAAGTT TCGTAGGCGA GCCACCCCGA GCTCGGGGTG600CGATGCTCAC CGCCACGGTC CTGGCGCGCA GAGAGGATCA CAGGGCCAAT TTCTCATGCC660TCGCGGAGCT TGACCTGCGG ACACACGGCT TGGGACTGTT TGCAAACAGC TCAGCCCCCA720GACAGCTCCG CACGTTTGGC ATGCCTCCAC TTTCCCCGAG CCTTATTGNC CCACGATTCT780TAGAAGTGGG CTCAGAAAGG CCGGTGACTT GCACTTTGGA TGGACTGTTT CCTGCCCCAG840AAGCCGGGGT TTACCTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG ACCCTCGACG900GGGAGAGCCT TGTGGCCACT GNCACAGMTA CAGCAAGTGA AGAACAGGAA GGCACCAAAC960AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA AACCTGACTG1020TCTACAGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA1080TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAG1140CTGCGGTCCC TGGGCAGCCC GCTGAGCTCC AGTTAAATGT CACAAAGAAT GACGACAAGC1200GGGGCTTCTT CTGCGACGCT GCCCTCGATG TGGACGGGGA AACTCTGAGA AAGAACCAGA1260GCTCTGAGCT TCGTGTTCTG TACGCACCTC GGCTGGATGA CTTGGACTGT CCCAGGAGCT1320GGACGTGGCC AGAGGGTCCA GAGCAGACCC TCCACTGCGA GGCCCGTGGA AACCCTGAGC1380CCTCCGTGCA CTGTGCAAGG CCTGACGGTG GGGCGGTGCT AGCGCTGGGC CTGTTGGGTC1440CAGTGACCCG TGCCCTCGCG GGAACTTACC GATGTACAGC AATCAATGGG CAAGGCCAGG1500CGGTCAAGGA TGTGACCCTG ACTGTGGAAT ATGCCCCAGC GCTGGACAGT GTAGGCTGCC1560CAGAACGTAT TACTTGGCTG GAGGGGACAG AGGCATCGCT TAGCTGTGTG GCACACGGGG1620TCCCACCACC TAGCGTGAGC TGTGTGCGCT CTGGAAAGGA GGAAGTCATG GAAGGGCCCC1680TGCGTGTGGC CCGGGAGCAC GCTGGCACTT ACCGATGCGA AGCCATCAAC GNCAGGGGAT1740CAGCGGWCAA AAATGTGGCT GTCACGGTGG AATATGGTCC DAGTTTGGAG GAGTTGGGCT1800GCCCCAGYAA CTGGACTTGG GTAGAAGGAT CTGGAAAACT GTTTTCCTGT GAAGTTGATG1860GGAAGCCGGA ACCACGCGTG GAGTGCGTGG GCTCGGAGGG TGCAAGCGAA GGGGTAGTGT1920
TGCCCCTGGT GTCCTCGAAC TCTGGTTCCA GAAACTCTAT GACTCCTGGT AACCTGTCAC1980CGGGTATTTA CCTCTGCAAC GCCACCAACC GGMATGGNTC CACAGTCAAA ACAGTCGTCG2040TGAGCGCGGA ATCACCGCCA CAGATGGATG AATCCAGTTG CCCGAGTCAC CAGACATGGN2100TGGAAGGAGC CGAGGNTACT GCGCTGGCCT GCAGTGCCAG AGGNCGCCCC TCTCCACGCG2160TGCGCTGTTC CAGGGAAGGT GCAGMCAGGC TGGAGAGGNT ACAGGTGTCC CGAG 2214(2)SEQ ID NO8的资料(i)序列特征(A)长度5077个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO8CCGAACGCTC CTCGGCCTCT GGTCTNCTCT GGNCCTGGGG ATCCTAGGCA TCTCAGGTAA60GAAGAGCCCG CCCGTGGAGC NAGGTGGATA AGGCGGGGGC GGAATTGAAG GACCAGAGAG120GGCGGCCCGG GTGTCCCCCT CCAGGCTCCG CCCTCTTCTA GCTTCCCACG CTTCTGTCAC180CACCTGGAGN TCGGGGCTTC TCCCCGTCCT TCCTCCACCC CAACACACCT CAATCTTTCA240GANCTGAACC CAGCACCTTT TCTGGANTNG GGGNNTTGCA CCTAACCTGT CTCAGGAGAN300ACTGTGGCTC TCCTGTCCTC TCCTGCTCTG TNATGCCCTA TGGTTCACAG ACTGGCATCA360TCCCTATTCA TGATCCTCAA AGACNCCATC TCCTCAACTG TCATAACTCA GAGCTCTATT420CCCCCTCCAC CTGGAGCCCT GGAAACCGGC TTTCTAGGGC TTTTCTCCGC GGTTCTTTCC480CGGAGTTCAG CGTTGTGGCT TTTTGTCCAA GTTACTCAAG TTTGGGGACA ATCTCCTTTA540AGCCTTTGAC TCAGTCTCAT TTCCACTTTG CTTTTGCCCC AAGCCTCTGT GTCTCTCCCC600CATTTCCTGA CGATCTGTCA GAGTCTTAAG AGTGATTTGG TTCCCCATCC CCCCTCCAAC660TGGAGTCTCC TCCTCACTAT TGATGTGTGC ATCTGAGACC CCCATCCCCG CACCGAGTTT720CCCCATCTCT GTCAGTAAAG AGCAAGGCTT CCAGAGACAA CCATCTAATA GCGCGTCAGT780CCCGAATCTT GAGTGGGATG CGGGACTCCC GTGCTATTTC TTGGCGGAGG TCTTTCCTGG840TCCTTATGGA CACCCCTGGT TTGGGATATG GGGGCCGCTA AGATTTCAGA GATGGGGTCC900CTAGGCTGAG NCCGCGTTTT CCCGGGCAGC GGTCGCGCTA GAACCTTTCT GGGCGGACCT960TCAGCCCCGC GTGGCGCTCG TGGAGCGCGG GGGCTCGCTG TGGCTCAACT GCAGCACTAA1020CTGTCCGAGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTA CGCCGAAACG GGACCCAGAG1080
GGGTCTGNAC TGNCTGGCTC GACAGCTGGT GGACATCCGA GANCCTGAAA CCCAGCCGGT1140CTGCTTCTTC CNCTGCGCGC GCCGCACACT CCAAGCGCGT GGGCTCATCC GAACTTTCCG1200TGAGTTCAGG GTGGGCACMC CCCTTGGGTC TCTGGACCTC CCCCTCAAGC TCCTCCCACC1260CGCCCTCTGA TCCTCCTGCT TGTTCTGAAA GTACTACAGC TGGCTAGAGC GGAGTTTTTG1320GTCCCTTGCA GAGCGACCGG ATCGGGTAGA GCTAGTGCCT CTGCCTCCTT GGCAGCCTGT1380AGGTGAGAAC TTCACCTTGA GCTGCAGGGT CCCGGGGGCA GGACCCCGAG CGAGCCTCAC1440ATTGACCTTG CTGCGAGGCG GCCAGGAGCT GATTCGCCGA AGTTTCGTAG GCGAGCCACC1500CCGAGCTCGG GGTGCGATGC TCACCGCCAC GGTCCTGGCG CGCAGAGAGG ATCACAGGGC1560CAATTTCTCA TGCCTCGCGG AGCTTGACCT GCGNCCACAC GGCTTGGGAC TGTTTGCANA1620CAGCTCAGCC CCCAGACAGC TCCGCACGTT TGGTGAGTGT GGACCCTAAC TGACAGATTT1680TAAGAAGTTT AGGGCAGCCA GGCGTGGTGG CATGGTGTCG TAGGCCCTAA GTCCCAGCCC1740AAGCAGANCT AAGNCGGATC TCTTGTGAAT TAAAAGTCTA GCTCGTCTAC ATAACGAGGN1800CTGCATAGTT AAATCCCCCA AAAGTCTAAG CAGCTAGCCC TTACTTCCAA CACAAGTACT1860AGCTTAAGTA CTTTCTCCTG TGAGCTTTTT CCTTTATGTA TTTACTCGTT GAGAGAAAAA1920GAGAGTGTGT GTACGTGCCT TTATGCACAT GCCGCAGTGC TTGTATGGAA GTTAAAGAAT1980AAGGAGGCGT TCTGCCCTTC CATCCTGTGG GTCCTAGGGG TGGTATTAGC TCCTCAGGCT2040TTGTTAGTNA CAAGCGCCTA GGCTTGGGGA GCCATCTCGC CCGCTCCTCT GTATCTTTAG2100GGTGAAACCA GACAATGCAT GCAAATTGGT TGATCAACAC TGAATGTTTA GTTCGTAAAT2160TCAAGCTCTG TTCTTTGTCT TCCTCAGCCA TGCCTCCACT TTCCCCCGAG CCTTATTGCC2220CCACGATTCT TAGAAGTGGG CTCAGAAAGG CCGGTGACKT GCACTTTGGA TGGACTGTTT2280CCTGCCCCAG AAGCCGGGGT TTACTTCTCT CTGGGAGATC AGAGGCTTCA TCCTAATGTG2340ACCCTCGACG GGGAGAGCCT TGTGGCCACT GCCACAGCTA CAGCAAGTGA AGAACAGGAA2400GGCACCAAAC AGCTGATGTG CATCGTGACC CTCGGGGGCG AAAGCAGGGA GACCCAGGAA2460AACCTGACTG TCTACAGTAA GGGGAATCCA ACAAGACCTT CAATAGCTCA GACTGGGGCT2520GGGGCTGGGT CTGGGTCTGG GGCCAGAGTC TCACAAAGGC GGAGCCTATA AAGTGGGCGG2580GACCTCCACA CCAGAACAAG CCGGGCGGGA GAGTTCCAGG GCAGGAGCAG ATAGAAGTTG2640GAAATTAATA GATTGGGTTG AGTTCCCTGA GTGGGGAGTG AACCCCACCC AATTCTCTGT2700CCCCAGGCTT CCCGGCTCCT CTTCTGACTT TAAGTGAGCC AGAAGCCCCC GAGGGAAAGA2760TGGTGACCGT AAGCTGCTGG GCAGGGGCCC GAGCCCTTGT CACCTTGGAG GGAATTCCAG2620CTGCGGTCCC TGGGCAGCCC GCTGAGCTCC AGTTAAATGT CACAAAGAAT GACGACAAGC2880GGGGCTTCTT CTGCGACGCT GCCCTCGATG TGGACGGGGA AACTCTGAGA AAGAACCAGA2940GCTCTGAGCT TCGTGTTCTG TGTGAGTGGA TGTTCAACTT ATCTCTGTGA ATTCCAAGGA3000CCCTCTTACC GGCCCCATCT TTAACCTTAT CGTATCCCCT CTGCCTCATG CCCGCAGACG3060
CACCTCGGCT GGATGACTTG GACTGTCCCA GGAGCTGGAC GTGGCCAGAG GGTCCAGAGC3120AGACCCTCCA CTGCGAGGCC CGTGGAAACC CTGAGCCCTC CGTGCACTGT GCAAGGCCTG3180ACGGTGGGGC GGTGCTAGCG CTGGGCCTGT TGGGTCCAGT GACCCGTGCC CTCGCGGGCA3240CTTACCGATG TACAGCAATC AATGGGCAAG GCCAGGCGGT CAAGGATGTG ACCCTGACTG3300TGGAATGTGA GTAGGGGGAG GTGGGCATGC TTATCCCTTT AAGGTCACGG AGTGTACTGG3360GAGACTGGCT ATACGGAAAG GAAAGAAGCC TAGGTTCAGC AGGGATTGGG AAAACACTGA3420AGGAAAGTGG TGTGGTGTTT ACAAACTTAA CGGTGGTAAC TGGGCACGGT CTGGCAAAAA3480CAGACAGCCA AGAGAGTGTG CCTGGGAAGC TGCAATGGGG GCTTTGTGGG AATTGGTCAA3540CAGCACCCTG AGATCTCAGG AAAGGGGCCT GAAGTTATCT CCAGAACCCA TGTGAAGGCA3600GGAAGAGAGA ACGCCCACCT TTTCCTGCTC CCCCCAACCC CCCCCCACAT ATCACACGGA3660GTATATAAAT AAATAAAATG GCTCCTGCCG GAGGGAGTGA GAAGCTGTCT CCTGCAGGCT3720CAGAGCAGTG GTAGTGCATG CCTTTAATCC CAGCACTCGG TAGGCAAAGG CAGGCAGATC3780TCTGTGAATG TGGGGCCAGC CTGGTCTGTA CAGAGAAATC CTGTCTCAAA ACAAACCAGC3840AAAGAAACAA AACCAAAATC AATTCCAGAT GCCCCAGCGC TGGACAGTGT AGGCTGCCCA3900NGACGTATTA CTTGNCTGGA GGGGACAGAG GCATCGCTTA GCTGTGTGGC ACACGGGGTC3960CCACCACCTA GCGTGAGCTG TGTGCGCTCT GGAAAGGAGG AAGTCATGGA AGGGCCCCTG4020CGTGTGGCCC GGGAGCACGC TGGCACTTAC CGATGCGAAG CCATCAACGC CAGGGGATCA4080GCGGNCAAAA ATGTGGCTGT CACGGTGGAA TGTGAGTAGG GGTGGCTACG GAAATGTCCA4140CACCTGCGTC CTCTGTCCTC AGTGTGAACT CCTATTTCCC TGCTTCCTAG ATGGTCCCAG4200TTNTGAGGAG TTGGGCTGCC CCAGCAACTG GACTTGGGTA GAAGGATCTG GAAAACTGTT4260TTCCTGTGAA GTTGATGGGA AGCCGGAACC ACGCGTGGAG TGCGTGGGCT CGGAGGGTGC4320AAGCGAAGGG GTAGTGTTGC CCCTGGTGTC CTCGAACTCT GGTTCCAGAA ACTCTATGAC4380TCCTGGTAAC CTGTCACCGG GTATTTACCT CTGCAACGCC ACCAACCGGC ATGGGTCCAC4440AGTCAAAACA GTCGTCGTGA GCGCGGAATG TGAGCAGGGG CCCAGGTGGG CGGAGAGTAC4500CGGGTGTCCC AGGATCTTTT CTTTCCCTGA TGCCCCTCCT TATGGTGGCT GATCTGCAGC4560ACCGCCACAG ATGGATGAAT CCAGTTGCCC GAGTCACCAG ACATGGCTGG AAGGAGCCGA4620GGCTACTGCG CTGGCCTGCA GTGACAGGGG NCGCCCCTCT CCACGCGTGC GCTGTTCCAG4680GGAAGGTGCA GCCAGGCTGG AGAGGCTACA GGTGTCCCGA GAGGATGCGG GGACCTACCT4740GTGTGTGGCT ACCAACGCGC ATGGCACGGA TTCACGGACC GTCACTGTGG GTGTGGAATG4800TGAGTGAGGA CAGCGCTGAA TGAAGACGAC TCAGACCGCC AGAAAAGTGC CTTGAGGCCT4860GGGATGTATG ATCCAGTGGG TAGAGTGCTC AATTAGCACT CACTAAAATG TATATTCTAT4920TCCTAATACT CTTTAATTTT ANCCTTTGGG AGGCAGAGAC AGGCAGATCT CTGTTCCGGG4980ATAACCTGCT CTCTGTCTAG GACAGCTTGG TCTACAGAGG GGNTACAGGC CCCCCCTCCC5040AAGATTGNAT AGCAACCCTC TGGCTCCCTG TCTCTCT 5077
(2)SEQ ID NO9的资料(i)序列特征(A)长度1472个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO9NGAATTCCGG CGGATCGGGT AGAGCTAGTG CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG60AACTTCACCT TGAGCTGCAG GGTCCCGGGG GCAGGACCCC GAGCGAGCCT CACATTGACC120TTGCTGCGAG GCGGCCAGGA GCTGATTCGC CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT180CGGGGTGCGA TGCTCACCGC CACGGTCCTG GCGCGCAGAG AGGATCACAG GGCCAATTTC240TCATGCCTCG CGGAGCTTGA CCTGCGGCCA CACGGCTTGG GACTGTTTGC AAACAGCTCA300GCCCCCAGAC AGCTCCGCAC GTTTGCCATG CCTCCACTTT CCCCGAGCCT TATTGCCCCA360CGATTCTTAG AAGTGGGCTC AGAAAGGCCG GTGACTTGCA CTTTGGATGG ACTGTTTCCT420GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG GGAGATCAGA GGCTTCATCC TAATGTGACC480CTCGACGGGG AGAGCCTTGT GGCCACTGCC ACAGCTACAG CAAGTGAAGA ACAGGAAGGC540ACCAAACAGC TGATGTGCAT CGTGACCCTC GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC600CTGACTGTCT ACAGCTTCCC GGCTCCTCTT CTGACTTTAA GTGAGCCAGA AGCCCCCGAG660GGAAAGATGG TGACCGTAAG CTGCTGGGCA GGGGCCCGAG CCCTTGTCAC CCTGGAGGGA720ATTCCAGCTG CGGTCCCTGG GCAGCCCGCT GAGCTCCAGT TAAATGTCAC AAAGAATGAC780GACAAGCGGG GCTTCTTCTG CGACGCTGCC CTCGATGTGG ACGGGGAAAC TCTGAGAAAG840AACCAGAGCT CTGAGCTTCG TGTTCTGTGT GAGTGGATGT TCACTTTATC TCTGTGAATT900CCAAGGACCC TCTTACCGGC CCCATCTTTA ACCTTATCGT ATCCCCTCTG CCTCATGCCC960GCAGACGCAC CTCGGCTGGA TGACTTGGAC TGTCCCAGGA GCTGGACGTG GCCAGAGGGT1020CCAGAGCAGA CCCTCCACTG CGAGGCCCGT GGAAACCCTG AGCCCTCCGT GCACTGTGCA1080AGGCCTGACG GTGGGGCGGT GCTAGCGCTG GGCCTGTTGG GTCCAGTGAC CCGTGCCCTC1140GCGGGCACTT ACCGATGTAC AGCAATCAAT GGGCAAGGCC AGGCGGTCAA GGATGTGACC1200CTGACTGTGG AATATGCCCC AGCGCTGGAC AGTGTAGGCT GCCCAGAACG TATTACTTGG1260CTGGAGGGGA CAGAGGCATC GCTTAGCTGT GTGGCACACG GGGTCCCACC ACCTAGCGTG1320AGCTGTGTGC GCTCTGGAAA GGAGGAAGTC ATGGAAGGGC CCCTGCGTTT TGGCCGGGAG1380CACGCTGGCA CTTACCGATG CGAAGCCATC AACGCCAGGG GATCAGCGGC CAAAAATGTG1440GCTGTCACGG TGGAATATGG TCCCCGGAAT TC 1472
(2)SEQ ID NO10的资料(i)序列特征(A)长度2550个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO10CCTCTGCCTC CTTGGCAGCC TGTAGGTGAG AACTTCACCT TGAGCTGCAG GGTCCCGGGG60GCAGGACCCC GAGCGAGCCT CACATTGACC TTGCTGCGAG GCGGCCAGGA GCTGATTCGC120CGAAGTTTCG TAGGCGAGCC ACCCCGAGCT CGGGGTGCGA TGCTCACCGC CACGGTCCTG180GCGCGCAGAG AGGATCACAG GGCCAATTTC TCATGCCTCG CGGAGCTTGA CCTGCGGCCA240CACGGCTTGG GACTGTTTGC AAACAGCTCA GCCCCCAGAC AGCTCCGCAC GTTTGCCATG300CCTCCACTTT CCCCGAGCCT TATTGCCCCA CGATTCTTAG AAGTGGGCTC AGAAAGGCCG360GTGACTTGCA CTTTGGATGG ACTGTTTCCT GCCCCAGAAG CCGGGGTTTA CCTCTCTCTG420GGAGATCAGA GGCTTCATCC TAATGTGACC CTCGACGGGG AGAGCCTTGT GGCCACTGCC480ACAGCTACAG CAAGTGAAGA ACAGGAAGGC ACCAAACAGC TGATGTGCAT CGTGACCCTC540GGGGGCGAAA GCAGGGAGAC CCAGGAAAAC CTGACTGTCT ACAGCTTCCC GGCTCCTCTT600CTGACTTTAA GTGAGCCAGA AGCCCCCGAG GGAAAGATGG TGACCGTAAG CTGCTGGGCA660GGGGCCCGAG CCCTTGTCAC CTTGGAGGGA ATTCCAGCTG CGCTCCCTGG GCAGCCCGCT720GAGCTCCAGT TAAATGTCAC AAAGAATGAC GACAAGCGGG GCTTCTTCTG CGACGCTGCC780CTCGATGTGG ACGGGGAAAC TCTGAGAAAG AACCAGAGCT CTGAGCTTCG TGTTCTGTAC840GCACCTCGGC TGGATGACTT GGACTGTCCC AGGAGCTGGA CGTGGCCAGA GGGTCCAGAG900CAGACCCTCC ACTGCGAGGC CCGTGGAAAC CCTGAGCCCT CCGTGCACTG TGCAAGGCCT960GACGGTGGGG CGGTGCTAGC GCTGGGCCTG TTGGGTCCAG TGACCCGTGC CCTCGCGGGC1020ACTTACCGAT GTACAGCAAT CAATGGGCAA GGCCAGGCGG TCAAGGATGT GACCCTGACT1080GTGGAATATG CCCCAGCGCT GGACAGTGTA GGCTGCCCAG AACGTATTAC TTGGCTGGAG1140GGGACAGAGG CATCGCTTAG CTGTGTGGCA CACGGGGTCC CACCACCTAG CGTGAGCTGT1200GTGCGCTCTG GAAAGGAGGA AGTCATGGAA GGGCCCCTGC GTGTGGCCCG GGAGCACGCT1260GGCACTTACC GATGCGAAGC CATCAACGCC AGGGGATCAG CGGCCAAAAA TGTGGCTGTC1320ACGGTGGAAT ATGGTCCCAG TTTTGAGGAG TTGGGCTGCC CCAGCAACTG GACTTGGGTA1380
GAAGGATCTG GAAAACTGTT TTCCTGTGAA GTTGATGGGA AGCCGGAACC ACGCGTGGAG1440TGCGTGGGCT CGGAGGGTGC AAGCGAAGGG GTAGTGTTGC CCCTGGTGTC CTCGAACTCT1500GGTTCCAGAA ACTCTATGAC TCCTGGTAAC CTGTCACCGG GTATTTACCT CTGCAACGCC1560ACCAACCGGC ATGGCTCCAC AGTCAAAACA GTCGTCGTGA GCGCGGAATC ACCGCCACAG1620ATGGATGAAT CCAGTTGCCC GAGTCACCAG ACATGGCTGG AAGGAGCCGA GGCTACTGCG1680CTGGCCTGCA GTGCCAGAGG CCGCCCCTCT CCACGCGTGC GCTGTTCCAG GGAAGGTGCA1740GCCAGGCTGG AGAGGCTACA GGTGTCCCGA GAGGATGCGG GGACCTACCT GTGTGTGGCT1800ACCAACGCGC ATGGCACGGA TTCACGGACC GTCACTGTGG GTGTGGAATA CCGGCCTGTG1860GTGGCTGAGC TGGCAGCCTC GCCCCCAAGC GTGCGGCCTG GCGGAAACTT CACTCTGACC1920TGCCGTGCAG AGGCCTGGCC TCCAGCCCAG ATCAGCTGGC GCGCGCCCCC GGGAGCTCTC1980AACCTCGGTC TCTCCAGCAA CAACAGCACG CTGAGCGTGG CGGGTGCCAT GGGCAGCCAT2040GGTGGCGAGT ATGAGTGCGC AGCCACCAAT GCGCATGGGC GCCACGCACG GCGCATCACG2100GTGCGCGTGG CCGGTCCATG GCTGTGGGTC GCTGTGGGCG GTGCGGCAGG GGGCGCGGCG2160CTGCTGGCCG CAGGGGCCGG CCTGGCCTTC TACGTGCAGT CCACCGCTTG CAAGAAGGGA2220GAGTACAACG TCCAGGAGGC TGAGAGCTCA GGCGAGGCGG TGTGTCTCAA TGGCGCGGGC2280GGGACACCGG GTGCAGAAGG CGGAGCAGAG ACCCCCGGCA CTGCCGAGTC ACCTGCAGAT2340GGCGAGGTTT TCGCCATCCA GCTGACATCT TCCTGAGCCT GTATCCAGCT CCCCCAGGGG2400CCTCGAAAGC ACAGGGGTGG ACGTATGTAT TGTTCACTCT CTATTTATTC AACTCCAGGG2460GCGTCGTCCC CGTTTTCTAC CCATTCCCTT AATAAAGTTT TTATAGGAGA AAAAAAAAAA2520AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA 2550(2)SEQ ID NO11的资料(i)序列特征(A)长度222个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO11AATTCGATCA CTCGCGCTCC CCTCGCCTTC TGCGCTCTCC CCTCCCTGGC AGCGGCGGCA60ATGCCGGGGC CTTCACCAGG GCTGCGCCGA ACGCTCCTCG GCCTCTGGGC TGCCCTGGGC120CTGGGGATCC TAGGCATCTC AGCGGTCGCG CTAGAACCTT TCTGGGCGGA CCTTCAGCCC180CGCGTGGCGC TCGTGGAGCG CGGGGGCTCG CTGTGGCTCA AC 222
(2)SEQ ID NO12的资料(i)序列特征(A)长度292个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO12TGTGGAGCTG GCACCCCTGC CTCCTTGGCA GCCGGTGGGC CAGAACTTCA CCCTGCGCTG60CCAAGTGGAG GGTGGGTCGC CCCGGACCAG CCTCACGGTG GTGCTGCTTC GCTGGGAGGA120GGAGCTGAGC CGGCAGCCCG CAGTGGAGGA GCCAGCGGAG GTCACTGCCA CTGTGCTGGC180CAGCAGAGAC GACCACGGAG CCCCTTTCTC ATGCCGCACA GAACTGGACA TGCAGCCCCA240GGGGCTGGGA CTGTTCGTGA ACACCTCAGC CCCCCGCCAG CTCCGAACCT TT292(2)SEQ ID NO13的资料(i)序列特征(A)长度105个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO13Pro Asp Arg Val Glu Leu Val Pro Leu Pro Pro Trp Gln Pro Val Gly1 5 10 15Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro Arg Ala20 25 30Ser Leu Thr Leu Thr Leu Leu Arg Gly Gly Gln Glu Leu Ile Arg Arg35 40 45Ser Phe Val Gly Glu Pro Pro Arg Ala Arg Cys Ala Met Leu Thr Ala50 55 60Thr Val Leu Ala Arg Arg Glu Asp His Arg Asp Asn Phe Ser Cys Leu65 70 75 80Ala Glu Leu Asp Leu Arg Thr His Gly Leu Gly Leu Phe Ala Asn Ser85 90 95Ser Ala Pro Arg Gln Leu Arg Thr Phe100 105
(2)SEQ ID NO14的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO14GAACTCGAGG CCATGCCTCC ACTTTCC 27(2)SEQ ID NO15的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO15CCATAAGCTT TATTCCACCG TGACAGCCAC 30(2)SEQ ID NO16的资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO16AACGTGCGGA GCTGTCTG 18
(2)SEQ ID NO17的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO17ACGGAATTCG AAGCCATCAA CGCCAGG 27(2)SEQ ID NO18的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO18CATGAATTCC GAATCTTGAG TGGGATTG27(2)SEQ ID NO19的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO19ATAGAATTCC TCGGGACACC TGTAGCC 27
(2)SEQ ID NO20的资料(i)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO20CARGGTGACA AGGGCTCG 18(2)SEQ ID NO21的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO21TATGAATTCA GTTGAGCCAC AGCGAGC 27(2)SEQ ID NO22的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO22CCGGGGTCCTA GAGGTGGACA CGCA 24
(2)SEQ ID NO23的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO23TGCAGTGTCT CCTGGCTCTG GTTC 24(2)SEQ ID NO24的资料(i)序列特征(A)长度992个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO24GCGAAAACCG GGAGACCCGG GAGAACGTGA CCATCTACAG CTTCCCGGCA CCACTCCTGA60CCCTGAGCGA ACCCAGCGTC TCCGAGGGGC AGATGGTGAC AGTAACCTGC GCAGCTGGGG120CCCAAGCTCT GGTCACACTG GAGGGAGTTC CAGCCGCGGT CCCGGGGCAG CCCGCCCAGC180TTCAGCTAAA TGCCACCGAG AACGACGACA GACGCAGCTT CTTCTGCGAC GCCACCCCCG240ATGTGGACGG GGAGACCCTG ATCAAGAACA GGAGCGCAGA GCTTCGTGTC CTATACGCTC300CCCGGCTAGA CGATTCGGAC TGCCCCAGGA GTTGGACGTG GCCCGAGGGC CCAGAGCAGA360CGCTGCGCTG CGAGGCCCGC GGGAACCCAG AACCCTCAGT GCACTGTGCG CGCTCCGACG420GCGGGGCCGT GCTGGCTCTG GGCCTGCTGG GTCCAGTCAC TCGGGCGCTC TCAGGCACTT480ACCGCTGCAA GGCGGCCAAT GATCAAGGCG AGGCGGTCAA GGACGTAACG CTAACGGTGG540AGTACGCACC AGCGCTGGAC AGCGTGGGCT GCCCAGAACG CATTACTTGG CTGGAGGGAA600CAGAAGCCTC GCTGAGCTGT GTGGCGCACG GGGTACCGCC GCCTGATGTG ATCTGCGTGC660GCTCTGGAGA ACTCGGGGCC GTCATCGAGG GGCTGTTGCG TGTGGCCCGG GAGCATGCGG720GCACTTACCG CTGCGAAGCC ACCAACCCTC GGGGCTCTGC GGCCAAAAAT GTGGCCGTCA780
CGGTGGAATA TGGCCCCAGG TTTGAGGAGC CGAGCTGCCC CAGCAATTGG ACATGGGTGG840AAGGATCTGG GCGCCTGTTT TCCTGTGAGG TCGATGGGAA GCCACAGCCA AGCGTGAAGT900GCGTGGGCTC CGGGGGCACC ACTGAGGGGG TGCTGCTGCC GCTGGCACCC CCAGACCCTA960GTCCCAGAGC TCCCAGAATC CCTAGAGTCC TG 992(2)SEQ ID NO25的资料(i)序列特征(A)长度2775个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO25GCAGCCTCGC GTGGCGTTCG TGGAGCGCGG GGGCTCGCTG TGGCTGAATT GCAGCACCAA60CTGCCCTCGG CCGGAGCGCG GTGGCCTGGA GACCTCGCTG CGCCGAAACG GGACCCAGAG120GGGTTTGCGT TGGTTGGCGC GGCAGCTGGT GGACATTCGC GAGCCGGAGA CTCAGCCCGT180CTGCTTCTTC CGCTGCGCGC GGCGCACACT ACAGGCGCGT GGGCTCATTC GCACTTTCCA240GCGACCAGAT CGCGTAGAGC TGATGCCGCT GCCTCCCTGG CAGCCGGTGG GCGAGAACTT300CACCCTGAGC TGTAGGGTCC CCGGCGCCGG GCCCCGTGCG AGCCTCACGC TGACCCTGCT360GCGGGGCGCC CAGGAGCTGA TCCGCCGCAG CTTCGCCGGT GAACCACCCC GAGCGCGGGG420CGCGGTGCTC ACAGCCACGG TACTGGCTCG GAGGGAGGAC CATGGAGCCA ATTTCTCGTG480TCGCGCCGAG CTGGACCTGC GGCCGCACGG ACTGGGACTG TTTGAAAACA GCTCGGCCCC540CAGAGAGCTC CGAACCTTCT CCCTGTCTCC GGATGCCCCG CGCCTCGCTG CTCCCCGGCT600CTTGGAAGTT GGCTCGGAAA GGCCCGTGAG CTGCACTCTG GACGGACTGT TTCCAGCCTC660AGAGGCCAGG GTCTACCTCG CACTGGGGGA CCAGAATCTG AGTCCTGATG TCACCCTCGA720AGGGGACGCA TTCGTGGCCA CTGCCACAGC CACAGCTAGC GCAGAGCAGG AGGGTGCCAG780GCAGCTGGTC TGCAACGTCA CCCTGGGGGG CGAAAACCGG GAGACCCGGG AGAACGTGAC840CATCTACAGC TTCCCGGCAC CACTCCTGAC CCTGAGCGAA CCCAGCGTCT CCGAGGGGCA900GATGGTGACA GTAACCTGCG CAGCTGGGGC CCAAGCTCTG GTCACACTGG AGGGAGTTCC960AGCCGCGGTC CCGGGGCAGC CCGCCCAGCT TCAGCTAAAT GCCACCGAGA ACGACGACAG1020ACGCAGCTTC TTCTGCGACG CCACCCTCGA TGTGGACGGG GAGACCCTGA TCAAGAACAG1080GAGCGCAGAG CTTCGTGTCC TATACGCTCC CCGGCTAGAC GATTCGGACT GCCCCAGGAG1140
TTGGACGTGG CCCGAGGGCC CAGAGCAGAC GCTGCGCTGC GAGGCCCGCG GGAACCCAGA1200ACCCTCAGTG CACTGTGCGC GCTCCGACGG CGGGGCCGTG CTGGCTCTGG GCCTGCTGGG1260TCCAGTCACT CGGGCGCTCT CAGGCACTTA CCGCTGCAAG GCGGCCAATG ATCAAGGCGA1320GGCGGTCAAG GACGTAACGC TAACGGTGGA GTACGCACCA GCGCTGGACA GCGTGGGCTG1380CCCAGAACGC ATTACTTGGC TGGAGGGAAC AGAAGCCTCG CTGAGCTGTG TGGCGCACGG1440GGTACCGCCG CCTGATGTGA TCTGCGTGCG CTCTGGAGAA CTCGGGGCCG TCATCGAGGG1500GCTGTTGCGT GTGGCCCGGG AGCATGCGGG CACTTACCGC TGCGAAGCCA CCAACCCTCG1560GGGCTCTGCG GCCAAAAATG TGGCCGTCAC GGTGGAATAT GGCCCCAGGT TTGAGGAGCC1620GAGCTGCCCC AGCAATTGGA CATGGGTGGA AGGATCTGGG CGCCTGTTTT CCTGTGAGGT1680CGATGGGAAG CCACAGCCAA GCGTGAAGTG CGTGGGCTCC GGGGGCACCA CTGAGGGGGT1740GCTGCTGCCG CTGGCACCCC CAGACCCTAG TCCCAGAGCT CCCAGAATCC CTAGAGTCCT1800GGCACCCGGT ATCTACGTCT GCAACGCCAC CAACCGCCAC GGCTCCGTGG CCAAAACAGT1860CGTCGTGAGC GCGGAGTCGC CACCGGAGAT GGATGAATCT ACCTGCCCAA GTCACCAGAC1920GTGGCTGGAA GGGGCTGAGG CTTCCGCGCT GGCCTGCGCC GCCCGGGGTC GCCCTTCCCC1980AGGAGTGCGC TGCTCTCGGG AAGGCATCCC ATGGCCTGAG CAGCAGCGCG TGTCCCGAGA2040GGACGCGGGC ACTTACCACT GTGTGGCCAC CAATGCGCAT GGCACGGACT CCCGGACCGT2100CACTGTGGGC GTGGAATACC GGCCAGTGGT GGCCGAACTT GCTGCCTCGC CCCCTGGAGG2160CGTGCGCCCA GGAGGAAACT TCACGTTGAC CTGCCGCGCG GAGGCCTGGC CTCCAGCCCA2220GATCAGCTGG CGCGCGCCCC CGAGGGCCCT CAACATCGGC CTGTCGAGCA ACAACAGCAC2280ACTGAGCGTG GCAGGCGCCA TGGGAAGCCA CGGCGGCGAG TACGAGTGCG CACGCACCAA2340CGCGCACGGG CGCCACGCGC GGCGCATCAC GGTGCGCGTG GCCGGTCCGT GGCTATGGGT2400CGCCGTGGGC GGCGCGGCGG GGGGCGCGGC GCTGCTGGCC GCGGGGGCCG GCCTGGCCTT2460CTACGTGCAG TCCACCGCCT GCAAGAAGGG CGAGTACAAC GTGCAGGAGG CCGAGAGCTC2520AGGCGAGGCC GTGTGTGTGA ACGGAGCGGG CGGCGGCGCT GGCGGGGCGG CAGGCGCGGA2580GGGCGGACCC GAGGCGGCGG GGGGCGCGGC CGAGTCGCCG GCGGAGGGCG AGGTCTTCGC2640CATACAGCTG ACATCGGCGT GAGCCCGCTC CCCTCTCCGC GGGCCGGGAC GCCCCCCAGA2700CTCACACGGG GGCTTATTTA TTGCTTTATT TATTTACTTA TTCATTTATT TATGTATTCA2760ACTCCAAGGG AATTC 2775
(2)SEQ ID NO26的资料(i)序列特征(A)长度1557个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO26CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCGA TGCCAGGGCC TTCGCCAGGG60CTGCGCCGGG CGCTACTCGG CCTCTGGGCT GCTCTGGGCC TGGGGCTCTT CGGCCTCTCA120GCGGTCTCGC AGGAGCCCTT CTGGGCGGAC CTGCAGCCTC GCGTGGCGTT CGTGGAGCGC180GGGGGCTCGC TGTGGCTGAA TTGCAGCACC AACTGCCCTC GGCCGGAGCG CGGTGGCCTG240GAGACCTCGC TGCGCCGAAA CGGGACCCAG AGGGGTTTGC GTTGGTTGGC GCGGCAGCTG300GTGGACATTC GCGAGCCGGA GACTCAGCCC GTCTGCTTCT TCCGCTGCGC GCGGCGCACA360CTACAGGCGC GTGGGCTCAT TCGCACTTTC CAGCGACCAG ATCGCGTAGA GCTGATGCCG420CTGCCTCCCT GGCAGCCGGT GGGCGAGAAC TTCACCCTGA GCTGTAGGGT CCCCGGCGCC480GGGCCCCGTG CGAGCCTCAC GCTGACCCTG CTGCGGGGCG CCCAGGAGCT GATCCGCCGC540AGCTTCGCCG GTGAACCACC CCGAGCGCGG GGCGCGGTGC TCACAGCCAC GGTACTGGCT600CGGAGGGAGG ACCATGGAGC CAATTTCTCG TGTCGCGCCG AGCTGGACCT GCGGCCGCAC660GGACTGGGAC TGTTTGAAAA CAGCTCGGCC CCCAGAGAGC TCCGAACCTT CTCCCTGTCT720CCGGATGCCC CGCGCCTCGC TGCTCCCCGG CTCTTGGAAG TTGGCTCGGA AAGGCCCGTG780AGCTGCACTC TGGACGGACT GTTTCCAGCC TCAGAGGCCA GGGTCTACCT CGCACTGGGG840GACCAGAATC TGAGTCCTGA TGTCACCCTC GAAGGGGACG CATTCGTGGC CACTGCCACA900GCCACAGCTA GCGCAGAGCA GGAGGGTGCC AGGCAGCTGG TCTGCAACGT CACCCTGGGG960GGCGAAAACC GGGAGACCCG GGAGAACGTG ACCATCTACA GCGTCCCGGC ACCACTCCTG1020ACCCTGAGCG AACCCAGCGT CTCCGAGGGG CAGATGGTGA CAGTAACCTG CGCAGCEGGG1080GCCCAAGCTC TGGTCACACT GGAGGGAGTT CCAGCCGCGG TCCCGGGGCA GCCCGCCCAG1140CTTCAGCTAA ATGCCACCGA GAACGACGAC AGACGCAGCT TCTTCTGCGA CGCCACCCTC1200GATGTGGACG GGGAGACCCT GATCAAGAAC AGGAGCGCAG AGCTTCGTGT CCTATACGCT1260CCCCGGCTAG ACGATTCGGA CTGCCCCAGG AGTTGGACGT GGCCCGAGGG CCCAGAGCAG1320ACGCTGCGCT GCGAGGCCCG CGGGAACCCA GAACCCTCAG TGCACTGTGC GCGCTCCGAC1380GGCGGGGCCG TGCTGGCTCT GGGCCTGCTG GGTCCAGTCA CTCGGGCGCT CTCAGGCACT1440TACCGCTGCA AGGCGGCCAA TGATCAAGGC GAGGCGGTCA AGGACGTAAC GCTAACGGTG1500GAGTACGCAC CAGCGCTGGA CAGCGTGGGC TGCCCAGAAC GCATTACTTG GCTGGAG 1557
(2)SEQ ID NO27的资料(i)序列特征(A)长度2927个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置40..2814(xi)序列描述SEQ ID NO27CGCGCTCTCC TCGCCTCCTG TGCTTTCCCC GCCGCGGCG ATG CCA GGG CGT TCG 54Met Pro Gly Pro Ser1 5CCA GGG CTG CGC CGG GCG CTA CTC GGC CTC TGG GCT GCT CTG GGC CTG102Pro Gly Leu Arg Arg Ala Leu Leu Gly Leu Trp Ala Ala Leu Gly Leu10 15 20GGG GTC TTC GGC CTC TCA GCG GTC TCG CAG GAG CCC TTC TGG GCG GAC150Gly Leu Phe Gly Leu Ser Ala Val Ser Gln Glu Pro Phe Trp Ala Asp25 30 35CTG CAG CCT CGC GTG GCG TTC GTG GAG CGC GGG GGC TCG CTG TGG CTG198Leu Gln Pro Arg Val Ala Phe Val Glu Arg Gly Gly Ser Leu Trp Leu40 45 50AAT TGC AGC ACC AAC TGC CCT CGG CCG GAG CGC GGT GGC CTG GAG ACC246Ash Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg Gly Gly Leu Glu Thr55 60 65TCG CTG CGC CGA AAC GGG ACC CAG AGG GGT TTG CGT TGG TTG GCG CGG294Sar Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu Arg Trp Leu Ala Arg70 75 80 85CAG CTG GTG GAC ATT CGC GAG CCG GAG ACT CAG CCC GTC TGC TTC TTC342Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln Pro Val Cys Phe Phe90 95 100CGC TGC GCG CGG CGC ACA CTA CAG GCG CGT GGG CTC ATT CGC ACT TTC390Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly Leu Ile Arg Thr Phe105 110 115CAG CGA CCA GAT CGC GTA GAG CTG ATG CCG CTG CCT CCC TGG CAG CCG438Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu Pro Pro Trp Gln Pro120 125 130GTG GGC GAG AAC TTC ACC CTG AGC TGT AGG GTC CCC GGC GCC GGG CCC486Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val Pro Gly Ala Gly Pro135 140 145
CGT GCG AGC CTC ACG CTG ACC CTG CTG CGG GGC GCC CAG GAG CTG ATC534Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly Ala Gln Glu Leu Ile150 155 160165CGC CGC AGC TTC GCC GGT GAA CCA CCC CGA GCG CGG GGC GCG GTG CTC582Arg Arg Ser Phe Ala Gly Glu Pro Pro Arg Ala Arg Gly Ala Val Leu170 175 180ACA GCC ACG GTA CTG GCT CGG AGG GAG GAC CAT GGA GCC AAT TTC TCG630Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His Gly Ala Asn Phe Ser185 190 195TGT CGC GCC GAG CTG GAC CTG CGG CCG CAC GGA CTG GGA CTG TTT GAA678Cys Arg Ala Glu Leu Asp Leu Arg Pro His Gly Leu Gly Leu Phe Glu200 205 210AAC AGC TCG GCC CCC AGA GAG CTC CGA ACC TTC TCC CTG TCT CCG GAT726Asn Ser Ser Ala Pro Arg Glu Leu Arg Thr Phe Ser Leu Ser Pro Asp215 220 225GCC CCG CGC CTC GCT GCT CCC CGG CTC TTG GAA GTT GGC TCG GAA AGG774Ala Pro Arg Leu Ala Ala Pro Arg Leu Leu Glu Val Gly Ser Glu Arg230 235 240 245CCC GTG AGC TGC ACT CTG GAC GGA CTG TIT CCA GCC TCA GAG GCC AGG822Pro Val Ser Cys Thr Leu Asp Gly Leu Phe Pro Ala Ser Glu Ala Arg250 255 260GTC TAC CTC GCA CTG GGG GAC CAG AAT CTG AGT CCT GAT GTC ACC CTC870Val Tyr Leu Ala Leu Gly Asp Gln Asn Leu Sar Pro Asp Val Thr Leu265 270 275GAA GGG GAC GCA TTC GTG GCC ACT GCC ACA GCC ACA GCT AGC GCA GAG918Glu Gly Asp Ala Phe Val Ala Thr Ala Thr Ala Thr Ala Ser Ala Glu280 285 290CAG GAG GGT GCC AGG CAG CTG GTC TGC AAC GTC ACC CTG GGG GGC GAA966Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val Thr Leu Gly Gly Glu295 300 305AAC CGG GAG ACC CGG GAG AAC GTG ACC ATC TAC AGC TTC CCG GCA CCA1014Asn Arg Glu Thr Arg Glu Asn Val Thr Ile Tyr Ser Phe Pro Ala Pro310 315 320 325CTC CTG ACC CTG AGC GAA CCC AGC GTC TCC GAG GGG CAG ATG GTG ACA1062Leu Leu Thr Leu Ser Glu Pro Ser Val Ser Glu Gly Gln Mat Val Thr330 335 340GTA ACC TGC GCA GCT GGG GCC CAA GCT CTG GTC ACA CTG GAG GGA GTT1110Val Thr Cys Ala Ala Gly Ala Gln Ala Leu Va1 Thr Leu Glu Gly Val345 350 355CCA GCC GCG GTC CCG GGG CAG CCC GCC CAG CTT CAG CTA AAT GCC ACC1158Pro Ala Ala Val Pro Gly Gln Pro Ala Gln Leu Gln Leu Asn Ala Thr360 365 370GAG AAC GAC GAC AGA CGC AGC TTC TTC TGC GAC GCC ACC CTC GAT GTG1206Glu Asn Asp Asp Arg Arg Ser Phe Phe Cys Asp Ala Thr Leu Asp Val375 380 385GAC GGG GAG ACC CTG ATC AAG AAC AGG AGC GCA GAG CTT CGT GTC CTA1254Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala Glu Leu Arg Val Leu390 395 400 405
TAC GCT CCC CGG CTA GAC GAT TCG GAC TGC CCC AGG AGT TGG ACG TGG1302Tyr Ala Pro Arg Leu Asp Asp Ser Asp Cys Pro Arg Ser Trp Thr Trp410 415 420CCC GAG GGC CCA GAG CAG ACG CTG CGC TGC GAG GCC CGC GGG AAC CCA1350Pro Glu Gly Pro Glu Gln Thr Leu Arg Cys Glu Ala Arg Gly Asn Pro425 430 435GAA CCC TCA GTG CAC TGT GCG CGC TCC GAC GGC GGG GCC GTG CTG GCT1398Glu Pro Sar Val His Cys Ala Arg Ser Asp Gly Gly Ala Val Leu Ala440 445 450CTG GGC CTG CTG GGT CCA GTC ACT CGG GCG CTC TCA GGC ACT TAC CGC1446Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu Ser Gly Thr Tyr Arg455 460 465TGC AAG GCG GCC AAT GAT CAA GGC GAG GCG GTC AAG SAC GTA ACG CTA1494Cys Lys Ala Ala Asn Asp Gln Gly Glu Ala Val Lys Asp Val Thr Leu470 475 480 485ACG GTG GAG TAC GCA CCA GCG CTG GAC AGC GTG GGC TGC CCA GAA CGC1542Thr Val Glu Tyr Als Pro Ala Leu Asp Ser Val Gly Cys Pro Glu Arg490 495 500ATT ACT TGG CTG GAG GGA ACA GAA GCC TCG CTG AGC TGT GTG GCG CAC1590Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu Ser Cys Val Ala His505 510 515GGG GTA CCG CCG CCT GAT GTG ATC TGC GTG CGC TCT GGA GAA CTC GGG1638Gly Val Pro Pro Pro Asp Val Ile Cys Val Arg Ser Gly Glu Leu Gly520 525 530GCC GTC ATC GAG GGG CTG TTG CGT GTG GCC CGG GAG CAT GCG GGC ACT1686Ala Val Ile Glu Gly Leu Leu Arg Val Ala Arg Glu His Ala Gly Thr535 540 545TAC CGC TGC GAA GCC ACT AAC CCT CGG GGC TCT GCG GCC AAA AAT GTG1734Tyr Arg Cys Glu Ala Thr Asn Pro Arg Gly Ser Ala Ala Lys Asn Val550 555 560 565GCC GTC ACG GTG GAA TAT GGC CCC AGG TTT GAG GAG CCG AGC TGC CCC1782Ala Val Thr Val Glu Tyr Gly Pro Arg Phe Glu Glu Pro Ser Cys Pro570 575 580AGC AAT TGG ACA TGG GTG GAA GGA TCT GGG CGC CTG TTT TCC TGT GAG1830Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Arg Leu Phe Ser Cys Glu585 590 595GTC GAT GGG AAG CCA CAG CCA AGC GTG AAG TGC GTG GGC TCC GGG GGC1878Val Asp Gly Lys Pro Gln Pro Ser Val Lys Cys Val Gly Ser Gly Gly600 605 610ACC ACT GAG GGG GTG CTG CTG CCG CTG GCA CCC CCA GAC CCT AGT CCC1926Thr Thr Glu Gly Val Leu Leu Pro Leu Ala Pro Pro Asp Pro Ser Pro615 620 625AGA GCT CCC AGA ATC CCT AGA GTC CTG GCA CCC GGT ATC TAC GTC TGC1974Arg Ala Pro Arg Ile Pro Arg Val Leu Ala Pro Gly Ile Tyr Val Cys630 635 640 645AAC GCC ACC AAC CGC CAC GGC TCC GTG GCC AAA ACA GTC GTC GTG AGC2022Asn Ala Thr Asn Arg His Gly Ser Val Ala Lys Thr Val Val Val Ser650 655 660
GCG GAG TCG CCA CCG GAG ATG GAT GAA TCT ACC TGC CCA AGT CAC CAG2070Ala Glu Ser Pro Pro Glu Met Asp Glu Ser Thr Cys Pro Ser His Gln665 670 675ACG TGG CTG GAA GGG GCT GAG GCT TCC GCG CTG GCC TGC GCC GCC CGG2118Thr Trp Leu Glu Gly Ala Glu Ala Ser Ala Leu Ala Cys Ala Ala Arg680 685 690GGT CGC CCT TCC CCA GGA GTG CGC TGC TCT CGG GAA GGC ATC CCA TGG2166Gly Arg Pro Ser Pro Gly Val Arg Cys Ser Arg Glu Gly Ile Pro Trp695 700 705CCT GAG CAG CAG CGC GTG TCC CGA GAG GAC GCG GGC ACT TAC CAC TGT2214Pro Glu Gln Gln Arg Val Ser Arg Glu Asp Ala Gly Thr Tyr His Cys710 715 720 725GTG GCC ACC AAT GCG CAT GGC ACG GAC TCC CGG ACC GTC ACT GTG GGC2262Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg Thr Val Thr Val Gly730 735 740GTG GAA TAC CGG CCA GTG GTG GCC GAA CTT GCT GCC TCG CCC CCT GGA2310Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala Ala Ser Pro Pro Gly745 750 755GGC GTG CGC CCA GGA GGA AAC TTC ACG TTG ACC TGC CGC GCG GAG GCC2358Gly Val Arg Pro Gly Gly Asn Phe Thr Leu Thr Cys Arg Ala Glu Ala760 765 770TGG CCT CCA GCC CAG ATC AGC TGG CGC GCG CCC CCG AGG GCC CTC AAC2406Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro Pro Arg Ala Leu Asn775 780 785ATC GGC CTG TCG AGC AAC AAC AGC ACA CTG AGC GTG GCA GGC GCC ATG2454Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser Val Ala Gly Ala Met790 795 800 805GGA AGC CAC GGC GGC GAG TAC GAG TGC GCA CGC ACC AAC GCG CAC GGG2502Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg Thr Asn Ala His Gly810 815 820CGC CAC GCG CGG CGC ATC ACG GTG CGC GTG GCC GGT CCG TGG CTA TGG2550Arg His Ala Arg Arg Ile Thr Val Arg Val Ala Gly Pro Trp Leu Trp825 830 835GTC GCC GTG GGC GGC GCG GCG GGG GGC GCG GCG CTG CTG GCC GCG GGG2598Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala Leu Leu Ala Ala Gly840 845 850GCC GGC CTG GCC TTC TAC GTG CAG TCC ACC GCC TGC AAG AAG GGC GAG2646Ala Gly Leu Ala Phe Tyr Val Gln SeR Thr Ala Cys Lys Lys Gly Glu855 860 865TAC AAC GTG CAG GAG GCC GAG AGC TCA GGC GAG GCC GTG TGT CTG AAC2694Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu Ala Val Cys Leu Asn870 875 880 885GGA GCG GGC GGC GGC GCT GGC GGG GCG GCA GGC GCG GAG GGC GGA CCC2742Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly Ala Glu Gly Gly Pro890 895 900GAG GCG GCG GGG GGC GCG GCC GAG TCG CCG GCG GAG GGC GAG GTC TTC2790Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala Glu Gly Glu Val Phe905 910 915
GCC ATA CAG CTG ACA TCG GCG TGAGCCCGCT CCCCTCTCCG CGGGGCCGGGA2841Ala Ile Gln Leu Thr Ser Ala920 925CGCCCCCCAG ACTCACACGG GGGCTTATTT ATTGCTTTAT TTATTTACTT ATTCATTTAT2901TTATGTATTC AACTCCAAGG GAATTC 2927(2)SEQ ID NO28的资料(i)序列特征(A)长度924个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO28Met Pro Gly Pro Ser Pro Gly Leu Arg Arg Ala Leu Leu Gly Leu Trp1 5 10 15Ala Ala Leu Gly Leu Gly Leu Phe Gly Leu Ser Ala Val Ser Gln Glu20 25 30Pro Phe Trp Ala Asp Leu Gln Pro Arg Val Ala Phe Val Glu Arg Gly35 40 45Gly Ser Leu Trp Leu Asn Cys Ser Thr Asn Cys Pro Arg Pro Glu Arg50 55 60Gly Gly Leu Glu Thr Ser Leu Arg Arg Asn Gly Thr Gln Arg Gly Leu65 70 75 80Arg Trp Leu Ala Arg Gln Leu Val Asp Ile Arg Glu Pro Glu Thr Gln85 90 95Pro Val Cys Phe Phe Arg Cys Ala Arg Arg Thr Leu Gln Ala Arg Gly100 105 110Leu Ile Arg Thr Phe Gln Arg Pro Asp Arg Val Glu Leu Met Pro Leu115 120 125Pro Pro Trp Gln Pro Val Gly Glu Asn Phe Thr Leu Ser Cys Arg Val130 135 140Pro Gly Ala Gly Pro Arg Ala Ser Leu Thr Leu Thr Leu Leu Arg Gly145 150 155 160Ala Gln Glu Leu Ile Arg Arg Ser Phe Ala Gly Glu Pro Pro Arg Ala165 170 175Arg Gly Ala Val Leu Thr Ala Thr Val Leu Ala Arg Arg Glu Asp His180 185 190Gly Ala Asn Phe Ser Cys Arg Ala Glu Leu Asp Leu Arg Pro His Gly195 200 205
Leu Gly Leu Phe Glu Asn Ser Ser Ala Pro Arg Glu Leu Arg Thr Phe210 215 220Ser Leu Ser Pro Asp Ala Pro Arg Leu Ala Ala Pro Arg Leu Leu Glu225 230 235 240Val Gly Ser Glu Arg Pro Val Ser Cys Thr Leu Asp Gly Leu Phe Pro245 250 255Ala Ser Glu Ala Arg Val Tyr Leu Ala Leu Gly Asp Gln Asn Leu Ser260 265 270Pro Asp Val Thr Leu Glu Gly Asp Ala Phe Val Ala Thr Ala Thr Ala275 280 285Thr Ala Ser Ala Glu Gln Glu Gly Ala Arg Gln Leu Val Cys Asn Val290 295 300Thr Leu Gly Gly Glu Asn Arg Glu Thr Arg Glu Asn Val Thr Ile Tyr305 310 315 320Ser Phe Pro Ala Pro Leu Leu Thr Leu Ser Glu Pro Ser Val Ser Glu325 330 335Gly Gln Met Val Thr Val Thr Cys Ala Ala Gly Ala Gln Ala Leu Val340 345 350Thr Leu Glu Gly Val Pro Ala Ala Val Pro Gly Gln Pro Ala Gln Leu355 360 365Gln Leu Asn Ala Thr Glu Asn Asp Asp Arg Arg Ser Phe Phe Cys Asp370 375 380Ala Thr Leu Asp Val Asp Gly Glu Thr Leu Ile Lys Asn Arg Ser Ala385 390 395 400Glu Leu Arg Val Leu Tyr Ala Pro Arg Leu Asp Asp Ser Asp Cys Pro405 410 415Arg Ser Trp Thr Trp Pro Glu Gly Pro Glu Gln Thr Leu Arg Cys Glu420 425 430Ala Arg Gly Asn Pro Glu Pro Ser Val His Cys Ala Arg Ser Asp Gly435 440 445Gly Ala Val Leu Ala Leu Gly Leu Leu Gly Pro Val Thr Arg Ala Leu450 455 460Ser Gly Thr Tyr Arg Cys Lys Ala Ala Asn Asp Gln Gly Glu Ala Val465 470 475 480Lys Asp Val Thr Leu Thr Val Glu Tyr Ala Pro Ala Leu Asp Ser Val485 490 495Gly Cys Pro Glu Arg Ile Thr Trp Leu Glu Gly Thr Glu Ala Ser Leu500 505 510Ser Cys Val Ala His Gly Val Pro Pro Pro Asp Val Ile Cys Val Arg515 520 525Ser Gly Glu Leu Gly Ala Val Ile Glu Gly Leu Leu Arg Val Ala Arg530 535 540
Glu His Ala Gly Thr Tyr Arg Cys Glu Ala Thr Asn Pro Arg Gly Ser545 550 555 560Ala Ala Lys Asn Val Ala Val Thr Val Glu Tyr Gly Pro Arg Phe Glu565 570 575Glu Pro Ser Cys Pro Ser Asn Trp Thr Trp Val Glu Gly Ser Gly Arg580 585 590Leu Phe Ser Cys Glu Val Asp Gly Lye Pro Gln Pro Ser Val Lys Cys595 600 605Val Gly Ser Gly Gly Thr Thr Glu Gly Val Leu Leu Pro Leu Ala Pro610 615 620Pro Asp Pro Ser Pro Arg Ala Pro Arg Ile Pro Arg Val Leu Ala Pro625 630 635 640Gly Ile Tyr Val Cys Asn Ala Thr Asn Arg His Gly Ser Val Ala Lys645 650 655Thr Val Val Val Ser Ala Glu Ser Pro Pro Glu Met Asp Glu Ser Thr660 665 670Cys Pro Ser His Gln Thr Trp Leu Glu Gly Ala Glu Ala Ser Ala Leu675 680 685Ala Cys Ala Ala Arg Gly Arg Pro Ser Pro Gly Val Arg Cys Ser Arg690 695 700Glu Gly Ile Pro Trp Pro Glu Gln Gln Arg Val Ser Arg Glu Asp Ala705 710 715 720Gly Thr Tyr His Cys Val Ala Thr Asn Ala His Gly Thr Asp Ser Arg725 730 735Thr Val Thr Val Gly Val Glu Tyr Arg Pro Val Val Ala Glu Leu Ala740 745 750Ala Ser Pro Pro Gly Gly Val Arg Pro Gly Gly Asn Phe Thr Leu Thr755 760 765Cys Arg Ala Glu Ala Trp Pro Pro Ala Gln Ile Ser Trp Arg Ala Pro770 775 780Pro Arg Ala Leu Asn Ile Gly Leu Ser Ser Asn Asn Ser Thr Leu Ser785 790 795 800Val Ala Gly Ala Met Gly Ser His Gly Gly Glu Tyr Glu Cys Ala Arg805 810 815Thr Asn Ala His Gly Arg His Ala Arg Arg Ile Thr Val Arg Val Ala820 825 830Gly Pro Trp Leu Trp Val Ala Val Gly Gly Ala Ala Gly Gly Ala Ala835 840 845Leu Leu Ala Ala Gly Ala Gly Leu Ala Phe Tyr Val Gln Ser Thr Ala850 855 860Cys Lys Lys Gly Glu Tyr Asn Val Gln Glu Ala Glu Ser Ser Gly Glu865 870 875 880Ala Val Cys Leu Asn Gly Ala Gly Gly Gly Ala Gly Gly Ala Ala Gly885 890 895Ala Glu Gly Gly Pro Glu Ala Ala Gly Gly Ala Ala Glu Ser Pro Ala900 905 910Glu Gly Glu Val Phe Ala Ile Gln Leu Thr Ser Ala915 920
(2)SEQ ID NO29的资料(i)序列特征(A)长度65个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO29GTACTTACAG GATCCGCGGT CTCGCAGGAG CCCTTCTGGG CGGACCTACA GCCTGCGTGG60CGTTC65(2)SEQ ID NO30的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO30ATTTCTCTCG AGGATGGTCA CGTTCTCCCG G 31(2)SEQ ID NO31的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO31ATTTCTGGAT CCTACAGCTT CCCGGCACCA CTC 33
(2)SEQ ID NO32的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO32ATTTCTCTCG AGTTCCACGC CCACAGTGAC GG 32(2)SEQ ID NO33的资料(i)序列特征(A)长度1687个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO33GGATCCTTTG AGCCCTGAAA GTCGAGGTTG CAGTGAGCCT TGATCGTGCC ACTGCACTCC60AGCCTGGGGG ACAGAGCACG ACCCTGTCTC CAAAAATAAA ATAAAAATAA AAATAAATAT120TGGCGGGGGA ACCCTCTGGA ATCAATAAAG GCTTCCTTAA CCAGCCTCTG TCCTGTGACC180TAAGGGTCCG CATTACTGCC CTTCTTCGGA GGAACTGGTT TGTTTTTGTT GTTGTTGTTG240TTTTTGCGAT CACTTTCTCC AAGTTCCTTG TCTCCCTGAG GGCACCTGAG GTTTCCTCAC300TCAGGGCCCA CCTGGGGTCC CGAAGCCCCA GACTCTGTGT ATCCCCAGCG GGTGTCACAG360AAACCTCTCC TTCTGCTGGC CTTATCGAGT GGGATCAGCG CGGCCGGGGA GAGCCACGGG420CAGGGGCGGG GTGGGGTTCA TGGTATGGCT TTCCTGATTG GCGCCGCCGC CACCACGCGG480CAGCTCTGAT TGGATGTTAA GTTTCCTATC CCAGCCCCAC CTTCAGACCC TGTGCTTTCC540TGGAGGCCAA ACAACTGTGG AGCGAGAACT CATCTCCAAA ATAACTTACC ACGCTGGAGT600GAGACCACGA ATGGTGGGGA GGGGAGGGTC CCACGGACAT ATTGAGGGAC GTGGATACGC660AGAAGAGGTA TCCATGTGGT GGCAGCCGGG AAGGGGTGAT CAGATGGTCC ACAGGGAATA720
TCACAAACTC GAATTCTGAC GATGTTCTGG TAGTCACCCA GCCAGATGAG CGCATGGAGT780TGGCGGTGGG GGGTGTCAAA GCTTGGGGCC CGGAAGCGGA GTCAAAAGCA TCACCCTCGG840TCCCTTGTTC TCGCGTGGAT GTCAGGGCCT CCACCCACCG AGCAGAAGGC GGACTCAGGG900GCGCTCCAGG GTGGCTCGAG CTCACACACG CTGAGTAGAC ACGTGCCCGC TGCACCCTGG960GTAAATACAG ACCCGGAGCC GAGCGGATTC TAATTTAGAC GCCCGCGAAC GCTGCGCGCA1020CGCACACGTG TCCTCGGCTC GCTGGCACTT TCGTCCCGCC CCCTCCGTCG CGTGCCGGAG1080CTGACCCGGA GGGGTGCTTA GAGGTATGGC TCCGCGGGGT CAAAAGGAGA AGGATCAGTG1140AGAGAGGATC CCCACACCCT CCCCTAGAAC TGTCCTTTCC CCATCCAGTG CCTCCCAAAT1200CTCTCTTAGT CCCCAAATGT ATCCCCGCCC TAAGGGGCGC TGGTGGGAGG AGCTAAATGT1260GGGGGCGGAG CTCGGAGTCC AGCTTATTAT CATGGCATCT CAGCCAGGGC TGGGGTAGGG1320GTTTGGGAAG GGCAACCCAG CATCCCCCGA TCCCAGAGTC GCGGCCGGGG ATGACGCGAG1380AGAGCGTGGT CGCCCCCAGA AGGCCCTGGG CCATCATGCC GGCCTCCACG TAGACCCCAG1440GGGTCGCTCA CTCCTGCCAG CTCGCCTTCA CCAAGGCCAG GAGCTTAGCG CACGCTCGCC1500TCCCGCCCCC CCGCCGCCTC TGCCGCCGCC CCCTCCTTGG AAACCAAGTT ACCAACGTTA1560AACCAATCCC CAAGCGCAAC TCTGTCTCCC CCACACCCCA CCCGCCGCGC CGCGCGGAGC1620CGTCCTCTAG CCCAGCTCCT CGGCTCGCGC TCTCCTCGCC TCCTGTGCTT TCCCCGCCGC1680GGCGATG 1687(2)SEQ ID NO34的资料(i)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO34AAGAACTAAG CTTACAGGAG GCGAGGAGAG CGCGAG 36(2)SEQ ID NO35的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链
(D)拓扑结构线性(ii)分子类型DNA(基因组)(xi)序列描述SEQ ID NO5CAACAATGCT AGCCAAGCGC AACTCTGTCT C 31(2)SEQ ID NO36的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO36CAACAATGCT AGCCTTGGAA ACCAAGTTAC C 31(2)SEQ ID NO37的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO37CAACAATGCT AGCAGGAGCT TAGCGCACGC TCG 33(2)SEQ ID NO38的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性
(ii)分子类型DNA(xi)序列描述SEQ ID NO38CAACAATGCT AGCCATGCCG GCCTCCACGT AG 32(2)SEQ ID NO39的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO39CAACAATGCT AGCGTCCAGC TTATTATCAT G 31(2)SEQ ID NO40的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO40CAACAATGCT AGCCTTAGTC CCCAAATGTA TC 32(2)SEQ ID NO41的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA
(xi)序列描述SEQ ID NO41CAACAATGCT AGCGGAGAAG GATCAGTGAG 30(2)SEQ ID NO42的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型DNA(xi)序列描述SEQ ID NO42CAACAATGCT AGCCTCCACC CACCGAGCAG AAG 3权利要求
1.一个被纯化和分离的DNA,其含有哺乳动物ICAM-4的启动子。
2.权利要求1的DNA,其中所说的启动子是人ICAM-4的启动子。
3.权利要求2的DNA,其中的启动子包含在SEQ ID NO33中。
4.权利要求3的DNA,其中所说的启动子包含在SEQ ID NO33中从大约核苷酸1204到大约核苷酸1666的序列之中。
5.权利要求1到4中任一权项的DNA,其中所说的启动子在神经细胞中,能够特异性地启动对经操作与该启动子连接的多聚核苷酸的转录过程。
6.权利要求5的DNA,其中所说的神经细胞是海马细胞。
7.一种包含有人ICAM-4基因启动子的嵌合体多聚核苷酸。
8.权利要求7的嵌合体多聚核苷酸,其中所说的启动子包含在SEQID NO33的从大约核苷酸1204到大约核苷酸1666的序列之中。
9.一种含有权利要求1或7的DNA的表达载体。
10.一种用权利要求9的载体转化的宿主细胞。
全文摘要
本发明公开了编码一种新型的细胞间粘附分子多肽(被称为“ICAM-4”)及其变异体的DNA序列,以及通过重组技术生产这种多肽的方法和材料。本发明还公开了一些与ICAM-4结合的分子及其用途。
文档编号A61K39/00GK1597950SQ20041003429
公开日2005年3月23日 申请日期1996年6月6日 优先权日1995年6月7日
发明者P·D·基尔加农, W·M·加勒廷 申请人:艾科斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1