人toll样受体蛋白、相关试剂和方法

文档序号:3550645阅读:676来源:国知局
专利名称:人toll样受体蛋白、相关试剂和方法
技术领域
本发明涉及影响哺乳动物生理学的组合物和方法,所述哺乳动物生理学包括形态发生或免疫系统功能。具体地说,本发明提供调节发育和/或免疫系统的核酸、蛋白质和抗体。也公开了这些物质的诊断用途和治疗用途。
背景技术
重组DNA技术一般是指这些技术,所述技术通过将来自供体来源的遗传信息整合到用于后续加工的载体中,诸如通过引入到宿主中,由此使所转移的遗传信息在该新环境中复制和/或表达。通常,该遗传信息以互补DNA(cDNA)的形式存在,所述互补DNA衍生自编码所需的蛋白产物的信使RNA(mRNA)。该载体通常是一种质粒,该质粒具有将用于随后复制的cDNA加入宿主中的能力,在某些情况下,实际控制该cDNA的表达,并由此指导所编码的产物在该宿主中合成。
一段时间以来,已经知道哺乳动物的免疫应答基于称为“免疫网络”的一系列复杂的细胞相互作用。最近的研究已经提供了对该网络内部运作的新的了解。尽管已经清楚许多免疫应答实际上确实围绕淋巴细胞、巨噬细胞、粒细胞和其它细胞的网络样相互作用运转,但免疫学家现在一般竖持这样一种观点称为淋巴因子、细胞因子或单核因子的可溶性蛋白,在控制这些细胞相互作用中起关键作用。因此,人们对细胞调节因子的分离、特征鉴定和作用机制相当感兴趣,对这些信息的了解将导致在许多医学异常(例如免疫系统失调)的诊断和治疗方面取得显著的进展。
淋巴因子看来以多种方式介导细胞活性。已经表明,它们支持多能造血干细胞的增殖、生长和/或分化为大量的祖细胞(progenitor),所述祖细胞包括构成复杂的免疫系统的多样化的细胞谱系。细胞组分之间适当和平衡的相互作用是健康的免疫应答所必需的。当结合其它因子给予淋巴因子时,不同的细胞谱系常常以不同方式应答。
对免疫应答尤其重要的细胞谱系包括两类淋巴细胞B细胞,它们可以产生和分泌免疫球蛋白(具有识别并结合外源物质以实现将其去除的能力的蛋白);和各种亚群的T细胞,它们分泌淋巴因子,并诱导或抑制B细胞和构成免疫网络的各种其它细胞(包括其它T细胞)。这些淋巴细胞与许多其它细胞类型相互作用。
另一种重要的细胞谱系是肥大细胞(在所有哺乳动物物种中尚未被明确鉴定),这是一种含颗粒的结缔组织细胞,邻近遍布机体的毛细管定位。发现这些细胞在肺、皮肤以及胃肠道和生殖泌尿道中的浓度尤其高。肥大细胞如下在变态反应相关的病征(特别是过敏反应)中起中心作用当选定的抗原与结合于肥大细胞表面上受体的一类免疫球蛋白交联时,该肥大细胞脱粒并释放引起变态反应(例如过敏反应)的介质,例如组胺、5-羟色胺、肝素和前列腺素。
一般不能在体外维持免疫系统的细胞,这已经阻碍了为更好地了解和治疗各种免疫失调而进行的研究。免疫学家已经发现,通过使用T细胞和其它细胞的上清液,可以完成对许多这些细胞的培养,所述上清液含有各种生长因子,包括许多淋巴因子。
蛋白的白介素-1家族包括IL-1α、IL-1β、IL-1RA和最近的IL-1γ(也命名为干扰素-γ诱导因子,IGIF)。在范围广泛的生物学功能中已经牵涉到该基因相关家族。参见Dinarello(1994)FASEB J.81314-1325;Dinarello(1991)Blood 771627-1652;和Okamura等(1995)Nature 37888-91。
此外,存在调节形态发生发育的各种生长因子和调节因子。这包括例如Toll配体,它们通过结合于享有IL-1受体特征性的结构和机制特征的受体而发送信号。参见例如Lemaitre等(1996)Cell 86973-983;Belvin和Anderson(1960)Ann.Rev.Cell & Devel.Biol.12393-416。
根据以上所述,可明显看出,新的可溶性蛋白及其受体(包括类似于淋巴因子的蛋白)的发现和研制,应该有助于用于范围广泛的退行性病征或异常病征的新疗法,所述病征直接或间接涉及例如免疫系统和/或造血细胞的发育、分化或功能。特别是,对于增加或增强其它淋巴因子有益活性的淋巴因子样分子,其新受体的发现和了解应该是非常有利。本发明提供新的受体和相关化合物及其使用方法,其中所述受体为表现出与白介素-1样组合物相似性的配体的受体。
附图简述

图1显示了果蝇属和人的DTLR蛋白结构的图示比较、以及它们与脊椎动物IL-1受体和植物抗病性蛋白的关系。三种果蝇属(Dm)DTLR(Toll、18w和Mst ORF片段)(Morisato和Anderson(1995)Ann.Rev.Genet.29371-399;Chiang和Beachy(1994)Mech.Develop.47225-239;Mitcham等(1996)J.Biol.Chem.2715777-5783;和Eldon等(1994)Develop.120885-899)排列在四个完整的(DTLR 1-4)和一个部分的(DTLR5)人(Hu)受体旁边。清楚地框注了通过PRINTS(Attwood等(1997)Nucleci Acids Res.25212-217)标记的所述受体胞外域的各个LRR;邻接LRR阵列(LRR array)C末端或N末端的“顶部”和“底部”富含Cys的簇,分别用汇合的半圆画出。当与Toll和18w的784aa和977aa的延伸物相比时,DTLR 1-5中内部Cys富含区的丧失,主要产生其较小的胞外域(分别为558、570、690和652aa)。DmMst和HuDTLR5的不完整链(分别为519aa和153aa的胞外域)由虚线表示。与DTLR、IL-1型受体(IL-1R)、胞内蛋白Myd88和烟草抗病性基因N产物(DRgN)共同的胞内信号组件,显示在该质膜下面。参见例如Hardiman等(1996)Oncogene 132467-2475;和Rock等(1998)Proc.Nat’l Acad.Sci.USA 95588-。其它域包括IL-1R中Ig样组件的trio(二硫键连接的环);DRgN蛋白的特征是一个NTP酶域(方框),而Myd88具有一个死域(death domain)(黑色椭圆)。
图2A-2B显示Toll样和IL-1样细胞因子受体和两个分歧的组件蛋白信号域中的保守结构模式。图2A显示共同的TH域的序列对比。DTLR按图1中进行标记;人(Hu)或小鼠(Mo)IL-1家族受体(IL-1R1-6)按早年提出提出的方法(Hardiman等(1996)Oncogene 132467-2475)顺序编号;Myd88和来自烟草(To)和亚麻L.usitatissium(Lu)的序列,分别代表较大的多域分子的C末端域和N末端域。框注了不间断的序列区组(编号为1-10)。三角表示有害的突变,而箭头N末端的截短物消除人IL-1R1中的生物活性(Heguy等(1992)J.Biol.Chem.2672605-2609)。标出了α-螺旋(H)、β-链(E)或螺旋(L)的PHD(Rost和Sander(1994)Proteins 1955-72)和DSC(King和Sternberg(1996)Protein Sci.52298-2310)二级结构预测。氨基酸遮蔽方案描述了化学上相似的残基疏水性、酸性、碱性、Cys、芳族、结构断裂性和微小的残基。通过75%严格性下的共有序列,得出IL-1R、DTLR和全部序列对比(ALL)的诊断序列模式。氨基酸亚组的符号是(关于细节请参见互联网网站(internet site))o,醇;l,脂族的;●,任一氨基酸;a,芳族的;c,带电荷的;h,疏水性;-,阴性;p,极性;+,阳性;s,小的;u,微小的;t,转角样的。图2B显示了建议的THβ/α域折叠的拓扑图。在其C末端观察到平行的β-片(具有黄色三角的β-链A-E);α-螺旋(标记1-5的圆)连接所述β-链;链连接在前面(可见的)或后面(隐藏的)。以灰色(Asp)或作为单独的黑色(Arg)残基,标注β-片C末端保守的带电荷的残基(参见正文)。
图3显示信号域超家族的进化。通过相邻连接法(Thompson等,(1994)Nucleic Acids Res.224673-4680),用图2A的多重TH组件序列对比得出进化系统树。同序列对比中一样标记蛋白;用TreeView提供该树。
图4A-4D显示人DTLR基因的FISH染色体作图。使来自人淋巴细胞同步培养物的变性染色体,与用于定位的生物素化DTLR cDNA探针杂交。通过使FISH信号与DAPI显带的染色体重叠(中心图板),得到具有染色体带的FISH作图数据(左边,图4A,DTLR2;4B,DTLR3;4C,DTLR4;4D,DTLR5)的对比。Heng和Tsui(1994)Meth.Molec.Biol.33109-122。以人染色体模式图(ideograms)(右板)的形式总结分析。
图5A-5F显示人DTLR的mRNA印迹分析。用放射标记的、编码上述DTLR1(图5A-5C)、DTLR2(图5D)、DTLR3(图5E)和DTLR4(图5F)的cDNA,探测每泳道含有大约2μg多聚(A)+RNA的人多种组织的印迹(He,心脏;Br,脑;Pl,胎盘;Lu,肺;Li,肝脏;Mu,肌肉;Ki,肾脏;Pn,胰脏;Sp,脾脏;Th,胸腺;Pr,前列腺;Te,睾丸;Ov,卵巢;SI,小肠;Co,结肠;PBL,外周血淋巴细胞)和癌细胞系(早幼粒细胞性白血病,HL60;宫颈癌,HELAS3;慢性髓细胞性白血病,K562;淋巴细胞性白血病,Molt4;结肠直肠腺癌,SW480;黑素瘤,G361;伯基特淋巴瘤Raji,Burkitt’s;结肠直肠腺癌,SW480;肺癌,A549)。于-70℃用增感屏将印迹对X光片曝光2天(图5A-5C)或一周(图5D-5F)。在某些泳道中出现异常的0.3kB种类;杂交实验排除了编码DTLR胞质片段的信息。
发明概述本发明涉及9种新的相关哺乳动物受体(例如人)-Toll受体样分子的结构及其生物活性,所述受体命名为DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9和DTLR10。本发明包括编码所述多肽本身的核酸以及它们的生产和使用方法。本发明核酸的特征,部分在于它们与本文公开的克隆的互补DNA(cDNA)序列的同源性。
在某些实施方案中,本发明提供选自以下物质的组合物大致纯的或重组的DTLR2蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO4的序列同一性至少为85%;SEQ ID NO4的天然序列DTLR2;包含DTLR2序列的融合蛋白;大致纯的或重组的DTLR3蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQID NO6的序列同一性至少为85%;SEQ ID NO6的天然序列DTLR3;包含DTLR3序列的融合蛋白;大致纯的或重组的DTLR4蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO26的序列同一性至少为85%;SEQ ID NO26的天然序列DTLR4;包含DTLR4序列的融合蛋白;大致纯的或重组的DTLR5蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO10的序列同一性至少为85%;SEQ ID NO10的天然序列DTLR5;和包含DTLR5序列的融合蛋白。
在其它实施方案中,本发明提供选自以下物质的组合物大致纯的或重组的DTLR6蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO12的序列同一性至少为85%;SEQ ID NO12的天然序列DTLR6;包含DTLR6序列的融合蛋白;大致纯的或重组的DTLR7蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO16或18的序列同一性至少为85%,或;SEQ ID NO16或18的天然序列DTLR7;包含DTLR7序列的融合蛋白;大致纯的或重组的DTLR8蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO32的序列同一性至少为85%;SEQ ID NO32的天然序列DTLR8;包含DTLR8序列的融合蛋白;大致纯的或重组的DTLR9蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQID NO22的序列同一性至少为85%;SEQ ID NO22的天然序列DTLR9;和包含DTLR9序列的融合蛋白;大致纯的或重组的DTLR10蛋白或肽,它在至少大约12个氨基酸的长度内,表现出与SEQ ID NO34的序列同一性至少为85%;SEQ ID NO34的天然序列DTLR10;和包含DTLR10序列的融合蛋白。
最好是,所述大致纯的或分离的蛋白包含与以下序列的相应部分表现出序列同一性的区段DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10,其中所述同源性至少为大约90%的同一性,而所述部分为至少大约9个氨基酸;所述同源性至少为大约80%的同一性,而所述部分为至少大约17个氨基酸;或所述同源性至少为大约70%的同一性,而所述部分为至少大约25个氨基酸。在具体实施方案中,所述物质的组合物为DTLR2,它包含SEQ ID NO4的成熟序列;或表现出与天然DTLR2不同的翻译后+修饰模式;为DTLR3,它包含SEQ ID NO6的成熟序列,或表现出与天然DTLR3不同的翻译后修饰模式;为DTLR4,它包含SEQ ID NO26的成熟序列,或表现出与天然DTLR4不同的翻译后修饰模式;或为DTLR5,它包含SEQ ID NO10的完整序列,或表现出与天然DTLR5不同的翻译后修饰模式;或为DTLR6,它包含SEQ ID NO12的成熟序列,或表现出与天然DTLR6不同的翻译后修饰模式;为DTLR7,它包含SEQ ID NO16或18的成熟序列,或表现出与天然DTLR7不同的翻译后修饰模式;为DTLR8,它包含SEQ ID NO32的成熟序列,或表现出与天然DTLR8不同的翻译后修饰模式;或为DTLR9,它包含SEQ ID NO22的完整序列,或表现出与天然DTLR9不同的翻译后修饰模式;或为DTLR10,它包含SEQ ID NO34的完整序列,或表现出与天然DTLR1O不同的翻译后修饰模式;或所述物质的组合物可以是一种蛋白或肽,该蛋白或肽来自选自哺乳动物(包括诸如人的灵长类)的温血动物;包含SEQ IDNO4、6、26、10、12、16、18、32、22或34的至少一种肽区段;表现出多个部分显示所述同一性;为DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10的天然等位基因变异体;其长度至少为大约30个氨基酸;表现出至少两个非重叠表位是灵长类DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10特有的;在至少大约20个氨基酸的长度内,表现出与灵长类DTLR2、DTLR3、DTLR4、DTLR5、DTLR6的序列同一性至少为大约90%;表现出至少两个非重叠表位是灵长类DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10特有的;在至少大约20个氨基酸的长度内,表现出与灵长类DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10的序列同一性至少为大约90%;为糖基化的;其分子量至少为100kD,并且被天然糖基化;为合成多肽;连接至固体基质;与另一化学部分缀合;为天然序列的5重或更低重取代的取代体;或为天然序列的缺失或插入变异体。
其它实施方案包括组合物,它包含无菌DTLR2蛋白或肽;或所述DTLR2蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR3蛋白或肽;或所述DTLR3蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR4蛋白或肽;或所述DTLR4蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR5蛋白或肽;或所述DTLR5蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR6蛋白或肽;或所述DTLR6蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR7蛋白或肽;或所述DTLR7蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR8蛋白或肽;或所述DTLR8蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR9蛋白或肽;或所述DTLR9蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药;无菌DTLR10蛋白或肽;或所述DTLR10蛋白或肽和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药。
在某些融合蛋白实施方案中,本发明提供一种融合蛋白,它包含SEQ ID NO4、6、26、10、12、16、18、32、22或34的成熟蛋白序列;一种检测或纯化标记,包括FLAG、His6或Ig序列;或另一受体蛋白的序列。
各种试剂盒实施方案包括的试剂盒包含一种DTLR蛋白或多肽,和包含所述蛋白或多肽的区室;和/或使用或处理该试剂盒中试剂的说明。
结合化合物的实施方案包括那些化合物,它们包含来自抗体的抗原结合位点,该位点特异性地结合于天然的DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10蛋白,其中所述蛋白为灵长类蛋白;所述结合化合物为Fv、Fab或Fab2片段;所述结合化合物与另一化学部分缀合;或所述抗体针对SEQ ID NO4、6、26、10、12、16、18、32、22或34的成熟肽的肽序列而产生;针对成熟的DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10而产生;针对纯化的人DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10而产生;为免疫选择性的;为多克隆抗体;结合于变性的DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10;表现出与抗原的Kd至少为30μM;连接至固体基质,包括珠粒或塑料膜;在无菌组合物中;或进行了可检测标记,包括放射性标记或荧光标记。结合组合物的试剂盒通常包含所述结合化合物,和包含所述结合化合物的区室;和/或使用或处理该试剂盒中试剂的说明。该试剂盒通常能够进行定性或定量分析。
其它组合物包括这样的组合物,它包含无菌结合化合物,或所述结合化合物和一种载体,其中所述载体为水性化合物,包括水、盐水和/或缓冲液;和/或配制用于经口、直肠、鼻、局部或胃肠外给药。
核酸的实施方案包括分离的或重组的核酸,它编码DTLR2-10的蛋白或肽或融合蛋白,其中所述DTLR来自哺乳动物;或所述核酸编码SEQ ID NO4、6、26、10、12、16、18、32、22或34的抗原肽序列;编码多个SEQ ID NO4、6、26、10、12、16、18、32、22或34的抗原肽序列;表现出与编码所述区段的天然cDNA的同一性至少为大约80%;为一种表达载体;还包含一个复制起点;来自天然来源;包含一种可检测标记;包含合成的核苷酸序列;小于6kb,最好小于3kb;来自哺乳动物,包括灵长类;包含一种天然的全长编码序列;为编码所述DTLR的基因的杂交探针;或为一种PCR引物、PCR产物或诱变引物。也提供包含这样一种重组核酸的细胞、组织或器官。所述细胞最好是原核细胞;真核细胞;细菌细胞;酵母细胞;昆虫细胞;哺乳动物细胞;小鼠细胞;灵长类细胞;或人细胞。提供的试剂盒包含这类核酸,和包含所述核酸的区室;还包含灵长类DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10蛋白或多肽的区室;和/或使用或处理该试剂盒中试剂的说明。通常,该试剂盒能够进行定性或定量分析。
其它实施方案包括一种核酸,它在30℃和低于2M盐的洗涤条件下与SEQ ID NO3杂交;在30℃和低于2M盐的洗涤条件下与SEQID NO5杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO25杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO9杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO11杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO15或17杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO31杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO21杂交;在30℃和低于2M盐的洗涤条件下与SEQ ID NO33杂交;在至少大约30个核苷酸的一段序列内,表现出与灵长类DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10的同一性至少为大约85%。
优选的是,这种核酸将具有这类性质,其中洗涤条件为45℃和/或500mM盐;或所述同一性至少为90%和/或所述一段序列至少为55个核苷酸。更优选的是,所述洗涤条件为55℃和/或150mM盐;或所述同一性至少为95%和/或所述一段序列至少为75个核苷酸。
本发明也提供调节细胞或组织培养细胞生理学或发育的方法,该方法包括使所述细胞与哺乳动物DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9或DTLR10的激动剂或拮抗剂接触。
优选实施方案的详述I.一般描述本发明提供哺乳动物、本文的灵长类DNAX Toll样受体分子(DTLR)的氨基酸序列和DNA序列,所述受体分子具有特别限定的结构和生物学特性。这些受体分子在本文中已经分别命名为DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9和DTLR10,它们将人Toll样受体家族的成员数由1增加至10。由例如人的灵长类的cDNA序列文库,获得编码这些分子的各种cDNA。也可能需要其它灵长类或其它哺乳动物的相应物。
例如在Maniatis等(1982)Molecular CloningA LaboratoryManual,Cold Spring Harbor Laboratory,Cold Spring Harbor Press;Sambrook等(1989)Molecular CloningA Laboratory Manual,(第二版),第1-3卷,CHS Press,NY;Ausubel等,Biology,Greene PublishingAssociates,Brooklyn,NY;或Ausubel等(1987和定期增刊)CurrentProtocols in Molecular Biology,Greene/Wiley,New York中描述或引用了可应用的某些标准方法,每个参考文献通过引用结合到本文中。
在SEQ ID NO1和2中显示了人DTLR1编码区段的完整的核苷酸序列和相应的氨基酸序列。也参见Nomura等(1994)DNA Res127-35。在SEQ ID NO3和4中显示了人DTLR2编码区段的完整的核苷酸序列和相应的氨基酸序列。在SEQ ID NO5和6中显示了人DTLR3编码区段的完整的核苷酸序列和相应的氨基酸序列。在SEQ IDNO7和8中显示了人DTLR4编码区段的完整的核苷酸序列和相应的氨基酸序列。在SEQ ID NO25和26中显示了人DTLR4编码区段的替代的核苷酸序列和相应的氨基酸序列。在SEQ ID NO9和10中显示了人DTLR5编码区段的部分核苷酸序列和相应的氨基酸序列。在SEQ ID NO11和12中显示了人DTLR6编码区段的完整的核苷酸序列和相应的氨基酸序列,而在SEQ ID NO13和14中提供了小鼠DTLR6的部分序列。在SEQ ID NO27和29(核苷酸序列)和SEQ IDNO28和30(氨基酸序列)中提供了另一小鼠DTLR6的序列。也提供了人DTLR7编码区段的部分核苷酸序列(SEQ ID NO15和17)和相应的氨基酸序列(SEQ ID NO16和18)。在SEQ ID NO19和20中显示了人DTLR8编码区段的部分核苷酸序列和相应的氨基酸序列。在SEQID NO31和32中显示了一种人DTLR编码区段的更完整的核苷酸序列和相应的氨基酸序列。在SEQ ID NO21和22中显示了人DTLR9编码区段的部分核苷酸序列和相应的氨基酸序列。在SEQ ID NO23和24中显示了人DTLR10编码区段的部分核苷酸序列和相应的氨基酸序列。在SEQ ID NO33和34中显示了人DTLR10编码区段的更完整的核苷酸序列和相应的氨基酸序列。在SEQ ID NO35中显示了小鼠DTLR10编码区段的部分核苷酸序列。表1人DTLR胞内域的比较。DTLR1为SEQ ID NO2;DTLR2为SEQ ID NO4;DTLR3为SEQ ID NO6;DTLR4为SEQ ID NO8;DTLR5为SEQ ID NO10;而DTLR6为SEQID NO12。在所述DTLR中,特别重要和保守的(例如特征性的)残基对应于SEQ ID NO18的残基try10-tyr13;trp26;cys46;trp52;pro54-gly55;ser69;lys71;trp134-pro135;和phe144-trp145。DTLR1QRNLQFHAFISYSGHD---SFWVKNELLPNLEKEG-----MQICLHERNFDTLR9KENLQFHAFISYSEHD---SAWVKSELVPYLEKED-----IQICLHERNFDTLR8------------------------NELIPNLEKEDGS---ILICLYESYFDTLR2SRNICYDAFVSYSERD---AYWVENLMVQELENFNPP---FKLCLHKRDFDTLR6SPDCCYDAFIVYDTKDPAVTEWVLAELVAKLEDPREK--HFNLCLEERDWDTLR7TSQTFYDAYISYDTKDASVTDWVINELRYHLEESRDK--NVLLCLEERDWDTLR10 EDALPYDAFVVFDKTXSAVADWVYNELRGQLEECRGRW-ALRLCLEERDWDTLR4RGENIYDAFVIYSSQD---EDWVRNELVKNLEEGVPP---FQLCLHYRDFDTLR5PDMYKYDAYLCFSSKD---FTWVQNALLKHLDTQYSDQNRFNLCFEERDFDTLR3TEQFEYAAYIIHAYKD---KDWVWEHFSSMEKEDQS----LKFCLEERDF:.. :*::DTLR1VPGKSIVENIITC-IEKSYKSIFVLSPNFVQSEWCH-YELYFAHHNLFHEDTLR9VPGKSIVENIINC-IEKSYKSIFVLSPNFVQSEWCH-YELYFAHHNLFHEDTLR8DPGKSISENIVSF-IEKSYKSIFVLSPNFVQNEWCH-YEFYFAHHNLFHEDTLR2IPGKWIIDNIIDS-IEKSHKTVFVLSENFVKSEWCK-YELDFSHFRLFEEDTLR6LPGQPVLENLSQS-IQLSKKTVFVMTDKYAKTENFK-IAFYLSHQRLMDEDTLR7DPGLAIIDNLMQS-INQSKKTVFVLTKKYAKSWNFK-TAFYLXLQRLMGEDTLR10 LPGKTLFENLWAS-VYGSRKTLFVLAHTDRVSGLLR-AIFLLAQQRLLE-DTLR4IPGVAIAANIIHEGFHKSRKVIVVVSQHFIQSRWCI-FEYEIAQTWQFLSDTLR5VPGENRIANIQDA-IWNSRKIVCLVSRHFLRDGWCL-EAFSYAQGRCLSDDTLR3EAGVFELEAIVNS-IKRSRKIIFVITHHLLKDPLCKRFKVHHAVQQAIEQ.* :. * * : ::: :DTLR1GSNSLILILLEPIPQYSIPSSYHKLKSLMARRTYLEWPKEKSKRGLFWANDTLR9GSNNLILILLEPIPQNSIPNKYHKLKALMTQRTYLQWPKEKSKRGLFWA-DTLR8NSDHIILILLEPIPFYCIPTRYHKLEALLEKKAYLEWPKDRRKCGLFWANDTLR2NNDAAILILLEPIEKKAIPQRFCKLRKIMNTKTYLEWPMDEAQREGFWVNDTLR6KVDVIILIFLEKPFQK---SKFLQLRKRLCGSSVLEWPTNPQAHPYFWQCDTLR7NMDVIIFILLEPVLQH---SPYLRLRQRICKSSILQWPDNPKAERLFWQTDTLR10 --------------------------------------------------DTLR4SRAGIIFIVLQKVEKT-LLRQQVELYRLLSRNTYLEWEDSVLGRHIFWRRDTLR5LNSALIMVVVGSLSQY-QLMKHQSIRGFVQKQQYLRWPEDLQDVGWFLHKDTLR3NLDSIILVFLEEIPDYKLNHALCLRRGMFKSHCILNWPVQKERIGAFRHKDTLR1LRAAINIKLTEQAKK--------------------------DTLR9-----------------------------------------DTLR8LRAAVNVNVLATREMYELQTFTELNEESRGSTISLMRTDCLDTLR2LRAAIKS----------------------------------DTLR6LKNALATDNHVAYSQVFKETV--------------------DTLR7LXNVVLTENDSRYNNMYVDSIKQY-----------------DTLR10 -----------------------------------------DTLR4LRKALLDGKSWNPEGTVGTGCNWQEATSI------------DTLR5LSQQILKKEKEKKKDNNIPLQTVATIS--------------DTLR3LQVALGSKNSVH-----------------------------
本文所用的术语DNAX Toll样受体2(DTLR2)将用来描述一种蛋白,包括蛋白或肽区段,所述蛋白或肽区段具有和享有SEQ ID NO4中所示的氨基酸序列或其大致的片段。DTLR3和SEQ ID NO6、DTLR4和SEQ ID NO26、DTLR5和SEQ ID NO10、DTLR6和SEQ ID NO12、DTLR7和SEQ ID NO16和18、DTLR8和SEQ IDNO32、DTLR9和SEQ ID NO22、以及DTLR10和SEQ ID NO34具有类似的对应关系。
本发明也包括已提供其序列的相应DTLR等位基因的蛋白变异体,例如变异蛋白激动剂或拮抗剂。通常,这类激动剂或拮抗剂会表现出低于大约10%的序列差异,因此常常会具有1-11重取代,例如2重、3重、5重、7重和其它重取代。也包括所述蛋白的等位基因变异体和其它变异体,例如天然的多态变异体。通常,它会高亲和性地结合于其相应的生物学受体,其亲和性例如为至少大约100nM,通常优于大约30nM,优选优于大约10nM,更优选优于大约3nM。在本文中该术语也将用来指所述哺乳动物蛋白相关的天然存在的形式,例如等位基因变异体、多态变异体和代谢变异体。
本发明也包括与SEQ ID NO4中的氨基酸序列具有大致氨基酸序列同一性的蛋白或肽。它将包括具有相对少取代的序列变异体,例如最好少于3-5重取代。将相似的特征应用于SEQ ID NO6、26、10、12、16、18、32、22和34中提供的其它DTLR序列。
大致的多肽“片段”或“区段”是指一段氨基酸残基序列,它至少大约为8个氨基酸,一般至少为10个氨基酸,更一般至少为12个氨基酸,经常至少为14个氨基酸,更经常至少为16个氨基酸,典型至少为18个氨基酸,更典型至少为20个氨基酸,通常至少为22个氨基酸,更通常至少为24个氨基酸,优选至少为26个氨基酸,更优选至少为28个氨基酸,而在特别优选的实施方案中,至少为大约30个或更多的氨基酸。可以在合适长度的数段序列内,将不同蛋白区段的序列与另一蛋白区段的序列比较。
通过使残基匹配最优化,必要时,根据需要引入间隙,确定氨基酸序列的同源性或序列同一性。参见例如Needleham等(1970)J.Mol.Biol.48443-453;Sankoff等,(1983)Time Warps,String Edits,andMacromoleculesThe Theory and Practice of Sequence Comparsion的第1章,Addison-Wesley,Reading,MA;和IntelliGenetics(Mountain View,CA)的软件包;和Wisconsin Genetics Computer Group(GCG)(Madison,WI)的软件包;以上每个参考文献均通过引用结合到本文中。当将保守取代考虑为匹配时,会有变化。保守取代通常包括以下组内的取代甘氨酸、丙氨酸;缬氨酸、异亮氨酸、亮氨酸;天冬氨酸、谷氨酸;天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;赖氨酸、精氨酸;和苯丙氨酸、酪氨酸。同源的氨基酸序列计划包括该细胞因子序列中的天然等位基因变异和种间变异。典型的同源蛋白或肽与SEQ ID NO4、6、26、10、12、16、18、32、22或34的氨基酸序列区段的同源性将从50-100%(如果可以引入间隙)至60-100%(如果包括保守取代)。同源性测量结果将至少为大约70%,一般至少为76%,更一般至少为81%,常常至少为85%,更常常至少为88%,典型至少为90%,更典型至少为92%,通常至少为94%,更通常至少为大约95%,优选至少为大约96%,而更优选至少为大约97%,而在特别优选的实施方案中,至少为98%或更高。同源性的程度将随所比较的区段长度而变化。诸如等位基因变异体的同源蛋白或肽,将与SEQ ID NO4、6、26、10、12、16、18、32、22或34中描述的实施方案共享大多数生物活性。在氨基酸水平或核苷酸水平上,特别感兴趣的比较区域对应于区组1-10中每个区组内的那些区域、或区组内的区域,所述区组对应于图2A中指明的区组。
本文所用的术语“生物活性”用来描述(但不限于)相应配体对炎症反应、先天免疫和/或形态发生发育的作用。例如,这些受体应该同IL-1受体一样,介导磷酸酶或磷酸化酶活性,所述活性容易用标准方法测定。参见例如Hardie等(编辑1995)The Protein Kinase FactBook第I和II卷,Academic Press,San Diego,CA;Hanks等(1991)Meth.Enzymol.20038-62;Hunter等(1992)Cell 70375-388;Lewin(1990)Cell 61743-752;Pines等(1991)Cold Spring Harbor Symp.Ouant.Biol.56449-463;和Parker等(1993)Nature 363736-738。所述受体表现出同可调节酶非常相似的生物活性,该活性通过配体结合而被调节。然而,该酶的转换数比受体复合物更接近酶。此外,诱导这种酶活性所必需的被占据的受体数低于大多数受体系统,与在每个细胞数以千计的数值下触发的大多数受体相反,被占据的受体数可能更接近每个细胞数打。所述受体或其部分作为标记通用底物或特定底物的磷酸标记酶,可能是有用的。
术语例如DTLR的配体、激动剂、拮抗剂和类似物,包括调节对Toll配体样蛋白特征性细胞应答的分子、以及加工配体-受体相互作用的更标准的结构结合竞争特征的分子,例如在所述受体是天然受体或抗体的情况下。细胞应答可能通过不同的Toll配体与细胞受体结合而介导,其中所述细胞受体与I型或II型IL-1受体相关,但形式可能不同。参见例如Belvin和Anderson(1996)Ann.Rev.Cell Dev.Biol.12393-416;Marisato和Anderson(1995)Ann.Rev.Genetics 29371-3991和Hultmark(1994)Nature 367116-117。
此外,配体是这样一种分子,它或者作为所述受体或其类似物结合的天然配体起作用,或者作为所述天然配体的功能类似物的分子而起作用。所述功能类似物可以是具有结构修饰的配体,或可以是完全不相关的分子,该分子具有与所述合适的配体结合决定基相互作用的分子形状。所述配体可以用作激动剂或拮抗剂,参见例如Goodman等(编辑)(1990)Goodman & Gilman’sThe Pharmacological Bases ofTherapeutics,Pergamon Press,New York。
合理的药物设计也可以基于受体或抗体以及其它效应物或配体的分子形状的结构研究。效应物可以是对配体结合应答而介导其它功能的其它蛋白、或正常与该受体相互作用的其它蛋白。确定哪些位点与特定的其它蛋白相互作用的方法是物理结构测定,例如X射线晶体学或2维NMR技术。这些将提供对于哪些氨基酸残基形成分子接触区的指南。关于蛋白结构测定的详细描述,参见例如Blundell和Johnson(1976)Protein Crystallography,Academic Press,New York,该文献通过引用结合到本文中。II.活性Toll样受体蛋白将具有许多不同的生物活性,例如在磷酸代谢中,将磷酸加入特定底物(通常为蛋白)或从特定底物去除磷酸。这类活性通常导致对炎症功能、其它先天的免疫应答或形态学效应的调节。DTLR2、3、4、5、6、7、8、9或10蛋白与其它Toll样受体蛋白同源,但它们每种均具有结构差异。例如,人DTLR2基因的编码序列可能与小鼠DTLR2的核苷酸编码序列具有大约70%的同一性。在氨基酸水平上,也可能有相当的同一性。
所述DTLR的生物活性与将磷酸部分添加至底物或从底物去除相关,通常以特异性方式相关,但有时以非特异性方式相关。可以鉴定底物,或可以用标准方法分析酶活性的条件,例如如以下文献中所述Hardie等(编辑1995)The Protein Kinase FactBook第I和II卷,Academic Press,San Diego,CA;Hanks等(1991)Meth.Enzymol.20038-62;Hunter等(1992)Cell 70375-388;Lewin(1990)Cell 61743-752;Pines等(1991)Cold Spring Harbor Symp.Quant.Biol.56449-463;Parker等(1993)Nuature 363736-738。III.核酸本发明设想了分离的核酸或片段的用途,例如它们编码这些蛋白或密切相关的蛋白、或它们的片段,例如以编码相应的多肽,最好是具有生物活性的多肽。另外,本发明包括分离或重组的DNA,所述DNA编码的这类蛋白或多肽,具有所述相应DTLR(单独的或作为一组)的特征性序列。通常,该核酸能够在合适的条件下,与SEQ ID NO3、5、25、9、11、15、17、31、21或33中所示的核酸序列区段杂交,但最好与SEQ ID NO1的相应区段不杂交。所述生物活性蛋白或多肽可以是全长蛋白或片段,并且通常会具有其氨基酸序列与SEQ ID NO4、6、26、10、12、16、18、32、22或34中所示的氨基酸序列同源的区段。此外,本发明包括分离的或重组的核酸或其片段的用途,所述核酸编码的蛋白具有等同于DTLR2-10蛋白的片段。所述分离的核酸在5’和3’侧翼可以具有相应的调节序列,例如启动子、增强子、聚腺苷酸添加信号和来自所述天然基因的其它调节序列。
“分离的”核酸是大致纯的核酸,例如RNA、DNA或混合聚合物,它与天然伴随天然序列的其它组分分离,所述其它组分诸如核糖体、聚合酶和来自起源物种的侧翼基因组序列。该术语包括已经从其天然存在的环境中取出的核酸序列,包括重组的或克隆的DNA分离物,它们因此可与天然存在的组分区别开来;和化学合成的类似物或由异源系统生物合成的类似物。大致纯的分子包括该分子的分离形式,或者为完全纯的,或者为大致纯的。
分离的核酸一般为分子的均质组合物,但在某些实施方案中,含有异质性,最好具有较少的异质性。通常在该聚合物末端或对于所需的生物功能或活性不重要的部分发现这种异质性。
“重组的”核酸通常根据生产方法或其结构而定义。对于其生产方法,例如用使用重组核酸技术的方法生产的产物,所述重组技术例如涉及在所述核苷酸序列中人的干涉。通常,这种干涉涉及体外操作,尽管在某些情况下,它可以涉及更经典的动物育种技术。或者,它可以是用以下方法制备的核酸产生包含天然相互不相邻的两种片段的融合体的序列,但是指排除天然产物,例如在其天然状态中发现的天然存在的突变体。因此,例如,包括用任何非天然存在的载体转化细胞而制备的产物,也包括包含用任何合成寡核苷酸方法所衍生序列的核酸。通常进行这样一种方法,以用编码同一种或保守的氨基酸的丰余密码子取代一个密码子,同时通常引入或去除一个限制性酶的序列识别位点。或者,进行该方法,以将所需功能的核酸区段连接在一起,以产生包括所需功能组合的单一的遗传实体,例如编码融合蛋白的遗传实体,其中所述功能组合是未在通常可得到的天然形式中发现的组合。限制性酶的识别位点常常是这类人工修饰的靶,但可以通过设计,加入其它位点特异性靶,例如启动子、DNA复制位点、调节序列、控制序列或其它有用的特征。相似的概念将用于重组(例如融合)多肽。这将包括二体重复序列。具体包括合成的核酸,它由于遗传密码的丰余性而编码相同的DTLR2-10的多肽或片段;和来自各种不同的相关分子(例如其它IL-1受体家族成员)的序列的融合体。
在核酸方面,“片段”是一连续的区段,它至少为大约17个核苷酸,一般至少为21个核苷酸,更一般至少为25个核苷酸,通常至少30个核苷酸,更通常至少为35个核苷酸,常常至少为39个核苷酸,更常常至少为45个核苷酸,典型至少为50个核苷酸,更典型至少为55个核苷酸,经常至少为60个核苷酸,更经常至少为66个核苷酸,更优选至少为72个核苷酸,更优选至少为79个核苷酸,在特别优选的实施方案中,将至少为85个或更多个核苷酸。通常,可以在合适长度的数段序列内,将不同遗传序列的片段与另一序列的片段进行比较,特别限定的区段诸如下述的域。
编码DTLR2-10的核酸将特别有用,以鉴定编码蛋白本身或其相关蛋白的基因、mRNA和cDNA种类,以及鉴定编码来自不同个体或相关物种的多态变异体、等位基因变异体或其它遗传变异体。用于这类筛选的优选探针是白介素的那些区域,它们在不同多态变异体之间是保守的,或者它们含有缺乏特异性的核苷酸,并且它们最好是全长的或接近全长的。在其它情况下,多态变异体特异性序列将是更有用的。
本发明还包括重组核酸分子和片段,它们具有与本文提出的分离的DNA相同或高度同源的核酸序列。特别是,所述序列将常常与控制转录、翻译和DNA复制的DNA区段操作性地连接。这些额外的区段通常有助于表达所需的核酸区段。
当相互比较或与SEQ ID NO3、5、25、9、11、15、17、31、21或33中所示的序列比较时,同源的、或高度相同的核酸序列表现出显著的相似性。核酸中的同源性标准是以下两个测量结果之一本领域一般使用的通过序列比较得到的同源性,或基于杂交条件的同源性。以下更详细地描述比较性的杂交条件。
在核酸序列比较方面,大致同一性是指当对比时,或者所述区段或者其互补链,在插入或缺失合适的核苷酸进行最佳对比时,至少大约60%的核苷酸相同,一般至少为66%,经常至少为71%,常常至少为76%,更常常至少为80%,通常至少为84%,更通常至少为大约88%,典型至少为91%,更典型至少为大约93%,优选至少为大约95%,更优选至少为大约96-98%或更多,而在特定实施方案中,高达大约99%或更高的核苷酸相同,所述区段包括例如编码结构域的区段,诸如下述的区段。另一方面,当所述区段在选择性杂交条件下与一条链或其互补链杂交时,存在着大致相似性,一般使用由SEQ ID NO3、5、25、9、11、15、17、31、21或33衍生的序列。通常,当在一段至少大约14个核苷酸的序列中有大约55%同源性时,将发生选择性杂交,同源性更通常至少为大约65%,优选至少为大约75%,而更优选至少为大约90%。参见Kanehisa(1984)Nuc.Acids Res.12203-213,该文献通过引用结合到本文中。所述的同源性比较的长度如上所述,可以为更长的序列,在某些实施方案中为一段至少为大约17个核苷酸的序列,一般至少为大约20个核苷酸,通常至少为大约24个核苷酸,经常至少为大约28个核苷酸,典型至少为大约32个核苷酸,更典型至少为大约40个核苷酸,优选至少为大约50个核苷酸,而更优选至少为大约75-100或更多个核苷酸。
关于杂交方面的同源性,严格条件将是通常在杂交反应中控制的盐、温度、有机溶剂和其它参数的严格性的组合条件。严格性温度条件通常包括超过大约30℃的温度,更通常为超过大约37℃的温度,典型的为超过大约45℃的温度,更典型的为超过大约55℃的温度,优选为超过大约65℃的温度,而更优选为超过大约70℃的温度。严格性的盐条件一般低于大约500mM,通常低于大约400mM,更通常低于大约300mM,典型的低于大约200mM,优选低于大约100mM,而更优选低于大约80mM,甚至降至低于大约20mM。然而,参数的组合比任何单个参数的测量值更为重要。参见例如,Wetmur和Davidson(1968)J.Mol.Biol.31349-370,该文献通过引用结合到本文中。
另一方面,对于序列比较,通常一个序列用作参比序列,将测试序列与其比较。当使用一种序列比较算法时,将测试序列和参比序列输入计算机,必要时指定亚序列坐标,并且指定序列运算规则程序的参数。然后,该序列比较算法根据指定的程序参数,计算测试序列相对于参比序列的序列同一性百分率。
可以用如下进行用于比较的序列的光学序列对比例如用Smith和Waterman(1981)Adv.Appl.Math.2482的局部同源性算法、用Needlman和Wunsch(1970)J.Mol.Biol.48443的同源性序列对比算法、通过Pearson和Lipman(1988)Proc.Nat’l Acad.Sci.USA 852444的相似性方法的检索、通过计算机实现这些算法(Wisconsin Genetics软件包中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575 Science Dr.,Madison,WI)、或通过目测检查(一般参见Ausubel等,见上述)。
有用的算法的一个实例是PILEUP。PILEUP采用渐进的成对序列对比,产生来自一组相关序列的一个多重序列对比,以显示关系和序列同一性的百分率。它也绘出一个树(tree)或枝叉图(dendogram),显示用来产生所述序列对比的成簇关系。PILEUP采用Feng和Doolittle(1987)J.Mol.Evol.35351-360的渐进序列对比法的简化方法。所用的方法类似于Higgins和Sharp(1989)CABIOS 5151-153描述的方法。该程序可以对多达300个序列进行序列对比,每个序列的最大长度为5,000个核苷酸或氨基酸。多重序列对比法以两个最相似的序列的成对序列对比开始,产生一组(a cluster of)两个对比的序列。然后将该组与下一个最相关的序列或下一组对比的序列进行序列对比。通过简单地延伸两个单独序列的成对序列对比,将两组序列进行序列对比。通过一系列渐进的成对序列对比,得到最后的序列对比。通过指定序列比较区的特定序列及其氨基酸或核苷酸坐标,并且指定该程序的参数,运行该程序。例如,可以将参比序列与其它测试序列比较,以采用以下参数测定序列同一性关系的百分率默认间隙加权值(3.00)、默认间隙长度加权值(0.10)和加权的末端间隙。
适用于测定序列同一性和序列相似性百分率的算法的另一实例是BLAST算法,在Altschul等(1990)J.Mol.Biol.215403-410中有描述。公众可从国家生物技术信息中心(httpwww.ncbi.nlm.nih.gov/)得到进行BLAST分析的软件。该算法包括首先通过在查询序列中鉴别长度为W的短字(short words),而鉴别高计分序列对(HSP),当与一数据库序列中相同长度的字进行序列对比时,它们或者匹配或者满足某些阳性值的阈值T。T称为相邻字计分阈值(Altschul等,见上述)。这些起始的相邻字命中(word hit)用作种子,起始搜寻以寻找含所述字命中的较长的HSP。然后,只要可以增加累积的序列对比计分,则所述字命中在两个方向上沿每个序列延伸。在以下情况下,每个方向上所述字命中的延伸停止由于来自其最大得到的数值的数量X,累积的序列对比计分下降;由于一个或多个负计分的残基序列对比的累积,累积计分转到零或零以下;或达到两个序列之一的末端。BLAST算法的参数W、T和X决定该序列对比的灵敏度和速度。BLAST程序使用时,默认字长(W)为11,BLOSUM62计分矩阵(参见Henikoff和Henikoff(1989)Proc.Nat’l Acad.Sci.USA 8910915)序列(B)为50,期望值(E)为10,M=5,并且比较两条链。
除计算序列同一性百分率外,BLAST算法也进行两个序列之间相似性的统计学分析(参见例如Karlin和Altschul(1993)Proc.Nat’lAcad.Sci.USA 905873-5787)。BLAST算法提供的相似性的一种测量是最小和概率(P(N)),这提供偶然发生两个核苷酸序列或氨基酸序列之间匹配概率的指标。例如,如果在测试核酸与参比核酸的比较中,最小和概率低于大约0.1,更优选低于大约0.01,最优选低于大约0.001时,认为该核酸与参比序列相似。
两个多肽的核酸序列大致相同的再一指标是第一种核酸编码的多肽与第二种核酸编码多肽免疫交叉反应,如以下所述。因此,例如在一种多肽与第二种多肽仅由于保守取代而不同时,这两种多肽通常大致相同。两个核酸序列大致相同的另一指标是所述两种分子在严格条件下相互杂交,如下所述。
通过核苷酸置换、核苷酸缺失、核苷酸插入和核苷酸序列倒位,可以容易地修饰分离的DNA。这些修饰产生新的DNA序列,它们编码该蛋白或其衍生物。这些修饰的序列可以用来产生突变的蛋白(突变蛋白),或增强变异体种类的表达。表达增强可以包括基因扩增、转录增加、翻译增加和其它机制。这类突变的DTLR样衍生物,包括该蛋白或其片段的预定突变或定点突变,包括利用遗传密码简并性的沉默突变。本文所用的“突变的DTLR”包括这样的多肽,它在其它情况下属于上述DTLR同源性定义范围内,但其氨基酸序列无论由于缺失、置换,还是由于插入,均不同于自然界中发现的其它DTLR样蛋白的氨基酸序列。特别是,“定点突变DTLR”包括与SEQ ID NO4、6、26、10、12、16、18、32、22或34的蛋白大致同源的蛋白,并通常共享大多数本文公开形式的生物活性或作用。
尽管定点突变位点是预定的,但突变体不必是定点的。通过在该基因中制造氨基酸插入或缺失,可以达到对哺乳动物DTLR诱变,并将其与表达偶联。可以产生置换、缺失、插入或任何组合,以得到最终的构成物。插入包括氨基末端融合或羧基末端融合。可以于靶密码子进行随机诱变,然后可以根据所需活性,筛选表达的哺乳动物DTLR突变体。在序列已知的DNA中于预定位点制造置换突变的方法是本领域众所周知的,例如通过M13引物诱变。也参见Sambrook等(1989)和Ausubel等(1987和定期增刊)。
所述DNA中的突变应该不将编码序列置于读框之外,最好不产生可以杂交而产生诸如环或发夹的mRNA二级结构的互补区。
Beaucage和Carruthers(1981)Tetra.Letts.221859-1862描述的亚磷酰胺法将产生合适的合成DNA片段。常常或者通过合成互补链,并在合适的条件下使所述链一起退火,或通过加入互补链,用DNA聚合酶与合适的引物序列,获得双链片段。
聚合酶链式反应(PCR)技术通常可以用于诱变。另一方面,诱变引物是通常用来于预定位点产生限定的突变的方法。参见例如Innis等(编辑1990)PCR ProtocolsA Guide to Methods and ApplicationsAcademic Press,San Diego,CA;和Dieffenbach和Dveksler(1995;编辑)PCR PrimerA Laboratory Manual Cold Spring Harbor Press,CSH,NY。IV.蛋白质、肽如上所述,本发明包括灵长类DTLR2-10,例如其序列公开于SEQID NO4、6、26、10、12、16、18、32、22或34和上述的灵长类DTLR2-10。也设想了等位基因变异体和其它变异体,包括例如将这类序列与其它序列的部分组合的融合蛋白,所述其它序列包括表位标记和功能域。
本发明也提供重组蛋白,例如采用来自这些啮齿动物蛋白区段的异源融合蛋白。异源融合蛋白是一种蛋白或区段的融合体,所述蛋白或区段在天然状态下通常不以同一方式融合。因此,DTLR与IL-1受体的融合产物是一种连续的蛋白分子,它具有以典型的肽键融合的序列,通常作为单一的翻译产物制备,并表现出例如得自每种源肽的序列或抗原性的特性。相似的概念适用于异源核酸序列。
另外,通过组合来自其它相关蛋白的相似功能域或结构域,可以制备新的构成物,其中所述其它相关蛋白例如为IL-1受体或其它DTLR,包括种变异体。例如,在不同的新融合多肽或片段之间,可以“交换”配体结合区段或其它区段。参见例如Cunningham等(1989)Science 2431330-1336;和O’Dowd等(1988)J.Biol.Chem.26315985-15992,每个文献通过引用结合到本文中。因此,由于受体结合特异性的功能的结合,将产生表现出新的特异性组合的新嵌合多肽。例如,可以加入来自其它相关受体分子的配体结合域,或用其取代该蛋白或相关蛋白的其它域。所产生的蛋白通常会具有杂种功能或特性。例如,融合蛋白可以包含一个引导域,它可以用以将该融合蛋白结合至特定的亚细胞细胞器。
可以从各种序列数据库中选择候选的融合伴侣和序列,所述数据库例如GenBank,c/o IntelliGenetics,Mountain View,CA;和BCG,University of Wisconsin Biotechnology Computing Group,Madison,WI,它们通过引用结合到本文中。
本发明特别提供结合Toll配体和/或影响信号转导的突变蛋白。人DTLR1-10与IL-1家族其它成员的结构对比,显示出保守的特征/残基。参见例如图3A。人DTLR序列与IL-1家族其它成员的序列对比,显示不同的结构和功能共享特征。也参见Bazan等(1996)Nature379591;Lodi等(1994)Science 2631762-1766;Sayle和Milner-White(1995)TIBS 20374-376;和Gronenberg等(1991)Protein Engineering4263-269。
IL-1α和IL-1β配体结合作为第一受体的IL-1受体I型,然后该复合物与IL-1受体III型形成一种高亲和性的受体复合物。这类受体亚基可能与所述新IL-1家族成员共享。
DTLR2-10序列的其它物种相应物中的相似变异(例如在相应的区域中),应该提供与配体或底物的相似相互作用。特别优选用或者小鼠序列或人序列的取代。相反,离开配体结合相互作用区的保守取代将可能保留大多数信号活性。
灵长类DTLR2-10的“衍生物”,包括氨基酸序列的突变体、糖基化变异体、代谢衍生物以及与其它化学部分的共价缀合物或聚集缀合物。通过例如采用本领域熟知的方法,将官能团(functionalities)与所述DTLR氨基酸侧链中或于N末端或C末端发现的基团连接,可以制备共价缀合物。这些衍生物可以包括但不限于羧基末端的脂族酯或酰胺、或含羧基侧链的残基、含羟基残基的O-酰基衍生物、和氨基末端氨基酸或含氨基残基(例如赖氨酸或精氨酸)的N-酰基衍生物。酰基选自烷基部分,包括C3-C18的正烷基,由此形成烷酰基芳酰基种类。
特别是,包括糖基化改变,例如通过在多肽合成和加工期间,或在进一步加工步骤中,修饰该多肽的糖基化模式而制备的糖基化改变。完成这一步的特别优选的方法是将多肽暴露于糖基化酶,例如哺乳动物糖基化酶,所述酶得自正常提供这种加工的细胞。也设想了去糖基化酶。也包括一级氨基酸序列相同的形式,它们具有其它少量修饰,包括磷酸化的氨基酸残基,例如磷酸酪氨酸、磷酸丝氨酸或磷酸苏氨酸。
主要一组衍生物是所述受体或其片段与多肽的其它蛋白的共价缀合物。这些衍生物可以在重组培养物中合成,诸如为N末端融合体或C末端融合体,通过利用本领域已知的试剂,根据它们在通过反应性侧基使蛋白交联的有用性,合成这些衍生物。优选用交联剂衍生的位点是游离氨基、碳水化合物部分和半胱氨酸残基。
也提供所述受体和其它同源或异源蛋白之间的融合多肽。同源多肽可以是不同受体之间的融合体,产生例如表现出多种不同Toll配体的结合特异性的杂种蛋白,或产生可以扩大或减弱底物效应特异性的受体。同样,可以构建表现出所述衍生蛋白特性或活性组合的异源融合体。典型的实例是报道多肽(例如荧光素酶)与受体区段或域(例如配体结合区段)的融合体,使得可以容易地确定所需配体的存在或位置。参见例如Dull等的美国专利第4,859,609号,它通过引用结合到本文中。其它基因融合伴侣包括谷胱甘肽-S-转移酶(GST)、细菌β-半乳糖苷酶、trpE、A蛋白、β-内酰胺酶、α淀粉酶、醇脱氢酶和酵母α交配因子。参见例如Godowski等(1988)Science 241812-816。
Beaucage和Carruthers(1981)Tetra.Letts.221859-1862描述的亚磷酰胺法,将产生合适的合成DNA片段。常常或者通过合成互补链,并在合适的条件下使所述链一起退火,或通过使用DNA聚合酶与合适的引物序列加入互补链,获得双链片段。
这类多肽也可以具有已经进行化学修饰的氨基酸残基,所述化学修饰通过磷酸化、磺化、生物素化、或添加或去除其它部分(特别是分子形状类似于磷酸基团的那些部分)而进行。在某些实施方案中,所述修饰将是有用的标记试剂,或用作纯化的靶,例如亲和配体。
通常通过或者重组核酸方法,或者通过合成肽方法,制备融合蛋白。一般例如在Sambrook等(1989)Molecular CloningA LaboratoryManual(第二版),第1-3卷,Cold Spring Harbor Laboratory,和Ausubel等(编辑1987和定期增刊)Current Protocls in Molecular Biology,Greene/Wiley,New York中描述了核酸操作和表达的技术,所述文献通过引用结合到本文中。例如在Merrifield(1963)J.Amer.Chem.Soc.852149-2156;Merrifield(1986)Science 232341-347;和Atherton等(1989)Solid Phase Peptide SynthesisA Practical Approach,IRL Press,Oxford中描述了多肽合成的技术,每个文献通过引用结合到本文中。也参见Dawson等(1994) Science 266776-779关于制备较大多肽的方法。
本发明也设想了非氨基酸序列变异或糖基化变异的DTLR2-10衍生物的用途。这类衍生物可以包括与化学部分的共价结合或聚集结合。这些衍生物一般分为三类(1)盐,(2)侧链和末端残基共价修饰,和(3)吸附复合体,例如与细胞膜的吸附复合体。这类共价或聚集衍生物可用作免疫原、免疫测定中的试剂,或用于纯化方法中,诸如用于受体或其它结合分子(例如抗体)的亲和纯化。例如,可以采用本领域熟知的方法,通过将Toll配体共价结合至固相支持体(诸如溴化氰活化的Sepharose),将Toll配体固定化,或将其吸附至聚烯烃表面上,并且进行或不进行戊二醛交联,用于DTLR受体、抗体或其它相似分子的测定或纯化。该配体也可以用可检测基团标记,例如用氯胺T法放射碘化、共价结合至稀土螯合物、或缀合至用于诊断测定的另一荧光部分。
本发明的DTLR可以用作免疫原,用于生产对所述DTLR或其各种片段特异性的抗血清或抗体,例如它们能够区别其它IL-1受体家族成员。所述纯化的DTLR可以用来筛选单克隆抗体或抗原结合片段,所述抗体或片段是通过用各种形式的含该蛋白的不纯制剂免疫而制备的。具体地说,术语“抗体”也包括天然抗体的抗原结合片段,例如Fab、Fab2、Fv等等。所述纯化的DTLR也可以用作试剂,来检测对存在水平提高的表达应答而产生的抗体,或检测导致针对该内源受体的抗体产生的免疫失调。另外,DTLR片段也可以用作免疫原,以生产本发明的抗体,如下面紧接描述的。例如,本发明设想了这样的抗体或其片段或各种同源肽,所述抗体对SEQ ID NO4、6、26、10、12、16、18、32、22或34中所示的氨基酸序列具有结合亲和性,或针对其而产生的。特别是,本发明设想了对特定片段具有结合亲和性或针对其产生的抗体,所述特定片段预期或实际上暴露于所述天然DTLR的外部蛋白表面上。
由于可能通过竞争抑制,抑制该配体与所述受体的结合,可以阻断对所述受体配体的生理反应。因此,本发明的体外测定常常会采用抗体或这些抗体的抗原结合区段,或连接至固相基质的片段。这些测定也提供对或者配体结合区突变和修饰、或者其它突变和修饰(例如影响信号功能或酶功能的突变和修饰)的效应的诊断测定。
本发明也设想了竞争性药物筛选测定的用途,例如在针对所述受体或片段的中和抗体与测试化合物竞争配体或其它抗体结合的情况下。以该方式,可以用所述中和抗体或片段检测下述多肽的存在,所述多肽享有结合受体的一个或多个结合位点,并且也可以用来占据受体上的结合位点,其中所述结合位点在其它情况下可能结合配体。V.制备核酸和蛋白可以通过化学合成、筛选DNA文库、或通过筛选由多种细胞系或组织样品制备的基因组文库,获得编码所述蛋白或其片段的DNA。可以采用标准方法和本文提供的序列,分离天然序列。通过杂交技术,或通过各种PCR技术,结合在例如GenBank的序列数据库进行检索,或通过在数据库中检索,可以鉴定其它物种的相应物。
该DNA可以在种类繁多的宿主细胞中表达,用以合成全长受体或片段,所述全长受体或片段可以进而例如用来产生多克隆抗体或单克隆抗体;用于结合研究;用于构建和表达修饰的配体结合域或激酶/磷酸酶域;和用于结构/功能研究。可以在用合适的表达载体转化或转染的宿主细胞中,表达变异体或片段。这些分子可以大致不含蛋白质或细胞污染物,不是得自重组宿主中的那些分子,因此当结合药用可接受的载体和/或稀释剂时,在药用组合物中特别有用。所述蛋白或其部分可以作为与其它蛋白的融合体表达。
表达载体通常是自主复制的DNA或RNA构成物,它们含有所需的受体基因或其片段,通常与在合适宿主细胞中识别的合适的遗传控制元件操作性地连接。这些控制元件能够在合适的宿主中实现表达。实现表达所必需的特定类型的控制元件,将取决于最终使用的宿主细胞。一般而言,所述遗传控制元件可以包括原核启动子系统或真核启动子表达控制系统,通常包括一个转录启动子、一个控制转录启动的可选的操纵子、提高mRNA表达水平的转录增强子、一段编码合适的核糖体结合位点的序列、以及终止转录和翻译的序列。表达载体通常也含有一个复制起点,使得该载体独立于宿主细胞而复制。
本发明的载体包括这样的载体,它们含有编码所述蛋白的DNA或其编码生物活性相当的多肽的片段。所述DNA可以处于病毒启动子的控制之下,并且可以编码一个选择标记。本发明还设想了这类表达载体的用途,当所述载体与所述宿主匹配,并且将编码该受体的真核cDNA插入该载体中,使得含所述载体的宿主的生长表达所述cDNA时,所述表达载体能够在原核或真核宿主中表达编码这种蛋白的真核cDNA。通常,设计表达载体,用于在其宿主细胞中稳定复制,或用于扩增,以大大提高每个细胞所需基因的总拷贝数。不必总是需要表达载体在宿主细胞中复制,例如,可以采用不含有被所述宿主细胞识别的复制起点的载体,实现该蛋白或其片段在各种宿主中瞬时表达。使用通过重组引起该蛋白编码部分或其片段整合入宿主DNA中的载体,这也可能。
本文所用的载体包括质粒、病毒、噬菌体、可整合DNA片段和能够将DNA片段整合入该宿主基因组的其它载体。表达载体是特化的载体,它们含有实现表达操作性连接的基因的遗传控制元件。质粒是最常用的载体形式,但本领域已知的、或成为已知的、起作相当用的所有其它形式的载体均适用于本文。参见例如Pouewls等(1985和增刊)Cloing VectorsA Laboratory Manual,Elsevier,N.Y.和Rodriquez等(编辑)VectorsA Survey of Molecular Cloning Vectors and TheirUses,Buttersworth,Boston,1988,所述文献通过引用结合到本文中。
转化的细胞是已经用采用重组DNA技术构建的受体载体转化或转染的细胞,最好是哺乳动物细胞。转化的宿主细胞通常表达所需的蛋白或其片段,但对于克隆、扩增和操作其DNA的目的,不需要表达题述蛋白。本发明还设想了在营养培养基中培养转化的细胞,由此允许该受体在细胞膜中累积。可以或者从该培养物中,或者在某些情况下从培养基中,回收该蛋白。
对于本发明的目的,当核酸序列在功能上相互相关时,将核酸序列操作性地连接。例如,如果前序列或分泌前导序列的DNA作为蛋白原表达,或参与将多肽导向至细胞膜或参与该多肽的分泌,则将该DNA与所述多肽操作性地连接。如果启动子控制该多肽的分泌,则将该DNA与多肽操作性地连接。假如一种启动子控制该多肽的转录,则将该启动子与编码序列操作性地连接;如果将一个核糖体结合位点定位以允许翻译,则将其与编码序列操作性地连接。通常,操作性连接的是指连续的,并且在读框内,然而,诸如抑制基因的某些遗传元件是不连续连接的,但仍结合于操纵子序列,操纵子序列进而控制表达。
合适的宿主细胞包括原核细胞、低等真核细胞和高等真核细胞。原核细胞包括革兰氏阴性和革兰氏阳性生物,例如大肠杆菌和枯草杆菌(B.subtilis)。低等真核细胞包括酵母,例如酿酒酵母(S.cerevisiae)和毕赤酵母属(Pichia);以及网柄菌属(Dictyostelium)物种。高等真核细胞包括由动物细胞建立的组织培养细胞系,所述动物细胞包括非哺乳动物来源,例如昆虫细胞和鸟类,也包括哺乳动物来源,例如人类、灵长类和啮齿动物。
原核宿主-载体系统包括种类繁多的用于许多不同物种的载体。本文所用的大肠杆菌及其载体在种属上用来包括用于其它原核细胞的相当的载体。用来扩增DNA的代表性载体是pBR322或许多其衍生物。可以用来表达该受体或其片段的载体,包括但不限于诸如这样的载体,它们含有lac启动子(pUC系列);trp启动子(pBR322-trp);Ipp启动子(pIN系列);λ-pP或pR启动子(pOTS);或杂种启动子,诸如ptac(pDR540)。参见Brosius等(1988)“利用λ-、trp-、lac-和Ipp衍生的启动子的表达载体”,载于VectorsA Survey of Molecular CloningVectors and Their Uses,(编辑,Rodriguez和Denhardt),Buttersworth,Boston,第10章,第205-236页,该文献通过引用结合到本文中。
低等真核细胞,例如酵母和网柄菌属,可以用含DTLR序列的载体转化。对于本发明的目的,最常用的低等真核宿主是面包酵母,即酿酒酵母。它将用来在种属上代表低等真核细胞,尽管可利用许多其它菌种和物种。酵母载体通常由一个复制起点(整合型除外)、一个选择基因、一个启动子、编码该受体或其片段的DNA、以及用于翻译终止、聚腺苷酸化和转录终止的序列。合适的酵母表达载体包括组成型启动子,诸如3-磷酸甘油激酶和各种其它糖酵解酶基因的启动子;或诱导型启动子,诸如醇脱氢酶2启动子或金属硫蛋白启动子。合适的载体包括以下类型的衍生物自主复制低拷贝数型(诸如YRp系列)、自主复制高拷贝数型(诸如YEp系列);整合型(诸如YIp系列),或微型染色体(诸如YCp系列)。
高等真核生物组织培养细胞一般是用于表达功能活性的白介素蛋白的优选宿主细胞。原则上,可以使用任何高等真核生物组织培养细胞系,例如昆虫杆状病毒表达系统,不论其来自无脊椎动物源还是来自脊椎动物源。然而,最好是哺乳动物细胞。这种细胞的转化或转染和繁殖已经成为常规技术。有用的细胞系的实例包括海拉细胞、中国仓鼠卵巢(CHO)细胞系、幼鼠肾(BRK)细胞系、昆虫细胞系、鸟细胞系和猴(COS)细胞系。用于这些细胞系的表达载体一般包括一个复制起点、一个启动子、一个翻译起始位点、RNA剪接位点(如果使用基因组DNA)、一个多腺苷酸化位点和一个转录终止位点。这些载体也通常含有一个选择基因或扩增基因。合适的表达载体可以是携带启动子的质粒、病毒或反转录病毒,所述启动子例如得自诸如腺病毒、SV40、细小病毒、痘苗病毒或巨细胞病毒这类来源。合适的表达载体的代表性实例包括pCDNA1;pCD,参见Okayama等(1985)Mol.Cell Biol.51136-1142;pMClneo PolyA,参见Thomas等(1987)Cell 51503-512;和诸如pAC 373或pAC 610的杆状病毒载体。
对于分泌蛋白,一个可读框通常编码一种多肽,它由于其N末端共价连接于信号肽的成熟的或分泌的产物组成。在该成熟的、或有活性的多肽分泌之前,该信号肽被切割。根据经验性的规律(例如von-Heihne(1986)Nucleic Acids Research 144683-4690),可以以高度的精确性预测该切割位点,信号肽精确的氨基酸组成看来对其功能不重要,例如Randall等(1989)Science 2431156-1159;Kaiser等(1987)Science 253312-317。
通常需要在提供特定或限定的糖基化模式的系统中,表达这些多肽。在这种情况下,通常的模式是由该表达系统天然提供的。然而,将通过将该多肽(例如非糖基化形式)暴露于引入异源表达系统中的合适的糖基化蛋白,来修饰该模式。例如,该受体基因可以与一种或多种编码哺乳动物糖基化酶或其它糖基化酶的基因共转化。采用该方法,可在原核细胞或其它细胞中得到某些哺乳动物糖基化模式。
DTLR源可以是表达重组DTLR的真核或原核宿主,诸如以上描述的。该源也可以是诸如小鼠Swiss 3T3成纤维细胞的细胞系,但本发明也设想了其它哺乳动物细胞系,优选的细胞系来自人的种类。
因为所述序列是已知的,所以可以通过合成肽的常规方法,制备灵长类DTLR、其片段或衍生物。这些包括诸如在Stewart和Young(1984)Solid Phase Peptide Synthesis,Pierce Chemical Co.,Rockford,IL;Bodanszky和Bodanszky(1984)The Practice of Peptide Synthesis,Springer-Verlag,New York;和Bodanszky(1984)The Principles ofPeptide Synthesis,Springer-Verlag,New York中所述的方法,所有这些文献均通过引用结合到本文中。例如,可以使用叠氮化物法、盐酸法、酸酐法、混合酐法、活性酯法(例如对硝基苯酯、N-羟基琥珀酰亚胺酯或氰基甲酯)、碳化二咪唑法、氧化还原法、或二环己基碳二亚胺(DCCD)/加成法。固相和液相合成都适用于前述方法。可以使用相似的技术与部分DTLR序列。
按照通常用于肽合成的以上方法,适当地制备所述DTLR蛋白、片段或衍生物,一般或者用所谓的分段法,该方法包括按顺序一个接一个地将氨基酸缩合至末端氨基酸,或者通过将肽片段偶联至末端氨基酸。通常必须保护在偶联反应中不使用的氨基,以防止于不正确的位置进行偶联。
如果采用固相合成,则将C末端氨基酸通过其羧基结合至不溶性载体或支持体。不特别限制所述不溶性载体,只要它对反应性羧基具有结合能力即可。这类不溶性载体的实例包括卤代甲基树脂(诸如氯代甲基树脂或溴代甲基树脂)、羟甲基树脂、酚树脂、叔烷氧羰基酰肼化(hydrazidated)树脂等等。
通过将氨基保护的氨基酸的活化羧基与先前形成的肽或链的反应性氨基缩合,将氨基保护的氨基酸按顺序结合,以逐步合成所述肽。合成所述完整的序列后,将该肽切离所述不溶性载体,以产生该肽。Merrifield等(1963)J.Am.Chem.Soc.852149-2156中一般描述了这种固相方法,该文献通过引用结合到本文中。
通过肽分离,例如通过抽提、沉淀、电泳、各种形式的层析等等,可以从反应混合物中分离和纯化所制备的蛋白或其片段。根据所需的用途,本发明的受体可以以不同程度的纯度获得。利用本文公开的蛋白纯化技术(参见下文),或利用本文在免疫吸附亲和层析方法中描述的抗体,完成纯化。通过首先将所述抗体连接至固相支持体,然后使连接的抗体与合适细胞的溶解的裂解液、表达所述受体的其它细胞的裂解液或通过DNA技术产生该蛋白的细胞上清液接触,进行这种免疫吸附亲和层析,见下述。
一般而言,该纯化蛋白的纯度至少为大约40%,一般至少为大约50%,通常至少为大约60%,典型的至少为大约70%,更典型的至少为大约80%,优选至少为大约90%,更优选至少为大约95%,而在特别优选的实施方案中,为97%-99%或更高。纯度通常基于重量,但也可以基于摩尔。将适当地应用不同的测定。VI.抗体可以针对不同哺乳动物(例如灵长类)的DTLR蛋白及其片段产生抗体,所述DTLR蛋白及其片段包括天然存在的天然形式和其重组形式,不同的是,针对该活性受体的抗体更可能识别仅存在于天然构象中的表位。变性抗原的检测也可以用于例如蛋白质分析。也设想了抗独特型抗体,它可以用作天然受体或抗体的激动剂或拮抗剂。
通过用蛋白预定片段与免疫原性蛋白的缀合物免疫动物,可以产生针对所述片段的抗体,包括结合片段和单链形式。由分泌所需抗体的细胞制备单克隆抗体。可以根据与正常蛋白或缺陷蛋白的结合,或根据激动剂或拮抗剂活性,筛选这些抗体。这些单克隆抗体结合的KD值通常至少为大约1mM,更通常至少为大约300μM,典型的至少为大约100μM,更典型的至少为大约30μM,优选至少为10μM,更优选至少为3μM。
包括抗原结合片段在内的本发明的抗体,可以具有显著的诊断或治疗价值。它们可以是有效的拮抗剂,它们结合于所述受体,并抑制与配体的结合,或抑制所述受体引发生物学反应(例如作用于其底物)的能力。它们也可以用作非中和性抗体,并可以偶联于毒素或放射性核素,以结合生产细胞或定位为白介素源的细胞。此外,这些抗体可以与药物或其它治疗剂缀合,或直接缀合,或者通过接头缀合。
本发明的抗体也可以用于诊断应用。作为捕捉物或非中和性抗体,它们可以结合至所述受体,而不抑制配体或底物的结合。作为中和抗体,它们可以用于竞争性结合测定。它们也可以用来检测配体或对配体定量。它们可以用作蛋白质印迹分析的试剂,或用于相应蛋白的免疫沉淀或免疫纯化。
可以将蛋白片段连接至其它材料,特别是多肽,如待用作免疫原的融合的或共价连接的多肽。哺乳动物DTLR及其片段可以与多种免疫原融合或共价连接,所述免疫原诸如匙孔血蓝蛋白、牛血清白蛋白、破伤风类毒素等。关于制备多克隆抗血清的方法的描述,参见Microbiology,Hoeber Medical Division,Harper和Row,1969;Landsteiner(1962)Specificity of Serological Reactions,DoverPublications,New York;和Williams等(1967)Methods in Immunologyand Immunochemistry,第1卷,Academic Press,New York;每个参考文献均通过引用结合到本文中。典型的方法包括用免抗原超免疫动物。然后在重复免疫后不久,收集该动物的血液,并分离γ球蛋白。
在某些情况下,最好从各种哺乳动物宿主制备单克隆抗体,所述哺乳动物宿主诸如小鼠、啮齿动物、灵长类、人类等等。在例如以下文献中可以发现制备这类单克隆抗体的技术的描述Stites等(编辑)Basic and Clinical Immunology(第4版),Lange Medical Publications,Los Altos,CA和其中引用的参考文献;Harlow和Lane(1988)AntibodiesA Laboratory Manual,CSH Press;Goding(1986)Monoclonal AntibodiesPrinciples and Practice(第2版)Academic Press,New York;以及特别是Kohler和Milstein(1975)Nature 256495-497(它讨论了产生单克隆抗体的一种方法)。这些参考文献中的每个均通过引用结合到本文中。总之,该方法包括给动物注射一种免疫原。然后处死该动物,取出其脾脏细胞,然后将脾细胞与骨髓瘤细胞融合。结果是杂种细胞或“杂交瘤”,它能够在体外繁殖。然后筛选杂交瘤群体,以分离各个克隆,每个克隆分泌针对该免疫原的单种抗体。以该方式,获得的各个抗体种类是来自免疫动物的无限增殖化的和克隆的单种B细胞,是对该免疫原性物质上识别的特定位点应答而产生的B细胞。
其它合适的技术包括,使淋巴细胞体外暴露于该抗原多肽或者暴露于在噬菌体或相似载体中的抗体文库的选择物。参见Huse等(1989)“免疫球蛋白所有组成成分在噬菌体λ中的大组合文库的产生”,Science 2461275-1281;和Ward等(1989)Nature 341544-546,每个参考文献均通过引用结合到本文中。本发明的多肽和抗体可以修饰或不修饰使用,包括嵌合抗体和人源化抗体。通常,通过或者共价或者非共价连接一种提供可检测信号的物质,来标记所述多肽和抗体。种类繁多的标记和缀合技术是已知的,并且在科学文献和专利文献中均广泛地进行了报道。合适的标记包括放射性核素、酶、底物、辅因子、抑制剂、荧光部分、化学发光部分、磁性颗粒等等。指出这类标记用法的专利,包括美国专利第3,817,837;3,850,752;3,939,350;3,996,345;4,277,437;4,275,149;和4,366,241号。此外,可以产生重组或嵌合的免疫球蛋白,参见Cabilly的美国专利第4,816,567号;或在转基因小鼠中制备,参见Mendez等(1997)Nature Genetics 15146-156。这些参考文献均通过引用结合到本文中。
本发明的抗体也可以用于分离所述DTLR的亲和层析。当所述抗体连接至固相支持体(例如颗粒,诸如琼脂糖、Sephadex等)时,可以制备柱子,在可以使细胞裂解液通过该柱的情况下,洗涤该柱,然后提高温和变性剂的浓度,由此释放所纯化的蛋白。该蛋白可以用来纯化抗体。
所述抗体也可以用来筛选特定表达产物的表达文库。通常,用于这种方法中的抗体用一个部分标记,所述部分通过抗体结合,允许容易地检测抗原的存在。
针对DTLR产生的抗体也可以用来产生抗独特型抗体。这些抗体将可用于检测或诊断与该蛋白表达或表达该蛋白的细胞相关的各种免疫疾病。它们也可用作所述配体的激动剂或拮抗剂,它们可以是天然存在的配体的竞争性抑制剂或替代物。
通常在免疫测定中,确定与针对特定免疫原产生的抗体特异性地结合或特异性地免疫反应的DTLR蛋白,所述特定免疫原诸如由SEQID NO4、6、26、10、12、16、18、32、22或34的氨基酸序列组成的免疫原。所述免疫测定通常使用多克隆抗血清,它是针对例如SEQ ID NO4、6、26、10、12、16、18、32、22或34的蛋白产生的。选择对其它IL-1R家族成员(例如DTLR1)具有低交叉反应性的抗血清,所述抗血清最好来自相同的物种,并且在用于该免疫测定之前,通过免疫吸附除去任何这种交叉反应性。
为了产生用于免疫测定的抗血清,按本文所述分离SEQ ID NO4、6、26、10、12、16、18、32、22或34的蛋白或其组合的蛋白。例如,可以在哺乳动物细胞系中产生重组蛋白。通常使用标准佐剂(诸如弗氏佐剂)和标准的小鼠免疫方案(参见Harlow和Lane,见上述),用选定的蛋白免疫合适的宿主,例如小鼠的近交品系,诸如balb/c。或者,由本文公开的序列衍生、且与载体蛋白缀合的合成肽,可以用作免疫原。收集多克隆抗血清,并且在免疫测定中测定针对该免疫原蛋白的效价,例如在固相免疫测定中,用固定至固相支持体的免疫原测定。选择效价为104或更高的多克隆抗血清,并用竞争性结合免疫测定,测试其对其它IL-1R家族成员(例如小鼠DTLR或人DTLR1)的交叉反应性,所述竞争性免疫测定诸如Harlow和Lane(见上述,第570-573页)所述的免疫测定。最好是,在该测定中,结合人DTLR2-10中任一种或其中某些DTLR,使用至少两个DTLR家族成员。这些IL-1R家族成员可以作为重组蛋白产生,并用本文所述的标准分子生物学和蛋白化学技术进行分离。
竞争性结合形式的免疫测定,可以用来测定交叉反应性。例如,可以将SEQ ID NO4、6、26、10、12、16、18、32、22或34的蛋白或其各种片段固定于固相支持体。加入该测定中的蛋白,与所述抗血清竞争与所述固定化抗原的结合。将上述蛋白与所述抗血清竞争与所述固定化抗原结合的能力,与SEQ ID NO4、6、26、10、12、16、18、32、22和/或34的蛋白进行比较。采用标准计算方法,计算上述蛋白的交叉反应性的百分率。选择并合并与每种以上所列蛋白的交叉反应性低于10%的抗血清。然后,通过用以上列出的蛋白进行免疫吸附,从合并的抗血清中,除去交叉反应性抗体。
然后,将免疫吸附的合并的抗血清用于如上所述的竞争性结合免疫测定中,以将第二种蛋白与该免疫原蛋白(例如SEQ ID NO4、6、26、10、12、16、18、32、22和/或34的IL-1R样蛋白)进行比较。为了进行这种比较,每次在很宽的浓度范围内分析所述两种蛋白,并测定抑制该抗血清与该固定化抗原结合的50%所需的每种蛋白的量。如果第二种蛋白的所需量低于选定蛋白或所需蛋白的蛋白量的2倍,则认为第二种蛋白特异性地结合于针对该免疫原产生的抗体。
不用说,这些DTLR蛋白是一个同源蛋白家族的成员,该家族包括迄今鉴定的至少10个基因。关于特定基因的产物,诸如DTLR2-10,该术语不仅是指本文公开的氨基酸序列,而且是指为等位基因变异体、非等位基因变异体或种变异体的其它蛋白。人们也理解,所述术语包括通过以下方法引入的非天然突变,所述方法为采用常规的重组技术(诸如单位点突变)的有意突变,或切下编码相应蛋白的DNA的短片段,或取代新的氨基酸或添加新的氨基酸。这类少量改变必须大体维持原始分子的免疫同一性和/或其生物活性。因此,这些改变包括与指定的天然存在的IL-1R相关蛋白特异性免疫反应的蛋白,所述相关蛋白例如为SEQ ID NO4、6、26、10、12、16、18、32、22或34中所示的DTLR蛋白。可以通过在合适的细胞系中表达所述改变的蛋白,并测量对淋巴细胞的合适作用,可以确定该蛋白的生物学特性。认为修饰较少的具体蛋白修饰,包括化学性质相似的氨基酸的保守取代,如以上关于IL-1R大体上所述的。通过将一种蛋白与DTLR2-10的蛋白进行最佳序列对比,并采用本文所述的常规免疫测定测定免疫同一性,人们可以确定本发明的蛋白组成。VII.试剂盒和定量测定天然存在形式和重组形式的本发明IL-1R样分子在试剂盒和测定方法中均特别有用。例如,这些方法也可以用来根据例如配体对这些蛋白的结合活性进行筛选。最近数年,已经开发了几种自动化测定方法,以便允许每年选数万种化合物。参见例如BIOMEK自动化工作站,Beckman Instruments,Palo Alto,California,和Fodor等(1991)Science251767-773,所述文献通过引用结合到本文中。后一篇文献描述了用固相基质上合成的多种特定聚合物测试结合的方法。大量纯化的活性状态的可溶性DTLR(诸如本发明提供的)的可得性,可以大大促进开发用来筛选配体或激动剂/拮抗剂同源蛋白的合适测定。
可以将纯化的DTLR直接包被于平板上,用于在上述配体筛选技术中。然而,针对这些蛋白的非中和抗体,可以用作捕捉抗体,以将相应受体固定至固相上,例如可用于诊断用途。
本发明也设想了DTLR2-10、其片段、肽和它们的融合产物的用途,即用于检测该蛋白或其配体存在的多种诊断试剂盒和方法中。或者,或另外,可以将针对所述分子的抗体加入所述试剂盒和方法中。通常,该试剂盒将具有一个区室,该区室含有或者特定的DTLR肽或基因区段,或者含有识别一种或另一种肽或基因的试剂。通常,在肽的情况下,识别试剂是一种受体或抗体,或在基因区段的情况下,识别试剂通常是杂交探针。
用于测定例如DTLR4的一种样品浓度的优选试剂盒,通常包含一种标记化合物,例如对DTLR4具有已知结合亲和性的配体或抗体、作为阳性对照的一种DTLR4源(天然存在的或重组的)和一种分离结合的与游离的标记化合物的一种工具,例如用于固定该测试样品中的DTLR4的固相。通常提供含有试剂的区室和说明。
对哺乳动物DTLR或肽片段、或受体片段特异性的抗体,包括抗原结合区段,可用于诊断应用中,以检测水平提高的配体/或其片段的存在。诊断测定可以是均相的(在游离试剂和抗体-抗原复合物之间没有分离步骤)或多相的(有分离步骤)。存在各种商业化测定,诸如放射免疫测定(RIA)、酶联免疫吸附测定(ELISA)、酶免疫测定(EIA)、酶倍增(enzyme-multiplied)免疫测定技术(EMIT)、底物标记荧光免疫测定(SLFIA)等等。例如,通过采用被标记并识别抗DTLR或抗其特定片段的抗体的第二抗体,可以利用未标记的抗体。这些测定也已经在参考文献中进行了广泛地讨论。参见例如Harlow和Lane(1988)AntibodiesA Laboratory Manual,CSH.,和Coligan(编辑)(1991)和定期增刊,Current Protocols In Immnunology Greene/Wiley,New York。
抗独特型抗体可以具有相似的用途,作为DTLR4的激动剂或拮抗剂起作用。这些抗体应该在合适的情况下用作治疗剂。
通常,该试剂盒中提供用于诊断测定的试剂,以优化该测定的灵敏度。对于本发明,根据该测定的性质,提供所述方案和所述标记、或者标记或者未标记的抗体、或标记的配体。这通常结合其它添加剂,诸如缓冲液、稳定剂、用于产生信号所需的物质,诸如酶的底物等等。最好是,该试剂盒也含有正确使用内容物和使用后处理内容物的说明。该试剂盒通常具有用于每种有用试剂的区室,并且将含有正确使用和处理试剂的说明。希望的是,当可以在水性介质中重建具有合适浓度的所述试剂,以进行该测定时,所述试剂作为干的冻干粉提供。
可以不加修饰地使用诊断测定的上述组分,或可以对其以多种方式进行修饰。例如,通过共价或非共价连接直接或间接提供可检测信号的部分,可以实现标记。在这些测定的任何一种中,可以或者直接、或者间接地标记测试化合物、DTLR或其抗体。可能用于直接标记的包括标记基团诸如125I的放射标记、诸如过氧化物酶和碱性磷酸酶的酶(美国专利第3,645,090号)、和能够监测荧光强度变化、波长偏移或荧光偏振的荧光标记(美国专利第3,940,475号)。这两个专利均通过引用结合到本文中。可能用于间接标记的包括将一种组分生物素化,然后与偶联至一个上述标记基团的抗生物素蛋白结合。
也有许多从游离配体中分离结合配体、或者从游离的测试化合物中分离结合化合物的方法。可以在各种基质上固定所述DTLR,然后洗涤。合适的基质包括诸如ELISA板的塑料、滤膜和珠粒。将所述受体固定化至基质上的方法包括但不限于,直接附着到塑料上、使用捕捉抗体、化学偶联和生物素-抗生物素蛋白。该方案中的最后一步包括通过使用几种方法中的任何一个,沉淀抗体/抗原复合物,所述方法包括那些例如使用诸如聚乙二醇的有机溶剂或诸如硫酸铵的盐的方法。其它合适的分离技术,包括但不限于在Rattle等(1984)Clin.Chem.30(9)1457-1461中描述的荧光素抗体可磁化微粒法,和在美国专利第4,659,678号中描述的双抗体磁性微粒分离,所述文献通过引用结合到本文中。
在所述文献中广泛报告了用于将蛋白或片段同各种标记连接的方法,本文并不需要详细讨论。所述技术中的许多技术涉及使用活化羧基,或者通过使用碳二亚胺或者通过使用活性酯形成肽键;涉及通过巯基与诸如氯乙酰的活化卤素或诸如马来酰亚胺的活化烯烃反应,形成硫醚来用于连接等等。在这些应用中也发现使用融合蛋白。
本发明另一诊断方面,包括使用取自DTLR序列的寡核苷酸或多核苷酸序列。可以使用这些序列作为探针,以检测怀疑患有免疫失调的患者中相应DTLR水平。RNA和DNA二者核苷酸序列的制备、所述序列的标记和所述序列的优选大小,已经在所述文献中得到了充分描述和讨论。一般寡核苷酸探针应当具有至少大约14个核苷酸,通常至少大约18个核苷酸,而所述多核苷酸探针最多可以达到几千个碱基。可以使用各种标记,最常用的是放射性核素,特别是32P。然而,也可以使用其它技术,诸如使用生物素修饰的用于引入多核苷酸中的核苷酸。然后,该生物素用作结合抗生物素蛋白或抗体的位点,所述抗生物素蛋白或抗体可以用各种各样的标记物标记,诸如放射性核素、荧光物质(fluorescer)、酶等等。另一方面,可以使用可识别特定双链体的抗体,所述双链体包括DNA双链体、RNA双链体、DNA-RNA杂种双链体或DNA-蛋白双链体。可以进而标记所述抗体,并进行所述测定,其中所述双链体结合于一表面,使得根据在所述表面上双链体的形成,可以检测结合于所述双链体的抗体的存在。使用任何常规技术,诸如核酸杂交、加减筛选、重组探针探测、杂交分子释放翻译(HRT)和杂交分子终止翻译(HART),可以实现对新型反义RNA的探针的应用。这也包括诸如聚合酶链式反应(PCR)的扩增技术。
也考虑了诊断试剂盒,所述试剂盒也定性或定量测试其它标记的存在。诊断或预后可以依靠用作标记的多种指示的组合。因此,试剂盒可以测试标记物的组合。参见例如Viallet等(1989)Progress in GrowthFactor Res.189-97。VIII.治疗用途本发明提供具有重大治疗价值的试剂。所述DTLR(天然存在的或重组的)、其片段、突变蛋白受体和抗体以及鉴定为对所述受体或抗体具有结合亲和性的化合物,应该可用于治疗表现出其配体的受体表达异常的病征。这类异常通常表现为免疫失调。另外,本发明应该在与该配体表达异常或对该配体应答的触发异常相关的各种疾病或病征方面,提供治疗价值。已经提示,所述Toll配体参与形态发育(例如背腹极性的确定)和免疫应答,特别是原始的先天应答。参见例如Sun等(1991)Eur.J.Biochem.196247-254;Hultmark(1994)Nature 367116-117。
可以纯化重组DTLR、突变蛋白、其激动剂或拮抗剂抗体、或抗体,然后将其给予患者。这些试剂可以例如在常规药用可接受的载体或稀释剂以及生理上无害的稳定剂和赋形剂中,与另外的活性组分结合用于治疗用途。可以例如无菌过滤这些组合物,并通过在剂量瓶中冻干将其以剂量形式放置,或以稳定化的水性制剂贮藏。本发明也考虑了使用非补体结合的抗体或其结合片段。
可以进行采用DTLR或其片段的配体筛选,以鉴别与所述受体具有结合亲和性的分子。然后,可以利用后续的生物测定,确定推定的配体是否可以提供可阻断内在刺激活性的竞争性结合。受体片段可以用作阻断剂或拮抗剂,因为它阻断配体的活性。同样,具有内在刺激活性的化合物可以激活所述受体,并因此是一种激动剂,因为它刺激配体的活性,例如诱导信号。本发明还考虑了抗DTLR抗体作为拮抗剂的治疗用途。
用于有效治疗所必需的试剂量取决于许多不同因素,包括给药方法、靶位点、患者的生理状态和给予的其它药物。因此应当确定治疗剂量,以最优化安全性和有效性。一般在体外使用的剂量可以为这些试剂的原位给药用量提供有用的指南。用于治疗特定疾病的有效剂量的动物测试,将对人的剂量提供进一步的预测指示。例如在Gilman等(编辑)(1990)Goodman and Gilman’sThe Pharmacological Bases ofTherapeutics(第8版)Pergamon Press;和Remington’s PharmaceuticalSciences(最新版)Mack Publishing Co.,Easton,Penn.中描述了各种考虑,所述每个文献通过引用结合到本文中。在其中和下文讨论了给药方法,例如经口、静脉内、腹膜内、或肌内给药、经皮扩散和其它方法。药用可接受的载体包括水、盐、缓冲液和例如在Merck Index(Merck& Co.,Rahway,New Jersey)中所述的其它化合物。因为推定的配体与其受体之间可能高亲和性结合或转换数高,所以最初预期低剂量的这些试剂是有效的。并且信号途径提示,极低量的配体可能具有效应。因此,一般预期具有合适载体的剂量范围低于1mM的浓度,通常低于大约10μM的浓度,一般低于大约100nM,优选低于大约10pM(皮摩尔浓度),最优选低于大约1fM(费摩尔浓度)。对于连续给药,经常使用缓释配方或缓释设备。
可以直接向待治疗的宿主给予DTLR、其片段以及抗体或其片段、拮抗剂和激动剂,或者根据所述化合物的大小,可能最好在给药前将所述化合物同载体蛋白缀合,所述载体蛋白诸如卵清蛋白或血清白蛋白。可以以任何常规给药制剂给予治疗制剂。尽管可能独自给予所述活性成分,但最好是作为药用制剂将其提呈。制剂包含至少一种如上文定义的活性成分,连同一种或多种可接受的载体。每种载体在与其它成分相容、且不伤害患者的意义上,必须既是药用可接受的,也是生理上可接受的。制剂包括那些适于经口、直肠、鼻或肠胃外(包括皮下、肌内、静脉在内和皮内)给药的制剂。所述制剂通常可以以单位剂量形式存在,并可以通过药剂学领域熟知的任何方法制备。参见例如Gilman等(编辑)(1990)Goodman and GilmansThePharmacological Bases of Therapeutics第8版Pergamon Press;和Remington s Pharmaceutical Sciences(最新版)Mack Publishing Co.,Easton,Penn.;Avis等(编辑,1993)Pharmaceutical Dosage FormsParenteral Medications Dekker,NY;Lieberman等(编辑,1990)Pharmaceutical Dosage FormsTablets Dekker,NY;和Lieberman等(编辑,1990)Pharmaceutical Dosage FormsDisperse Systems Dekker,NY。本发明的疗法可以和其它治疗剂组合,或与其它治疗剂结合使用,所述治疗剂特别是其它IL-1家族成员的激动剂或拮抗剂。IX.配体本文对所述Toll受体的描述,提供了鉴定配体的方法,如上所述。这种配体应该以适当的高亲和性,特异性地结合于相应的受体。可得到各种构成物,它们允许对所述受体进行任何一种标记,以检测其配体。例如,直接标记DTLR,将其融合至用于第二标记的标记物(例如FLAG或其它表位标记等),将允许检测受体。这在组织学上可以作为生化纯化的亲和方法、或在表达克隆方法中的标记或选择。也可以应用双杂种选择系统,制备具有可利用的DTLR序列的合适构成物。参见例如Fields和Song(1989)Nature 340245-246。
一般而言,对DTLR的描述类似地适用于针对DTLR2、DTLR3、DTLR4、DTLR5、DTLR6、DTLR7、DTLR8、DTLR9和/或DTLR10试剂和组合物的各个具体实施方案。
参考以下实施例,可最好地理解本发明的广泛范围,所述实施例不会将本发明限于所述具体的实施方案。
实施例I.一般方法例如在以下文献中描述和引用了某些标准方法Maniatis等(1982)分子克隆,实验室指南,Cold Spring Harbor Laboratory,Cold SpringHarbor Press,NY;Sambrook等(1989)分子克隆实验室指南(第2版)第1-3卷,CSH Press,NY;Ausubel等,Biology,Greene PublishingAssociates,Brooklin,NY;或Ausubel等(1987和增补本)CurrentProtocols in Molecular Biology,Wiley/Greene,NY。用于蛋白纯化的方法,包括诸如硫酸铵沉淀、柱层析、电泳、离心、结晶的方法和其它方法。参见例如Ausubel等(1987和定期增补本);Coligan等(编辑,1996)和定期增补本,Current Protocols In Protein Science,Wiley/Greene,NY;Deutscher(1990)Methods in Enzymology第182卷和在这个系列中的其它卷中的“蛋白质纯化指南”;和生产商关于蛋白纯化产品用法的文献,例如Pharmacia,Piscataway,NJ或Bio-Rad,Richmond,CA。与重组技术结合,允许同合适的区段融合,例如同FLAG序列或可以通过蛋白酶可去除序列融合的相当序列融合。参见例如Hochuli(1989)Chemische Industrie 1269-70;Hochuli(1990)“用金属螯合物吸收剂纯化重组蛋白”,载于Setlow(编辑)Genetic Engineering,Principle andMethods 1287-98,Plenum Press,NY;和Crowe等(1992)OIAexpressThe High Level Expression & Protein Purification System QUIAGEN,Inc.,Chatsworth,CA。
例如在Hertzenberg等(编辑,1996)Weir’s Handbook ofExperimental Immunology第1-4卷,Blackwell Science;Coligan(1991)Current Protocols in Immunology Wiley/Greene,NY;和Methods inEnzymology第70、73、74、84、92、93、108、116、121、132、150、162和163卷中描述了标准免疫学技术和测定。
对血管生物活性的测定是本领域熟知的。它们将包括在肿瘤或其它组织中的血管生成活性和血管抑制活性,例如动脉平滑肌增生(参见例如Koyoma等(1996)Cell 871069-1078)、单核细胞附着于血管上皮(参见McEvoy等(1997)J.Exp.Med.1852069-2077)等。也参见Ross(1993)Nature 362801-809;Rekhter和Gordon(1995)Am.J.Pathol.147668-677;Thyberg等(1990)Atherosclerosis 10966-990;和Gumbiner(1996)Cell 84345-357。
例如在Wouterlood(1995年编辑)Neutoscience Protocols第10单元,Elsevier;Methods in Neurosciences Academic Press;和Neuromethods Humana Press,Totowa,NJ中描述了对神经细胞生物活性的测定。例如在Meisami(编辑)Handbook of Human Growth andDevelopmental Biology CRC Press;和Chrispeels(编辑)MolecularTechniques and Approaches in Developmental Biology Interscience中描述了发育系统方法学。
例如采用可得到的软件程序,包括GCG(U.Wisconsin)和GenBank来源的那些程序,进行计算机序列分析。也使用例如来自GenBank、NCBI、EMBO和其它数据库的公开的序列数据库。
对于所有目的,适用于IL-10受体的许多技术可以用于DTLR,如例如在USSN 08/110,683(IL-10受体)中所述,该文献通过引用结合到本文中。II.人受体的新家族缩写DTLR,Toll样受体;IL-1R,白介素-1受体;TH,Toll同源性;LRR,富含亮氨酸的重复序列;EST,表达的序列标记;STS,序列标志位点;FISH,原位杂交中的荧光。
在果蝇属Toll和人白介素-1的胞质域之间发现序列同源性,已经传播了这两种分子触发依赖于Rel型转录因子核转位的相关信号途径的信念。在昆虫和脊椎动物中,这种保守的信号模式支配进化上古老的免疫应答。我们报道了一类新的推定的人受体的分子克隆,所述人受体在胞内和胞外区段中具有与果蝇属Toll非常相似的蛋白结构。命名为DTLR 1-5的5种人Toll样受体可能是蝇分子的直接同系物,同样可能组成人先天免疫的重要的和未识别的一种组分;有趣的是,在脊椎动物中DTLR在进化上保留,可能表明在果蝇属胚胎背腹化中类似于Toll的另一种作用,即作为早期形态发生图式发育的调节物。多种组织的mRNA印迹,显示人DTLR显著不同的表达模式。采用原位杂交中的荧光和序列标志位点数据库分析,我们也显示了位于第4(DTLR 1、2和3)、9(DTLR4)和1(DTLR5)染色体上的同系DTLR基因。对来自以下的序列对比的Toll同源(TH)域的结构预测,识别出一个具有酸性活性位点的平行β/α折叠不同的昆虫和人的DTLR、脊椎动物IL-1受体和MyD88因子以及植物抗病性蛋白;在细菌中广泛参与转导感觉信息的一类应答调节物中,明显重现相似的结构。
如此显著地区分蝇与人的形态发生鸿沟的种子植于熟悉的胚胎形状和模式之中,但产生非常不同的细胞复杂度。DeRobertis和Sasai(1996)Nature 38037-40;和Arendt和Nülbler-Jung(1997)Mech.Develop.617-21。显著相似的信号途径设计了昆虫和脊椎动物之间的这种发育计划的趋异,强调了来自不同基因所有组分成分的蛋白网络和生化机制更大的保守性。Miklos和Rubin(1996)Cell 86521-529;和Chothia(1994)Develop.1994增刊,27-33。绘出这些调节途径进化设计的一个有功效的方法,是通过蛋白序列和结构的种间比较推断出它们可能的分子组分(和生物学功能)。Miklos和Rubin(1996)Cell86521-529;Chothia(1994)Develop.1994增刊,27-33(3-5);和Banfi等(1996)Nature Genet.13167-174。
胚胎发育中的一个关键的通用步骤是体轴(body axes)的特化,所述特化或者来自先天的不对称,或者由外部信号触发。DeRobertis和Sasai(1996)Nature 38037-40;和Arendt和Nülbler-Jung(1997)Mech.Develop.617-21。作为一个模型系统,已经将特殊的关注集中于系统发育基础和背腹极化的细胞机制。DeRobertis和Sasai(1996)Nature38037-40;和Arendt和Nülbler-Jung(1997)Mech.Develop.617-21。由果蝇属胚胎形成了这种转化的一个原型分子策略,其中少数基因的顺序作用,产生转录因子Dorsal的腹例梯度。St.Johnston和NüssleinVolhard(1992)Cell 68201-209;和Morisato和Anderson(1995)Ann.Rev.Genet.29371-399。
该信号途径以跨膜受体Toll为中心,Toll将母体分泌的腹侧因子Sptzle转导结合到辅助分子Tube的胞质接合(cytoplasmic engagement)中并转导Ser/Thr激酶Pelle的激活,Pelle催化Dorsal与抑制剂Cactus的解离,并允许Dorsal转移至腹侧核(Morisato和Anderson(1995)Ann.Rev.Genet.29371-399;和Belvin和Anderson(1996)Ann.Rev.CellDevelop.Biol.12393-416。所述Toll途径也控制成体蝇中有效抗微生物因子的诱导(Lemaitre等(1996)Cell 86973-983);在果蝇属免疫防御中的该作用加强了与IL-1途径平行的机械途径,它们在脊椎动物中支配免疫应答和炎症反应。Belvin和Anderson(1996)Ann.Rev.CellDevelop.Biol.12393-416;和Wasserman(1993)Molec.Biol.Cell4767-771。IL-1受体中的Toll相关胞质域,指导Pelle样激酶IRAK的结合和反映出含有Dorsal和Cactus的潜伏NF/κB/I-κB复合物的激活。Belvin和Anderson(1996)Ann.Rev.Cell Develop.Biol.12393-416;和Wasserman(1993)Molec.Biol.Cell 4767-771。
我们描述了人类4种新Toll样分子的克隆和分子鉴定,所述4种分子命名为DTLR 2-5(根据Chiang和Beachy(1994)Mech.Develop.47225-239),这揭示了一个与果蝇属Toll同系物的关系比与脊椎动物IL-1受体的关系更密切的受体家族。所述DTLR序列得自人EST;这些部分cDNA用来绘出人组织中5种DTLR的完整的表达分布型,对同源基因的染色体位置进行作图,并缩减用于全长cDNA挽回的cDNA文库的选择。我们被其它努力(Banfi等(1996)Nature Genet.13167-174;和Wang等(1996)J.Biol.Chem.2714468-4476)所激励,我们根据结构的保守和分子简约性,装配了一个人类的生物学系统,它是果蝇属中令人注目的调节方案的对应方案。此外,提出的由DTLR、广泛的IL-1受体家族、哺乳动物MyD88因子和植物抗病性蛋白共享的一个核心组件-Toll同源(TH)域的三级折叠,提示驱动Toll信号的生物化学机制。Mitcham等(1996)J.Biol.Chem.271-5777-5783;和Hardiman等(1996)Oncogene 132467-2475。我们提出在昆虫、植物和动物中将形态发生和原始免疫偶联的信号途径(Belvin和Anderson(1996)Ann.Rev.Cell Develop.Biol. 12393-416;和Wilson等(1997)Curr.Biol.7175-178)可能来源于细菌的双组分途径。计算机分析。
采用BLAST服务器(Altschul等(1994)Nature Genet.6119-129),从国家生物技术信息中心(NCBI)的EST数据库(dbEST),鉴定出与昆虫DTLR相关的人类序列。使用更敏感的基于模式和分布型的方法(Bork和Gibson(1996)Meth.Enzymol.266162-184),分离出所述DTLR家族中与非丰余数据库中存在的脊椎动物和植物蛋白共享的信号域。用ClustalW(Thompson,等(1994)Nucleic Acids Res.224673-4680),进行DTLR胞内域和胞外域序列的渐进序列对比;该程序也通过相邻连接法(5000自引导程序的复制提供树归组的可信度值),计算序列对比的序列的分支顺序。
用Consensus程序(internet URL http//www.bork.embl-heidelberg.de/Alignment/consensus.html),绘出在几个严格性程度上分辨的保守的序列对比模式。用灵活地匹配趋异LRR的N末端和C末端特征的一个化合物基序(PRINTS密码Leurichrpt),蛋白指纹的RPINTS文库(http//www.biochem.ucl.ac.uk/bsm/dbbrowser/PRINTS/PRINTS.html)(Attwood等(1997)Nucleic Acids Res.25212-217)可靠地鉴别出DTLR胞外区段中存在的无数富含亮氨酸的重复序列(LRR)。三态精度(three-state accuracy)高于72%的两种预测算法,用来得出胞内域序列对比的共有二级结构,作为折叠识别努力的桥梁(Fischer等(1996)FASEB J.10126-136)。神经网络程序PHD(Rost和Sander(1994)Proteins 1955-72)和统计学预测方法DSC(King和Sternberg(1996)Protein Sci.52298-2310)有internet服务器(分别为URLshttp//www.embl-heidelberg.de/predictprotein/phd_pred.html和http//bonsai.lif.icnet.uk/bmm/dsc/dsc_read_align.html)。胞内区编码例如在Hardiman等(1996)Oncogene 132467-2475;和Rock等(1998)ProcNat’l Acad.Sci.USA 95588-593(每个文献通过引用结合到本文中)中讨论的THD区。该域在受体的信号机制中非常重要,它将磷酸基团转移至底物。全长人DTLR cDNA的克隆用得自Toll样Humrsc786序列(GenBank登记密码D13637)(Normura等(1994)DNA Res 127-35)的PCR引物作为探针,探测人红白血病TF-1细胞系衍生的cDNA文库(Kitamura等(1989)Blood73375-380),产生DTLR1 cDNA序列。通过Research Genetics(Huntsville,AL),从dbEST和由I.M.A.G.E.聚生体获得的相关的EST克隆(Lennon等(1996)Genomics 33151-152)中,标记其余的DTLR序列CloneID#80633和117262(DTLR2)、144675(DTLR3)、202057(DTLR4)和227229(DTLR5)。通过DNA杂交分别筛选λgt10噬菌体、成人肺脏、胎盘和胎肝5’-Stretch Plus cDNA文库(Clontech),克隆了人DTLR 2-4的全长cDNA;所述DTLR5序列得自人多发性硬化斑的EST。对所有阳性克隆进行测序和序列对比,以鉴定各个DTLR ORFDTLR1(2366bp的克隆,786aa ORF)、DTLR2(2600bp,784aa)、DTLR3(3029bp,904aa)、DTLR4(3811bp,879aa)和DTLR5(1275bp,370aa)。分别用人胎盘(Stratagene)和成人肝(Clontech)的cDNA文库作为模板,通过PCR产生用于DTLR3和DTLR4杂交的探针;引物对得自相应的ESR序列。用栖热水生菌(T.aquaticus)的Taqplus DNA聚合酶(Stratagene),在以下条件下进行PCR反应1×(94℃,2分钟)、30×(55℃,20秒;72℃30秒;94℃20秒)、1×(72℃,8分钟)。对于DTLR2全长cDNA的筛选,通过EcoRI/XbaI消化第一个EST克隆(ID#80633)产生的900bp片段用作探针。mRNA印迹和染色体定位每泳道含有大约2μg poly(A)+RNA的人多种组织印迹(Cat#1、2)和癌细胞系印迹(Cat#7757-1),购自Clontech(Palo Alto,CA)。对于DTLR 1-4,将分离的全长cDNA用作探针;对于DTLR5,使用EST克隆(ID#277229)质粒插入片段。简而言之,采用Amersham Rediprime随机标记试剂盒(RPN1633),用[α-32P]dATP放射标记所述探针。于65℃,在0.5M Na2HPO4、7%SDS、0.5M EDTA(pH8.0)中进行预杂交和杂交。于65℃下进行所有严格性洗涤,最初2次洗涤在2×SSC、0.1%SDS中进行40分钟,然后在0.1×SSC、0.1%SDS中洗涤20分钟。然后,在增感屏存在下,于-70℃将膜对X光片(Kodak)曝光。用选定的人DTLR克隆通过cDNA文库Southern(14)进行的更详细的研究,以检查它们在造血细胞亚群中的表达。
采用Heng和Tsui(1994)Meth.Molec.Biol.33109-122中描述的原位杂交中的荧光(FISH)方法,用各种全长(DTLR 2-4)或部分(DTLR5)cDNA克隆作为探针,进行人染色体作图。这些分析作为一种服务,由SeeDNA Biotech Inc.(Ontario,加拿大)进行。通过internet服务器(htpp//www.hgmp.mrc.ac.uk/DHMHD/hum_chromel.html),在畸形人-小鼠同源性数据库中,进行人综合征(或同线基因座中的小鼠缺陷)的检索。昆虫和人DTLR胞外域的保守结构。
果蝇属中的Toll家族至少包括4种不同的基因产物参与蝇胚胎背腹图式发育的原型受体Toll(Morisato和Anderson(1995)Ann.Rev.Genet.29371-399)以及第二种称为“18 Wheeler”(18w)的产物,后者也可能参与早期的胚胎发育(Chiang和Beachy(1994)Mech.Develop.47225-239;和Eldon等(1994)Develop.120885-899);两种另外的受体根据雄性特异性转录物(Mst)基因座(GenBank密码X67703)下游的不完整的Toll样ORF来预测,或由“序列标志位点”(STS)Dm2245(GenBank密码G01378)编码(Mitscham等(1996)J.Biol.Cehm.2715777-5783)。Toll和18w的胞外区段与众不同地由不完全的约24个氨基酸的LRR基元组成(Chiang和Beachy(1994)Mech.Develop.47225-239;和Eldon等(1994)Develop.120885-899)。相似的LRR串联排列通常形成不同细胞表面分子的粘附天线,推定它们的属三级结构,以模拟一种核糖核酸酶抑制剂折叠的马蹄形支架,其中17种LRR显示出重复的β/α发夹,这是一种28个残基的基元(Buchanan和Gay(1996)Prog.Biophys.Molec.Biol.651-44)。Toll对Sptzle的特异性地识别可能遵循一种模型,该模型是用弯曲β-片的凹面,为蛇受体的多LRR胞外域对胱氨酸结折叠糖蛋白激素的结合而提出的(Kajava等(1995)Structure 3867-877);有趣的是,在Sptzle和果蝇属孤独配体Trunk中的半胱氨酸模式,预测了一个相似的胱氨酸结三级结构(Belvin和Anderson(1996)Ann.Rev.Cell & Devel.Biol.12393-416;和Casanova等(1995)Genes Develop.92539-2544)。
根据序列和模式分析,Toll和18w分别为22个和31个LRR的胞外域(Mst ORF片段呈现出16个LRR)与DTLR 1-4(目前不完整的DTLR5链包括4个膜近接的(membrane-proximal)LRR)相当的18个、19个、24个和22个LRR排列最密切相关(Altschul等(1994)NatureGenet.6119-129;和Bork和Gibson(1996)Meth.Enzymol.266162-184)(图1)。然而,人DTLR链中显著的差异是通常丧失约90个残基的半胱氨酸富含区,该区可变地包含于Toll、18w和Mst ORF中(分别距膜边界4个、6个和2个LRR)。这些半胱氨酸簇是等分的,具有明显的“顶部”(结束一个LRR)和“底部”(堆叠在一个LRR顶部)两半(Chiang和Beachy(1994)Mech.Develop.47225-239;Eldon等(1994)Develop.120885-899;以及Buchanan和Gay(1996)Prog.Biophys.Molec.Biol.651-44);在果蝇属和人DTLR中均作为保守的近膜间隔区重现所述“顶部”组件(图1)。我们提出,当“顶部”与“底部”接合时,果蝇属受体(和其它LRR蛋白)中的可变定位的半胱氨酸簇,形成一个完整的组件,它具有匹配末端,可以插入任何LRR对之间,而不改变DTLR胞外域的整体折叠;类似的“挤出”域装饰其它蛋白的结构(Russell(1994)Protein Engin.71407-1410)。TH信号域的分子设计Toll和IL-1 I型(IL-1R1)受体的序列比较,已经揭示了一个约略相似的约200个氨基酸的胞质域,推测它由相似的Rel型转录因子来介导信号(Belvin和Anderson(1996)Ann.Rev.Cell Develop.Biol.12393-416;和Wasserman(1993)Molec.Biol.Cell 4767-771)。新近加入该功能性范例的包括来自烟草和亚麻的一对植物抗病性蛋白,它们的特征为一个N末端TH组件,后接核苷酸结合(NTP酶)区段和LRR区段(Wilson等(1997)Curr.Biol.7175-178);相反,一个“死域”在MyD88的TH链之前,MyD88是一种胞内骨髓分化标记(Mitcham等(1997)J.Biol.Chem.2715777-5783;和Hardiman等(1996)Oncogene132467-2475)(图1)。新的IL-1型受体包括一种辅助信号分子IL-1R3、和孤独受体IL-1R4(也称为ST2/Fit-1/T1)、IL-1R5(IL-1R相关蛋白)和IL-1R6(IL-1R相关蛋白-2)(Mitcham等(1996)J.Biol.Chem.2715777-5783;Hardiman等(1996)Oncogene 132467-2475)。用所述新的人DTLR序列,通过分析共同TH域的构象,我们已经找到该进化线索的一个结构定义包含128个氨基酸的10个区组的保守序列,形成最小的TH域折叠;序列对比中的间隙,标记了序列和长度可变的环的可能位置(图2a)。
利用多个序列对比序列中保守和变异模式的两个预测算法PHD(Rost和Sander(1994)Proteins 1955-72)和DSC(King和Sternberg(1996) Protein Sci.52298-2310),产生TH信号组件的强的一致的结果(图2a)。每个区组含有一个独立的二级结构元件交替的β-链(标记为A-E)和α-螺旋(编号为1-5)的特征,是在平行β-片两面上具有α-螺旋的β/α类折叠的诊断性特征。预测疏水性β-链A、C和D形成β-片中的“内部”板条,而较短的两性β-链B和E装配典型的“边缘”单位(图2a)。这种布置与核心β-片中B-A-C-D-E的链顺序一致(图2b);折叠比较(“映射(mapping)”)和识别(“threading”)程序(Fischer等91996)FASEB J.10126-136)强烈地返回该双缠绕β/α拓扑学。TH域的这种轮廓结构的一个惊人的功能预测是将多重序列对比中的许多保守的带电荷的残基作图至该β-片的C末端βA末端的残基Asp16(区组编码方案-图2a)、βB之后的Arg39和Asp40、α3的第一个转角中的Glu75以及βD-α4环中或βE之后更松散保守的Glu/Asp残基(图2a)。其它4个保守残基(Asp7、Glu28和Arg57-Arg/Lys58对)的位置与该β-片相对的N末端的盐桥网络相匹配(图2a)。
信号功能依赖于TH域的结构完整性。对于IL-1R1和Toll,已经将所述组件边界内的失活突变或缺失(图2a)按目录分类。Heguy等(1992)J.Biol.Chem.2672605-2609;Croston等(1995)J.Biol.Chem.27016514-16517;Schneider等(1991)Genes Develop.5797-807;Norris和Manley(1992)Genes Develop.61654-1667;Norris和Manley(1995)Genes Develop.9358-369;和Norris和Manley(1996)Genes Develop.10862-872。延伸越过所述最小TH域(分别长8、0、6、22和18个残基)的人DTLR1-5链,与Mst ORF的短粗的4aa“尾”最为相似。Toll和18w表现出不相关的102个和207个残基的尾(图2a),它可以负调节所述融合TH域的信号。Norris和Manley(1995)Genes Develop.9358-369;和Norris和Manley(1996)Genes Develop.10862-872。
携带该TH域的不同蛋白之间的进化关系,可能最好通过得自多重序列对比的系统发育树来鉴别(图3)。4个主要的分支分开了所述植物蛋白、MvD88因子、IL-1受体和Toll样分子;最后一个分支聚集于果蝇属和人的DTLR。人DTLR基因的染色体散布。
为了研究该新生的人DTLR基因家族的遗传连锁,我们用FISH对5个基因中的4个的染色体位点进行了作图(图4)。人类基因组计划先前已经绘制了DTLR1基因Humrc786 cDNA存在一个STS数据库基因座(dbSTS登记号G06709,对应于STS WI-7804或SHGC-12827)(Nomura等,(1994)DNA Res 127-35),并且将该基因固定至第4染色体标记间隔D4S1587-D42405(50-56cM)circa 4p14。最近已经通过FISH分析证实这种排列。Taguchi等(1996)Genomics 32486-488。在本发明工作中,我们可靠地将其余的DTLR基因排列于染色体4q32(DTLR2)、4q35(DTLR3)、9q32-33(DTLR4)和1q33.3(DTLR5)上的基因座。在该工作期间,已经产生了亲代DTLR2 EST(CloneID#80633)的STS(STS SHGC-33147的dbSTS登记号为T57791),并且根据我们的发现,将其作图至第4染色体4q32的标记间隔D4S424-D4S1548(143-153cM)。在第4染色体长臂上的DTLR2和DTLR3基因之间有一个约50cM的间隙。差异表达DTLR基因。
在果蝇属中,Toll和18w均具有复杂的空间和时间表达模式,这可能指出胚胎模式以外的功能。St.Johnston和Nüsslein-Volhard(1992)Cell 68201-219;Morisato和Anderson(1995)Ann.Rev.Genet.29371-399;Belvin和Anderson(1996)Ann.Rev.Cell Develop.Biol.12393-416;Lemaitre等(1996)Cell 86973-983;Chiang和Beachy(1994)Mech.Develop.47225-239;和Eldon等(1994)Develop.120885-899。我们采用放射标记的DTLR cDNA,通过用不同的人组织和癌细胞系的mRNA印迹分析,检查了DTLR转录物的空间分布(图5)。发现DTLR1是普遍表达的,并且表达水平高于其它受体。“短的”3.0kB和“长的”8.0kB的DTLR1转录物形式分别存在于卵巢和脾脏中,推定反映出替代剪接(图5,A板和B板)。癌细胞mRNA一板也显示出DTLR1在伯基特淋巴瘤Raji细胞系中占优势的过量表达(图5,C板)。DTLR2 mRNA的表达没有DTLR1的范围广,在肺脏中检测到一个4.0kB的种类,在心脏、脑和肌肉中明显检测到一个4.4kB的转录物。DTLR3的组织分布模式重复了DTLR2的组织分布模式(图5,E板)。DTLR3也以大小约为4.0kB和6.0kB的两个主要转录物存在,在胎盘和胰脏中观察到最高水平的表达。相反,DTLR4和DTLR5信息看来是极度组织特异性的。DTLR4仅在胎盘中作为约7.0kB的单一转录物检测到。在卵巢和外周血单核细胞中观察到DTLR5的4.0kB弱信号。进化上古老的调节系统的组分。
通过比较基因组法,可以重建信号途径的原始分子蓝图和趋异命运。Miklos和Rubin(1996)Cell 86521-529;Chothia(1994)Develop.1994增刊,27-33;Banfi等(1996) Nature Genet.13167-174;和Wang等(1996)J.Biol.Chem.2714468-4476。我们已经采用该逻辑,鉴别出一个人类中出现的基因家族,它们目前编码5个受体的平行进化同源物DTLR 1-5,它们是以Toll为首的果蝇属基因家族的直接进化的对应物(图1-3)。人和蝇DTLR的保守结构即保守的LRR胞外域和胞内TH域(图1),暗示与果蝇属中Toll偶联的坚固的途径(6、7)在脊椎动物中继续存在。最佳证据来自重复途径多功能IL-1系统及其受体融合的TH域的所有组成成分IRAK、NF-κB和I-κB同系物(Belvin和Anderson(1996)Ann.Rev.Cell Develop.Biol.12393-416;和Wasserman(1993)Molec.Biol.Cell 4767-771;Hardiman等(1996)Oncogene 132467-2475;和Cao等(1996)Science 2711128-1131);也已经特征鉴定出一种Tube样因子。尚不知DTLR是否可以有效地偶联于IL-1R信号机器,或者,而是使用平行的一组蛋白。与IL-1受体不同,预测人DTLR的LRR支架保留对Sptzle-Trunk相关胱氨酸结因子的亲和性;已经分离出适合该模型的候选DTLR配体(所谓的PEN)。
通过途径中互作蛋白折叠的保守性,可以估计信号转导的生化机制。Miklos和Rubin(1996)Cell 86521-529;Chothia(1994)Develop.1994增刊,27-33。目前,Toll信号范例包括其作用受其结构、作用或命运精密限定的某些分子Pelle是一种Ser/Thr激酶(磷酸化),Dorsal是一种NF-κB样转录因子(DNA-结合),而Cactus是一种锚蛋白重复抑制剂(Dorsal结合,降解)。Belvin和Anderson(1996)Ann.Rev.CellDevelop.Biol.12393-416。相反,Toll TH域和Tube的功能尚不清楚。与其它细胞因子受体一样(Heldin(1995)Cell 80213-223),配体介导的Toll二聚看来是触发事件Toll近膜区中的游离半胱氨酸产生组成型活性的受体对(Schneider等(1991)Genes Develop.5797-807),而嵌合Torso-Toll受体以二聚体作为信号(Galindo等(1995)Develop.1212209-2218);此外,Toll胞外域的严重截短或全部丧失,产生杂乱的胞内信号(Norris和Manley(1995)Genes Develop.9358-369;Winans和Hashimoto(1995)Molec.Biol.Cell 6587-596),这是具有催化域的癌基因受体的回忆(Heldin(1995)Cell 80213-223)。Tube是膜定位的,它连接Pelle的N末端(死)域并且磷酸化,但双杂种分析均未显示出Toll-Tube和Toll-Pelle的相互作用(Galindo等(1995)Develop.1212209-2218;和Groβhans等(1994)Nature 372563-566);这后一结果提示Toll TH域的构象“状态”略微影响因子的募集。Norris和Manley(1996)Genes Develop.10862-872;和Galindo等(1995)Develop.1212209-2218。
这些令人苦恼的问题的本质是Toll TH域的结构性质。为了解决该问题,我们已经利用了来自昆虫、植物和脊椎动物的TH序列的进化趋异性,加入人DTLR链,并提取用于结构预测和折叠识别的最小的保守蛋白核心(图2)。强烈预测的(β/α)5TH域折叠具有其酸性残基不对称簇,在拓扑学上与细菌中双组分信号途径中的效应调节物的结构相同(Volz(1993)Biochemistry 3211741-11753;和Parkinson(1993)Cell 73857-871)(图2)。原型趋化性调节物CheY瞬时结合核心β-片C末端“天冬氨酸袋”中的二价阳离子;该阳离子提供静电稳定性,并促进不变的Asp的活化磷酸化。Volz(1993)Biochemistry 3211741-11753。同样,该TH域可以捕捉其酸性巢中的阳离子,但激活和下游信号依赖于带负电部分的特异性结合阴离子配体可以通过将其锁入精确的氢键网络中,而克服强负电结合位点的电势。Ledvina等(1996)Proc.Nat’l Acad.Sci.USA 936786-6791。有趣的是,该TH域可以不仅仅用作装配Toll或植物和脊椎动物中同源系统的Tube/Pelle复合物的被动支架,而是作为信号转导机器中真正的构象触发剂而主动参与。Toll的二聚可以促进由调节受体尾引起的解掩蔽,也许解释了Tube/Pelle复合物的条件结合(Norris和Manley(1995)Genes Develop.9358-369;和Norris和Manley(1996)Genes Develop.10862-872),或促进TH袋的小分子激活物的结合。然而,该细胞内的“游离”TH域(Norris和Manley(1995)Genes Develop.9358-369;Winans和Hashimoto(1995)Molec.Biol.Cell 6587-596)可能通过激活并与游走的Tube/Pelle复合物对接,作为催化性的CheY样触发剂起作用。形态发生受体和免疫防御昆虫和脊椎动物免疫系统之间的进化联系印在DNA中昆虫中编码抗微生物因子的基因显示出的上游基序与哺乳动物中急性期效应元件相似,已知所述急性期效应元件结合NF-κB转录因子。Hultmark(1993)Trends Genet.9178-183。Dorsal和两种Dorsal相关因子Dif和Relish,帮助在细菌攻击后诱导这些防御蛋白(Reichhart等(1993)C.R.Acad.Sci.Paris 3161218-1224;Ip等(1993)Cell 75753-763;和Dushay等(1996)Proc Nat’l Acad.Sci.USA 9310343-10347);Toll或其它DTLR可能在果蝇属成体中介导这些快速免疫应答(Lamaitre等(1996)Cell 86973-983;和Rosetto等(1995)Biochem.Biophys.Res.Commun.209111-116)。在脊椎动物中,与IL-1炎症反应机制平行的反应明显具有Toll信号途径的功能多面性,并提示在胚胎图式发育和先天免疫之间古老的协同作用(Belvin和Anderson(1996)Ann.Rev.Cell Develop.Biol.12393-416;Lamaitre等(1996)Cell 86973-983;Wasserman(1993)Molec.Biol.Cell 4767-771;Wilson等(1997)Curr.Biol.7175-178;Hultmark(1993)Trends Genet.9178-183;Reichhart等(1993)C.R.Acad.Sci.Paris 3161218-1224;Ip等(1993)Cell 75753-763;和Dushay等(1996)Proc Nat’l Acad.Sci.USA 9310343-10347;Rosetto等(1995)Biochem.Biophys.Res.Commun.209111-116;Medzhitov和Janeway(1997)Curr.Opin.Immunol.94-9;和Medzhitov和Janeway(1997)Curr.Opin.Immunol.94-9)。昆虫和人DTLR蛋白的更密切的同系物,引起甚至更强的生物学功能的重叠,这些功能替代与IL-1系统平行的纯免疫系统,并提供对脊椎动物胚胎背腹转化和其它转化的潜在的分子调节物。DeRobertis和Sasai(1996)Nature38037-40;和Arendt和Nubler-Jung(1997)Mech.Develop.617-21。
本文对人类中一个出现的强大的(robust)受体家族的描述,反映出最近对Wnt图式发育因子的脊椎动物Frizzled受体的发现。Wang等(1996)J.Biol.Chem.2714468-4476。因为许多其它细胞因子受体系统在早期发育中有作用(Lemaire和Kodjabachian(1996)Trends Genet.12525-531),也许致密的胚胎和组合的(gangly)成体的不同细胞环境(cellular context)仅仅产生熟悉的信号途径和在不同时间具有不同生物学结果的其可扩散触发剂,所述不同的生物学结果例如DTLR的形态发生相对于免疫防御。对于昆虫、植物和人的Toll相关系统(Hardiman等(1996)Oncogene 132467-2475;Wilson等(1997)Curr.Biol.7175-178),这些信号通过调节性TH域运行,所述TH域有趣地类似细菌转导的发动机(Parkinson(1993)Cell 73857-871)。
特别是,DTLR6表现出确立在该家族中其成员资格的结构特征。此外,该家族成员已经涉及许多明显的发育疾病病征,并与先天免疫系统有关。具体地说,已经将DTLR6作图至X染色体的一个位置,该位置是主要的发育异常的热点。参见例如The Sanger Center人X染色体网站http//.sanger.ac.uk/HGP/ChrX/index.shtml;和theBaylor College of Medicine人类基因组测序网站http//gc.bcm.tmc.edu8088/cgi-bin/seq/home。
登记的PAC的登记号是AC003046。该登记号带有来自两种PAC的序列RPC-164K3和RPC-263P4。这两种PAC序列作图至人染色体Xp22,于Baylor网站标记DX704和DXS7166之间。该区是严重的发育异常的“热点”。III.DTLR片段的PCR扩增选择两种合适的引物序列(参见表1-10)。在根据产生部分或全长cDNA的信息的存在而选择的合适mRNA样品上,例如在表达该基因的样品上,使用RT-PCR。参见例如Innis等(编辑,1990)PCR PtotocolsA Guide to Methods and Applications Academic Press,San Diego,CA;和Dieffenbach和Dveksler(1995;编辑)PCR PrimerA LaboratoryManual Cold Spring Harbor Press,CSH,NY。这样将允许确定有用的序列,以探测cDNA文库中的全长基因。TLR6是该基因组中的一个连续序列,这可能提示其它TLR也是连续的序列。因此,对基因组DNA进行PCR可能产生全长的连续序列,然后可应用染色体步查方法。或者,序列数据库会含有对应于所需实施方案的部分的序列,或密切相关的形式,例如替代剪接等。表达克隆技术也可以应用于cDNA文库。IV.DTLR的组织分布已经检测到编码这些DTLR的每个基因的信息。参见图5A-5F。将用合适的技术分析其它细胞和组织,所述合适的技术例如为PCR、免疫测定、杂交或其它方法。组织和器官cDNA制备物可得自Clontech,Mountain View,CA。天然表达源的鉴定是有用的,如所述的。
DNA分析来自首次扩增的cDNA文库的DNA(5μg)用合适的限制性酶消化,以释放插入片段,在1%琼脂糖凝胶上电泳,并转移至尼龙膜(Schleicher和Schuell,Keene,NH)。
用于人mRNA分离的样品通常包括例如外周血单核细胞(单核细胞、T细胞、NK细胞、粒细胞、B细胞),静息的(T100);外周血单核细胞,用抗CD3激活2、6、12小时的混合物(pooled)(T101);T细胞,TH0克隆Mot 72,静息的(T102);T细胞,TH0克隆Mot 72,用抗CD28和抗CD3激活3、6、12小时的混合物(T103);T细胞,TH0克隆Mot 72,用特定肽无反应性处理2、7、12小时的混合物(T104);T细胞,TH1克隆HY06,静息的(T107);T细胞,TH1克隆HY06,用抗CD28和抗CD3激活3、6、12小时的混合物(T108);T细胞,TH1克隆HY06,用特定肽无反应性处理2、6、12小时的混合物(T109);T细胞,TH2克隆HY935,静息的(T110);T细胞,TH2克隆HY935,用抗CD28和抗CD3激活2、7、12小时的混合物(T111);T细胞CD4+CD45RO-,在抗CD28、IL-4和抗IFN-γ中极化的T细胞,极化的TH2,用抗CD3和抗CD28激活4小时(T116);T细胞肿瘤系Jurkat和Hut78,静息的(T117);T细胞克隆,混合的AD130.2、Tc783.12、Tc783.13、Tc783.58、Tc783.69,静息的(T118);T细胞随机γδT细胞克隆,静息的(T119);脾细胞,静息的(B100);脾细胞,用抗CD40和IL-4激活的(B101);B细胞EBV系,混合的WT49、RSB、JY、CVIR、721.221、RM3、HSY,静息的(B102);B细胞系JY,用PMA和离子霉素激活1、6小时的混合物(B103);混合的K 20克隆,静息的(K100);混合的NK20克隆,用PMA和离子霉素激活6小时(K101);NKL克隆,得自LGL白血病患者的外周血,IL-2处理的(K106);NK细胞毒性克隆640-A30-1,静息的(K107);造血前体系TF1,用PMA和离子霉素激活1、6小时的混合物(C100);U937前单核细胞系,静息的(M100);U937前单核细胞系,用PMA和离子霉素激活1、6小时的混合物(M101);淘析的单核细胞,用LPS、IFNγ、抗IL-10激活1、2、6、12、24小时的混合物(M102);淘析的单核细胞,用LPS、IFNγ、IL-10激活1、2、6、12、24小时的混合物(M103);淘析的单核细胞,用LPS、IFNγ、抗IL-10激活4、16小时的混合物(M106);淘析的单核细胞,用LPS、IFNγ、IL-10激活4、16小时的混合物(M107);淘析的单核细胞,用LPS激活1小时(M108);淘析的单核细胞,用LPS激活6小时(M109);DC 70%CD1a+,来自CD34+GM-CSF、TNFα12天,静息的(D101);DC 70%CD1a+,来自CD34+GM-CSF、TNFα 12天,用PMA和离子霉素激活1小时(D102);DC 70%CD1a+,来自CD34+GM-CSF、TNFα 12天,用PMA和离子霉素激活6小时(D103);DC 95%CD1a+,来自CD34+GM-CSF、TNFα 12天,通过FACS分选,用PMA和离子霉素激活1、6小时的混合物(D104);DC 95%CD14+,来自CD34+GM-CSF、TNFα 12天,通过FACS分选,用PMA和离子霉素激活1、6小时的混合物(D105);DC CD1a+CD86+,来自CD34+GM-CSF、TNFα 12天,通过FACS分选,用PMA和离子霉素激活1、6小时的混合物(D106);DC,来自单核细胞GM-CSF、IL-45天,静息的(D107);DC,来自单核细胞GM-CSF、IL-45天,静息的(D108);DC,来自单核细胞GM-CSF、IL-45天,用LPS激活4、16小时的混合物(D109);DC,来自单核细胞GM-CSF、IL-45天,用TNFα、单核细胞上清液(supe)激活4、16小时的混合物(D110);平滑肌瘤L11良性肿瘤(X101);正常子宫肌层M5(O115);恶性平滑肌肉瘤GS1(X103);肺成纤维细胞肉瘤系MRC5,用PMA和离子霉素激活1、6小时的混合物(C101);肾上皮癌细胞系CHA,用PMA和离子霉素激活1、6小时的混合物(C102);28周的雄性胎肾(O100);28周的雄性胎肺(O101);28周的雄性胎肝(O102);28周的雄性胎心(O103);28周的雄性胎脑(O104);28周的雄性胎儿膀胱(O106);28周的雄性胎儿小肠(O107);28周的雄性胎儿脂肪组织(O108);25周的雌性胎儿卵巢(O109);25周的雌性胎儿子宫(O110);28周的雄性胎儿睾丸(O111);28周的雄性胎脾(O112);28周的成人胎盘(O113);和来自12岁的发炎扁桃体(X100)。
用于小鼠mRNA分离的样品可以包括例如静息的小鼠成纤维细胞的L细胞系(C200);BrafER(与雌激素受体融合的Braf融合体)转染的细胞,对照(C201);T细胞,TH1,极化的(Me114 bright,来自脾脏的CD4+细胞,用IFN-γ和抗IL-4极化7天;T200);T细胞,TH2,极化的(Me114 bright,来自脾脏的CD4+细胞,用IL-4和抗IFN-γ极化7天;T201);T细胞,高度极化的TH1(参见Openshaw等(1995)J.Exp.Med.1821357-1367;用抗CD3激活2、6、16小时的混合物;T202);T细胞,高度极化的TH2(参见Openshaw等(1995)J.Exp.Med.1821357-1367;用抗CD3激活2、6、16小时的混合物;T203);CD44-CD25+前T细胞,从胸腺分选的(T204);TH1 T细胞克隆D1.1,用抗原最后一次刺激后静息3周(T205);TH1 T细胞克隆D1.1,10μg/ml ConA激活15小时(T206);TH2 T细胞克隆CDC35,用抗原最后一次刺激后静息3周(T207);TH2 T细胞克隆CDC35,10μg/ml ConA激活15小时(T208);Me114+原初T细胞,来自脾脏,静息的(T209);Me114+T细胞,用IFN-γ/IL-12/抗IL-4极化6、12、24小时的混合物,极化成Th1(T210);Me114+T细胞,用IL-4/抗IFN-γ极化6、13、24小时的混合物,极化成Th2(T211);未刺激的成熟B细胞白血病细胞系A20(B200);未刺激的B细胞系CH12(B201);来自脾脏的未刺激的大B细胞(B202);来自全脾的B细胞,LPS激活(B203);来自脾脏的甲泛葡胺富集的树突细胞,静息的(D200);来自骨髓的树突细胞,静息的(D201);单核细胞细胞系RW264.7,用LPS激活4小时(M200);骨髓巨噬细胞,用GM和M-CSF衍生的(M201);巨噬细胞系J774,静息的(M202);于0.5、1、3、6、12小时混合的巨噬细胞系J774+LPS+抗IL-10(M203);于0.5、1、3、6、12小时混合的巨噬细胞系J774+LPS+IL-10(M204);气溶胶攻击的小鼠肺组织,Th2引物(primer)、气溶胶OVA攻击7、14、23小时的混合物(参见Garlisi等(1995)Clinical Immunology andImmunopathology 7575-83;X206);日圆线虫属(Nippostrongulus)感染的肺组织(参见Coffman等(1989)Science 245308-310;X200);全成人肺脏,正常的(O200);全肺脏,rag-1(参见Schwarz等(1993)Immnodeficiency 4249-252;O205);IL-10 K.O.脾脏(参见Kuhn等(1991)Cell 75263-274;X201);全成人脾脏,正常的(O201);全脾脏,rag-1(O207);IL-10 K.O.肠系膜淋巴结(X202);全肠系膜淋巴结,正常的(O210);IL-10 K.O.肠系膜淋巴结(X203);全肠系膜淋巴结,正常的(O211);IL-10 K.O.结肠(X203);全结肠,正常的(O212);NOD小鼠胰脏(参见Makino等(1980)Jikken Dobutsu 291-13;X205);全胸腺,rag-1(O208);全肾脏,rag-1(O209);全心脏,rag-1(O202);全脑,rag-1(O203);全睾丸,rag-1(O204);全肝脏,rag-1(O206);大鼠正常关节组织(O300);和大鼠关节炎关节组织(X300)。V.DTLR的种对应物的克隆采用各种策略,以获得这些DTLR的种对应物,最好是来自其它灵长类的种对应物。一种方法是采用密切相关的物种的DNA探针进行交叉杂交。调查进化上相似的物种作为中间步骤,可能是有用的。另一方法是采用特异性PCR引物,所述引物基于特定物种(例如人)基因(例如多肽或核苷酸序列高度保守或非保守的区)之间相似性或差异的区组鉴定。或者,可以将抗体用于表达克隆。VI.哺乳动物DTLR蛋白的生产工程改造合适的(例如GST)融合构成物,用于在例如大肠杆菌中表达。例如,构建小鼠IGIF pGex质粒,并将其转化入大肠杆菌中。在含有50μg/ml氨苄青霉素的LB培养基中培养新转化的细胞,并用IPTG(Sigma,St.Louis,MO)诱导。过夜诱导后,收获细菌,并分离含有DTLR蛋白的沉淀。将所述沉淀在2升TE缓冲液(50mM Tris碱pH8.0、10mM EDTA和2mM pefabloc)中匀化。使该材料通过微流化装置(microfluidizer)(Microfluidics,Newton,MA)三次。在Sorvall GS-3转子上,将流化的上清液以13,000rpm离心1小时。所产生的上清液含所述DTLR蛋白,将其过滤,并使其通过谷胱甘肽-SEPHAROSE柱,该柱在50mM Tris碱pH8.0中平衡。合并含有所述DTLR-GST融合蛋白的流分,并用凝血酶(Enzyme Research Laboratories,Inc.,SouthBend,IN)酶切。然后,使酶切的合并物通过Q-SEPHAROSE柱,该柱在50mM Tris碱中平衡。合并含有DTLR的流分,并在冷蒸馏水中稀释,以降低电导率,并再次仅通过新的Q-Sepharose柱,或再次接连通过新的Q-Sepharose和免疫亲和抗体柱。合并含有所述DTLR蛋白的流分,将其分成等分样品,并于-70℃冰箱中贮存。
将CD谱与DTLR1蛋白比较,可以提示该蛋白是正确地折叠的。参见Hazuda等(1969)J.Biol.Chem.2641689-1693。VII.用DTLR进行生物测定生物测定一般涉及该蛋白的配体结合特征,或涉及该受体的激酶/磷酸酶活性。该活性通常是可逆的,许多其它酶的作用(介导磷酸酶或磷酸化酶活性)也是可逆的,采用标准方法可容易地测量所述活性。参见例如Hardie等(编辑,1995)The Protein Kinase FactBook第I和II卷,Academic Press,San Diego,CA;Hanks等(1991)Meth.Enzymol.20038-62;Hunter等(1992)Cell 70375-388;Lewin(1990)Cell 61743-752;Pines等(1991)Cold Spring Harbor Symp.Quant.Biol.56449-463;和Parker等(1993)Nature 363736-738。
白介素-1家族含有这样的分子,它们每种均是重要的炎症疾病的介质。关于综合性综述,参见Dinarello(1996)“疾病中白介素-1的生物学基础”Blood 872095-2147。提示不同的Toll配体可能在疾病起始、特别是炎症反应中起重要作用。与IL-1家族相关的新蛋白的发现,促进这种分子的鉴定,所述分子提供疾病起始的分子基础,并允许开发范围和效力增加的治疗策略。VIII.对例如DTLR4特异性的抗体的制备近交Balb/c小鼠用重组形式的所述蛋白(例如纯化的DTLR4)腹膜内免疫,或用稳定转染的NIH-3T3细胞腹膜内免疫。于合适的时间点,用加入或不加入额外佐剂的蛋白加强免疫动物,以进一步刺激抗体产生。收集血清,或用收获的脾脏产生杂交瘤。
或者,Balb/c小鼠用以该基因或其片段转化的细胞(或者内源细胞或者异源细胞)免疫,或用分离的富集膜免疫,以表达该抗原。于合适的时间点收集血清,通常在多次进一步给予免疫后收集。在原位生产蛋白中,各种基因治疗技术可能可用以产生免疫应答。
可以制备单克隆抗体。例如,将脾细胞与合适的融合伴侣融合,通过标准方法,在生长培养基中选择杂交瘤。例如通过ELISA或其它测定,根据与所需DTLR结合的抗体的存在,筛选杂交瘤上清液。也可以选择或制备特异性识别特定DTLR实施方案的抗体。
在另一方法中,可以将合成的肽或纯化的蛋白提呈给免疫系统,以产生单克隆抗体或多克隆抗体。参见例如Coligan(1991)CurrentProtocols in Immunology Wiley/Greene;和Harlow和Lane(1989)AntibodiesA Laboratory Manual Cold Spring Harbor Press。在合适的情况下,结合试剂或者如上所述进行标记,例如荧光标记或其它标记,或者将其固定至一种基质,以用于淘选方法。也可以将核酸引入动物细胞中,以产生用来诱出免疫应答的抗原。参见例如Wang等(1993)Proc.Nat’l Acad.Sci.904156-4160;Barry等(1994)BioTechiques16616-619;和Xiang等(1995)Immunity 2129-135。IX.与例如DTLR5融合的融合蛋白的产生用DTLR5制备不同的融合构成物。将该基因的部分融合于一种表位标记,例如FLAG标记,或融合于双杂种系统构成物。参见例如Fields和Song(1989)Nature 340245-246。
所述表位标记可以用于表达克隆方法中,用抗FLAG抗体检测,以检测结合伴侣,例如相应DTLR5的配体。所述双杂种系统也可以用来分离特异性结合于DTLR5的蛋白。X.DTLR的染色体作图制备染色体线(chromosome spreads)。在染色体制备物上进行原位杂交,用以植物凝集素刺激、培养72小时的淋巴细胞获得所述染色体制备物。加入5-溴脱氧尿苷培养最后7小时(60μg/ml培养基),以确保良好质量的杂交后染色体显带。
将借助引物在总B细胞cDNA模板上扩增的合适片段(例如PCR片段),克隆入合适的载体中。通过切口平移,用3H标记该载体。使放射标记的探针杂交至中期线上,如Mattei等(1985)Hum.Genet.69327-331中所述。
玻片用核示踪乳液(KODAK NTB2)包被后,于4℃曝光例如18天。为了避免在显带步骤期间有任何银颗粒滑落,染色体线首先用缓冲的吉姆萨溶液染色,并拍摄中期照片。然后,通过荧光染料-质子传递作用-吉姆萨(FPG)法,进行R-带显带,并且在分析之前,再次拍摄中期照片。
或者,可以如上所述进行FISH。将所述DTLR基因定位于不同的染色体。DTLR2和DTLR3定位至人类第4染色体;DTLR4定位于人类第9染色体,而DTLR5定位于人类第1染色体。参见图4A-4D。XI.结构活性关系采用标准方法和分析,测定特定残基关键性的信息。例如通过于确定的位置(例如于以上鉴定的位置)产生许多不同的变异体,并且评价所述变异体的生物活性,进行标准诱变分析。在某种程度上进行该分析,以确定修饰活性的位置,或集中于特定的几个位置,以确定可以取代的残基,以或者保留、阻断或调节生物活性。
或者,天然变异体的分析可以指明什么位置耐受天然突变。这可以得自个体、品系或物种间变异的群体分析。例如通过PCR分析并测序,分析选定个体的样品。这允许评价群体多态性。XI.DTLR配体的分离利用DTLR的结合特异性,可以将DTLR用作特异性的结合试剂,以鉴定其结合伴侣,这非常象使用抗体。结合试剂或者如上所述标记,例如荧光标记或其它标记,或者固定至一种基质,以用于淘选方法。
所述结合组合物用来筛选表达文库,所述表达文库由表达结合伴侣(例如配体,最好是膜结合的)的细胞系制备。标准染色方法用来检测或分选表面表达的配体,或通过淘选,筛选表面表达的转化细胞。采用各种染色方法或免疫荧光法,进行胞内表达的筛选。也参见McMahan等(1991)EMBO J.102821-2832。
例如,于第0天,用每室1ml纤连蛋白(10ng/ml)的PBS于室温下预包被2室的permanox玻片30分钟。用PBS冲洗1次。然后,将COS细胞以2-3×105细胞/室,在1.5ml生长培养基中平板接种。于37℃培养过夜。
对于每种样品,第一天,制备0.5ml无血清DME溶液,该溶液含有66μg/ml DEAE-葡聚糖、66μM氯喹和4μg DNA。对于每组,制备阳性对照,即1和1/200稀释度的DTLR-FLAG cDNA,以及制备阴性模拟物。用无血清DME冲洗细胞。加入该DNA溶液,于37℃温育5小时。去除培养基,加入0.5ml 10%DMSO的DME 2.5分钟。去除DME,并用DME洗涤1次。加入1.5ml生长培养基,并且培养过夜。
第2天,更换培养基。第3或4天,将所述细胞固定并染色。用Hank缓冲盐溶液(HBSS)冲洗细胞2次,并于4%低聚甲醛(PFA)/葡萄糖中固定5分钟。用HBSS洗涤3次。去除所有液体后,将所述玻片于-80℃贮存。对于每个室,如下进行0.5ml温育。加入具有32μl/ml1M NaN3的HBSS/皂苷(0.1%)20分钟。然后细胞用HBSS/皂苷洗涤1次。将合适的DTLR或DTLR/抗体复合物加入细胞中,并温育30分钟。用HBSS/皂苷洗涤细胞2次。如果合适,加入第一抗体30分钟。以1/200的稀释度加入第二抗体,例如Vector抗小鼠抗体,并温育30分钟。制备ELISA溶液,例如Vector Elite ABC辣根过氧化物酶溶液,并预温育30分钟。使用例如每2.5ml HBSS/皂苷1滴A溶液(抗生物素蛋白)和1滴B溶液(生物素)。用HBSS/皂苷洗涤细胞2次。加入ABC HRP溶液,并温育30分钟。用HBSS洗涤细胞2次,第二次洗涤2分钟,封闭细胞。然后,加入Vector的二氨基苯甲酸(DAB)5-10分钟。使用每5ml玻璃蒸馏水2滴缓冲液加4滴DAB加2滴H2O2。小心地除去室,并在水中冲洗玻片。风干数分钟,然后加入1滴CrystalMount,加上盖玻片。于85-90℃烘5分钟。
评价库和渐进亚克隆的阳性染色,以分离负责结合的单基因。
或者,用DTLR试剂来亲和纯化或分选出表达推定配体的细胞。参见例如Sambrook等或Ausubel等。
另一策略是通过淘选,筛选膜结合受体。如上所述构建该受体的cDNA。可以将该配体固定化,并用以固定表达的细胞。利用识别例如DTLR融合构成物的FLAG序列的合适抗体,或利用针对第一抗体产生的抗体,可以达到固定化。筛选和扩增的递归(recursive)循环导致合适克隆的富集,并且最终分离受体表达克隆。
用哺乳动物DTLR可以筛选噬菌体表达文库。例如抗FLAG抗体的合适的标记技术,将提供合适克隆的特异性标记。
本文引用的所有参考文献均通过引用结合到本文中,其程度与具体和单独地表明每个单独的出版物或专利申请通过引用结合到本文中的程度一样。
不偏离本发明的精神和范围,可以进行本发明的的许多修改和变化,这对本领域技术人员是显而易见的。提供本文所述的具体实施方案仅仅是作为实例,本发明由所附的权利要求书以及赋予这类权利要求的相当权利要求的全部范围所限制;本发明不受作为实例提出的具体实施方案的限制。
序列表(1)一般资料(i)申请人(A)姓名Schering Corporation(B)街道2000 Galloping Hill Road(C)城市Kenilworth(D)州New Jersey(E)国家美国(F)邮政编码07033(G)电话(908)298-4000(H)传真(908)298-5388(ii)发明名称人受体蛋白;相关的药剂和方法(iii)序列数35(v)计算机可读形式(A)媒体类型软盘(B)计算机Macintosh Power PC(C)操作系统8.0(D)软件Microsoft Word 6.0(vi)当前申请数据(A)申请号(B)提交日期(C)分类(vii)在先申请数据(A)申请号USSN 60/044,293(B)提交日期1997年5月7日(A)申请号USSN 60/072,212(B)提交日期1998年1月22日(A)申请号USSN 60/076,947(B)提交日期1998年3月5日(2)SEQ ID NO1的信息(i)顺序特征(A)长度2367个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征
(A)名称/关键词CDS(B)位置1...2358(ix)特征(A)名称/关键词成熟肽(B)位置67...2358(xi)顺序描述SEQ ID NO1ATG ACT AGC ATC TTC CAT TTT GCC ATT ATC TTC ATG TTA ATA CTT CAG48Met Thr Ser Ile Phe His Phe Ala Ile Ile Phe Met Leu Ile Leu Gln-22 -20 -15 -10ATC AGA ATA CAA TTA TCT GAA GAA AGT GAA TTT TTA GTT GAT AGG TCA96Ile Arg Ile Gln Leu Ser Glu Glu Ser Glu Phe Leu Val Asp Arg Ser-5 1 5 10AAA AAC GGT CTC ATC CAC GTT CCT AAA GAC CTA TCC CAG AAA ACA ACA 144Lys Asn Gly Leu Ile His Val Pro Lys Asp Leu Ser Gln Lys Thr Thr15 20 25ATC TTA AAT ATA TCG CAA AAT TAT ATA TCT GAG CTT TGG ACT TCT GAC 192Ile Leu Asn Ile Ser Gln Asn Tyr Ile Ser Glu Leu Trp Thr Ser Asp30 35 40ATC TTA TCA CTG TCA AAA CTG AGG ATT TTG ATA ATT TCT CAT AAT AGA 240Ile Leu Ser Leu Ser Lys Leu Arg Ile Leu Ile Ile Ser His Asn Arg45 50 55ATC CAG TAT CTT GAT ATC AGT GTT TTC AAA TTC AAC CAG GAA TTG GAA 288Ile Gln Tyr Leu Asp Ile Ser Val Phe Lys Phe Asn Gln Glu Leu Glu60 65 70TAC TTG GAT TTG TCC CAC AAC AAG TTG GTG AAG ATT TCT TGC CAC CCT 336Tyr Leu Asp Leu Ser His Asn Lys Leu Val Lys Ile Ser Cys His Pro75 80 85 90ACT GTG AAC CTC AAG CAC TTG GAC CTG TCA TTT AAT GCA TTT GAT GCC 384Thr Val Asn Leu Lys His Leu Asp Leu Ser Phe Asn Ala Phe Asp Ala95 100 105CTG CCT ATA TGC AAA GAG TTT GGC AAT ATG TCT CAA CTA AAA TTT CTG 432Leu Pro Ile Cys Lys Glu Phe Gly Asn Met Ser Gln Leu Lys Phe Leu110 115 120GGG TTG AGC ACC ACA CAC TTA GAA AAA TCT AGT GTG CTG CCA ATT GCT 480Gly Leu Ser Thr Thr His Leu Glu Lys Ser Ser Val Leu Pro Ile Ala125 130 135CAT TTG AAT ATC AGC AAG GTC TTG CTG GTC TTA GGA GAG ACT TAT GGG 528His Leu Asn Ile Ser Lys Val Leu Leu Val Leu Gly Glu Thr Tyr Gly140 145 150GAA AAA GAA GAC CCT GAG GGC CTT CAA GAC TTT AAC ACT GAG AGT CTG 576Glu Lys Glu Asp Pro Glu Gly Leu Gln Asp Phe Asn Thr Glu Ser Leu155 160 165 170CAC ATT GTG TTC CCC ACA AAC AAA GAA TTC CAT TTT ATT TTG GAT GTG 624His Ile Val Phe Pro Thr Asn Lys Glu Phe His Phe Ile Leu Asp Val175 180 185TCA GTC AAG ACT GTA GCA AAT CTG GAA CTA TCT AAT ATC AAA TGT GTG 672Ser Val Lys Thr Val Ala Asn Leu Glu Leu Ser Asn Ile Lys Cys Val190 195 200CTA GAA GAT AAC AAA TGT TCT TAC TTC CTA AGT ATT CTG GCG AAA CTT 720Leu Glu Asp Asn Lys Cys Ser Tyr Phe Leu Ser Ile Leu Ala Lys Leu205 210 215CAA ACA AAT CCA AAG TTA TCA AGT CTT ACC TTA AAC AAC ATT GAA ACA 768Gln Thr Asn Pro Lys Leu Ser Ser Leu Thr Leu Asn Asn Ile Glu Thr220 225 230ACT TGG AAT TCT TTC ATT AGG ATC CTC CAA CTA GTT TGG CAT ACA ACT 816Thr Trp Asn Ser Phe Ile Arg Ile Leu Gln Leu Val Trp His Thr Thr235 240 245 250GTA TGG TAT TTC TCA ATT TCA AAC GTG AAG CTA CAG GGT CAG CTG GAC 864Val Trp Tyr Phe Ser Ile Ser Asn Val Lys Leu Gln Gly Gln Leu Asp255 260 265TTC AGA GAT TTT GAT TAT TCT GGC ACT TCC TTG AAG GCC TTG TCT ATA 912Phe Arg Asp Phe Asp Tyr Ser Gly Thr Ser Leu Lys Ala Leu Ser Ile270 275 280CAC CAA GTT GTC AGC GAT GTG TTC GGT TTT CCG CAA AGT TAT ATC TAT 960His Gln Val Val Ser Asp Val Phe Gly Phe Pro Gln Ser Tyr Ile Tyr285 290 295GAA ATC TTT TCG AAT ATG AAC ATC AAA AAT TTC ACA GTG TCT GGT ACA 1008Glu Ile Phe Ser Asn Met Asn Ile Lys Asn Phe Thr Val Ser Gly Thr300 305 310CGC ATG GTC CAC ATG CTT TGC CCA TCC AAA ATT AGC CCG TTC CTG CAT 1056Arg Met Val His Met Leu Cys Pro Ser Lys Ile Ser Pro Phe Leu His315 320 325 330TTG GAT TTT TCC AAT AAT CTC TTA ACA GAC ACG GTT TTT GAA AAT TGT 1104Leu Asp Phe Ser Asn Asn Leu Leu Thr Asp Thr Val Phe Glu Asn Cys335 340 345GGG CAC CTT ACT GAG TTG GAG ACA CTT ATT TTA CAA ATG AAT CAA TTA 1152Gly His Leu Thr Glu Leu Glu Thr Leu Ile Leu Gln Met Asn Gln Leu350 355 360AAA GAA CTT TCA AAA ATA GCT GAA ATG ACT ACA CAG ATG AAG TCT CTG 1200Lys Glu Leu Ser Lys Ile Ala Glu Met Thr Thr Gln Met Lys Ser Leu365 370 375CAA CAA TTG GAT ATT AGC CAG AAT TCT GTA AGC TAT GAT GAA AAG AAA 1248Gln Gln Leu Asp Ile Ser Gln Asn Ser Val Ser Tyr Asp Glu Lys Lys380 385 390GGA GAC TGT TCT TGG ACT AAA AGT TTA TTA AGT TTA AAT ATG TCT TCA 1296Gly Asp Cys Ser Trp Thr Lys Ser Leu Leu Ser Leu Asn Met Ser Ser395 400 405 410AAT ATA CTT ACT GAC ACT ATT TTC AGA TGT TTA CCT CCC AGG ATC AAG 1344Asn Ile Leu Thr Asp Thr Ile Phe Arg Cys Leu Pro Pro Arg Ile Lys415 420 425GTA CTT GAT CTT CAC AGC AAT AAA ATA AAG AGC ATT CCT AAA CAA GTC 1392Val Leu Asp Leu His Ser Asn Lys Ile Lys Ser Ile Pro Lys Gln Val430 435 440GTA AAA CTG GAA GCT TTG CAA GAA CTC AAT GTT GCT TTC AAT TCT TTA 1440Val Lys Leu Glu Ala Leu Gln Glu Leu Asn Val Ala Phe Asn Ser Leu445 450 455ACT GAC CTT CCT GGA TGT GGC AGC TTT AGC AGC CTT TCT GTA TTG ATC 1488Thr Asp Leu Pro Gly Cys Gly Ser Phe Ser Ser Leu Ser Val Leu Ile460 465 470ATT GAT CAC AAT TCA GTT TCC CAC CCA TCA GCT GAT TTC TTC CAG AGC 1536Ile Asp His Asn Ser Val Ser His Pro Ser Ala Asp Phe Phe Gln Ser475 480 485 490TGC CAG AAG ATG AGG TCA ATA AAA GCA GGG GAC AAT CCA TTC CAA TGT 1584Cys Gln Lys Met Arg Ser Ile Lys Ala Gly Asp Asn Pro Phe Gln Cys495 500 505ACC TGT GAG CTC GGA GAA TTT GTC AAA AAT ATA GAC CAA GTA TCA AGT 1632Thr Cys Glu Leu Gly Glu Phe Val Lys Asn Ile Asp Gln Val Ser Ser510 515 520GAA GTG TTA GAG GGC TGG CCT GAT TCT TAT AAG TGT GAC TAC CCG GAA 1680Glu Val Leu Glu Gly Trp Pro Asp Ser Tyr Lys Cys Asp Tyr Pro Glu525 530 535AGT TAT AGA GGA ACC CTA CTA AAG GAC TTT CAC ATG TCT GAA TTA TCC 1728Ser Tyr Arg Gly Thr Leu Leu Lys Asp Phe His Met Ser Glu Leu Ser540 545 550TGC AAC ATA ACT CTG CTG ATC GTC ACC ATC GTT GCC ACC ATG CTG GTG 1776Cys Asn Ile Thr Leu Leu Ile Val Thr Ile Val Ala Thr Met Leu Val555 560 565 570TTG GCT GTG ACT GTG ACC TCC CTC TGC ATC TAC TTG GAT CTG CCC TGG 1824Leu Ala Val Thr Val Thr Ser Leu Cys Ile Tyr Leu Asp Leu Pro Trp575 580 585TAT CTC AGG ATG GTG TGC CAG TGG ACC CAG ACC CGG CGC AGG GCC AGG 1872Tyr Leu Arg Met Val Cys Gln Trp Thr Gln Thr Arg Arg Arg Ala Arg590 595 600AAC ATA CCC TTA GAA GAA CTC CAA AGA AAT CTC CAG TTT CAT GCA TTT 1920Asn Ile Pro Leu Glu Glu Leu Gln Arg Asn Leu Gln Phe His Ala Phe605 610 615ATT TCA TAT AGT GGG CAC GAT TCT TTC TGG GTG AAG AAT GAA TTA TTG 1968Ile Ser Tyr Ser Gly His Asp Ser Phe Trp Val Lys Asn Glu Leu Leu620 625 630CCA AAC CTA GAG AAA GAA GGT ATG CAG ATT TGC CTT CAT GAG AGA AAC 2016Pro Asn Leu Glu Lys Glu Gly Met Gln Ile Cys Leu His Glu Arg Asn635 640 645 650TTT GTT CCT GGC AAG AGC ATT GTG GAA AAT ATC ATC ACC TGC ATT GAG 2064Phe Val Pro Gly Lys Ser Ile Val Glu Asn Ile Ile Thr Cys Ile Glu655 660 665AAG AGT TAC AAG TCC ATC TTT GTT TTG TCT CCC AAC TTT GTC CAG AGT 2112Lys Ser Tyr Lys Ser Ile Phe Val Leu Ser Pro Asn Phe Val Gln Ser670 675 680GAA TGG TGC CAT TAT GAA CTC TAC TTT GCC CAT CAC AAT CTC TTT CAT 2160Glu Trp Cys His Tyr Glu Leu Tyr Phe Ala His His Asn Leu Phe His685 690 695GAA GGA TCT AAT AGC TTA ATC CTG ATC TTG CTG GAA CCC ATT CCG CAG 2208Glu Gly Ser Asn Ser Leu Ile Leu Ile Leu Leu Glu Pro Ile Pro Gln700 705 710TAC TCC ATT CCT AGC AGT TAT CAC AAG CTC AAA AGT CTC ATG GCC AGG 2256Tyr Ser Ile Pro Ser Ser Tyr His Lys Leu Lys Ser Leu Met Ala Arg715 720 725 730AGG ACT TAT TTG GAA TGG CCC AAG GAA AAG AGC AAA CGT GGC CTT TTT 2304Arg Thr Tyr Leu Glu Trp Pro Lys Glu Lys Ser Lys Arg Gly Leu Phe735 740 745TGG GCT AAC TTA AGG GCA GCC ATT AAT ATT AAG CTG ACA GAG CAA GCA 2352Trp Ala Asn Leu Arg Ala Ala Ile Asn Ile Lys Leu Thr Glu Gln Ala750 755 760AAG AAA TAGTCTAGA2367Lys Lys(2)SEQ ID NO2的信息(i)顺序特征(A)长度786个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO2Met Thr Ser Ile Phe His Phe Ala Ile Ile Phe Met Leu Ile Leu Gln-22 -20 -15 -10Ile Arg Ile Gln Leu Ser Glu Glu Ser Glu Phe Leu Val Asp Arg Ser-51 5 10Lys Asn Gly Leu Ile His Val Pro Lys Asp Leu Ser Gln Lys Thr Thr15 20 25Ile Leu Asn Ile Ser Gln Asn Tyr Ile Ser Glu Leu Trp Thr Ser Asp30 35 40Ile Leu Ser Leu Ser Lys Leu Arg Ile Leu Ile Ile Ser His Asn Arg45 50 55Ile Gln Tyr Leu Asp Ile Ser Val Phe Lys Phe Asn Gln Glu Leu Glu60 65 70Tyr Leu Asp Leu Ser His Asn Lys Leu Val Lys Ile Ser Cys His Pro75 80 85 90Thr Val Asn Leu Lys His Leu Asp Leu Ser Phe Asn Ala Phe Asp Ala95 100 105Leu Pro Ile Cys Lys Glu Phe Gly Asn Met Ser Gln Leu Lys Phe Leu110 115 120Gly Leu Ser Thr Thr His Leu Glu Lys Ser Ser Val Leu Pro Ile Ala125 130 135His Leu Asn Ile Ser Lys Val Leu Leu Val Leu Gly Glu Thr Tyr Gly140 145 150Glu Lys Glu Asp Pro Glu Gly Leu Gln Asp Phe Asn Thr Glu Ser Leu155 160 165 170His Ile Val Phe Pro Thr Asn Lys Glu Phe His Phe Ile Leu Asp Val175 180 185Ser Val Lys Thr Val Ala Asn Leu Glu Leu Ser Asn Ile Lys Cys Val190 195 200Leu Glu Asp Asn Lys Cys Ser Tyr Phe Leu Ser Ile Leu Ala Lys Leu205 210 215Gln Thr Asn Pro Lys Leu Ser Ser Leu Thr Leu Asn Asn Ile Glu Thr220 225 230Thr Trp Asn Ser Phe Ile Arg Ile Leu Gln Leu Val Trp His Thr Thr235 240 245 250Val Trp Tyr Phe Ser Ile Ser Asn Val Lys Leu Gln Gly Gln Leu Asp255 260 265Phe Arg Asp Phe Asp Tyr Ser Gly Thr Ser Leu Lys Ala Leu Ser Ile270 275 280His Gln Val Val Ser Asp Val Phe Gly Phe Pro Gln Ser Tyr Ile Tyr285 290 295Glu Ile Phe Ser Asn Met Asn Ile Lys Asn Phe Thr Val Ser Gly Thr300 305 310Arg Met Val His Met Leu Cys Pro Ser Lys Ile Ser Pro Phe Leu His315 320 325 330Leu Asp Phe Ser Asn Asn Leu Leu Thr Asp Thr Val Phe Glu Asn Cys335 340 345Gly His Leu Thr Glu Leu Glu Thr Leu Ile Leu Gln Met Asn Gln Leu350 355 360Lys Glu Leu Ser Lys Ile Ala Glu Met Thr Thr Gln Met Lys Ser Leu365 370 375Gln Gln Leu Asp Ile Ser Gln Asn Ser Val Ser Tyr Asp Glu Lys Lys380 385 390Gly Asp Cys Ser Trp Thr Lys Ser Leu Leu Ser Leu Asn Met Ser Ser395 400 405 410Asn Ile Leu Thr Asp Thr Ile Phe Arg Cys Leu Pro Pro Arg Ile Lys415 420 425Val Leu Asp Leu His Ser Asn Lys Ile Lys Ser Ile Pro Lys Gln Val430 435 440Val Lys Leu Glu Ala Leu Gln Glu Leu Asn Val Ala Phe Asn Ser Leu445 450 455Thr Asp Leu Pro Gly Cys Gly Ser Phe Ser Ser Leu Ser Val Leu Ile460 465 470Ile Asp His Asn Ser Val Ser His Pro Ser Ala Asp Phe Phe Gln Ser475 480 485 490Cys Gln Lys Met Arg Ser Ile Lys Ala Gly Asp Asn Pro Phe Gln Cys495 500 505Thr Cys Glu Leu Gly Glu Phe Val Lys Asn Ile Asp Gln Val Ser Ser510 515 520Glu Val Leu Glu Gly Trp Pro Asp Ser Tyr Lys Cys Asp Tyr Pro Glu525 530 535Ser Tyr Arg Gly Thr Leu Leu Lys Asp Phe His Met Ser Glu Leu Ser540 545 550Cys Asn Ile Thr Leu Leu Ile Val Thr Ile Val Ala Thr Met Leu Val555 560 565 570Leu Ala Val Thr Val Thr Ser Leu Cys Ile Tyr Leu Asp Leu Pro Trp575 580 585Tyr Leu Arg Met Val Cys Gln Trp Thr Gln Thr Arg Arg Arg Ala Arg590 595 600Asn Ile Pro Leu Glu Glu Leu Gln Arg Asn Leu Gln Phe His Ala Phe605 610 615Ile Ser Tyr Ser Gly His Asp Ser Phe Trp Val Lys Asn Glu Leu Leu620 625 630Pro Asn Leu Glu Lys Glu Gly Met Gln Ile Cys Leu His Glu Arg Asn635 640 645 650Phe Val Pro Gly Lys Ser Ile Val Glu Asn Ile Ile Thr Cys Ile Glu655 660 665Lys Ser Tyr Lys Ser Ile Phe Val Leu Ser Pro Asn Phe Val Gln Ser670 675 680Glu Trp Cys His Tyr Glu Leu Tyr Phe Ala His His Asn Leu Phe His685 690 695Glu Gly Ser Asn Ser Leu Ile Leu Ile Leu Leu Glu Pro Ile Pro Gln700 705 710Tyr Ser Ile Pro Ser Ser Tyr His Lys Leu Lys Ser Leu Met Ala Arg715 720 725 730Arg Thr Tyr Leu Glu Trp Pro Lys Glu Lys Ser Lys Arg Gly Leu Phe735 740 745Trp Ala Asn Leu Arg Ala Ala Ile Asn Ile Lys Leu Thr Glu Gln Ala750 755 760Lys Lys(2)SEQ ID NO3的信息(i)顺序特征(A)长度2355个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...2352(ix)特征
(A)名称/关键词成熟肽(B)位置67...2352(xi)顺序描述SEQ ID NO3ATG CCA CAT ACT TTG TGG ATG GTG TGG GTC TTG GGG GTC ATC ATC AGC48Met Pro His Thr Leu Trp Met Val Trp Val Leu Gly Val Ile Ile Ser-22 -20 -15 -10CTC TCC AAG GAA GAA TCC TCC AAT CAG GCT TCT CTG TCT TGT GAC CGC96Leu Ser Lys Glu Glu Ser Ser Asn Gln Ala Ser Leu Ser Cys Asp Arg-51 5 10AAT GGT ATC TGC AAG GGC AGC TCA GGA TCT TTA AAC TCC ATT CCC TCA 144Asn Gly Ile Cys Lys Gly Ser Ser Gly Ser Leu Asn Ser Ile Pro Ser15 20 25GGG CTC ACA GAA GCT GTA AAA AGC CTT GAC CTG TCC AAC AAC AGG ATC 192Gly Leu Thr Glu Ala Val Lys Ser Leu Asp Leu Ser Asn Asn Arg Ile30 35 40ACC TAC ATT AGC AAC AGT GAC CTA CAG AGG TGT GTG AAC CTC CAG GCT 240Thr Tyr Ile Ser Asn Ser Asp Leu Gln Arg Cys Val Asn Leu Gln Ala45 50 55CTG GTG CTG ACA TCC AAT GGA ATT AAC ACA ATA GAG GAA GAT TCT TTT 288Leu Val Leu Thr Ser Asn Gly Ile Asn Thr Ile Glu Glu Asp Ser Phe60 65 70TCT TCC CTG GGC AGT CTT GAA CAT TTA GAC TTA TCC TAT AAT TAC TTA 336Ser Ser Leu Gly Ser Leu Glu His Leu Asp Leu Ser Tyr Asn Tyr Leu75 80 85 90TCT AAT TTA TCG TCT TCC TGG TTC AAG CCC CTT TCT TCT TTA ACA TTC 384Ser Asn Leu Ser Ser Ser Trp Phe Lys Pro Leu Ser Ser Leu Thr Phe95 100 105TTA AAC TTA CTG GGA AAT CCT TAC AAA ACC CTA GGG GAA ACA TCT CTT 432Leu Asn Leu Leu Gly Asn Pro Tyr Lys Thr Leu Gly Glu Thr Ser Leu110 115 120TTT TCT CAT CTC ACA AAA TTG CAA ATC CTG AGA GTG GGA AAT ATG GAC 480Phe Ser His Leu Thr Lys Leu Gln Ile Leu Arg Val Gly Asn Met Asp125 130 135ACC TTC ACT AAG ATT CAA AGA AAA GAT TTT GCT GGA CTT ACC TTC CTT 528Thr Phe Thr Lys Ile Gln Arg Lys Asp Phe Ala Gly Leu Thr Phe Leu140 145 150GAG GAA CTT GAG ATT GAT GCT TCA GAT CTA CAG AGC TAT GAG CCA AAA 576Glu Glu Leu Glu Ile Asp Ala Ser Asp Leu Gln Ser Tyr Glu Pro Lys155 160 165 170AGT TTG AAG TCA ATT CAG AAC GTA AGT CAT CTG ATC CTT CAT ATG AAG 624Ser Leu Lys Ser Ile Gln Asn Val Ser His Leu Ile Leu His Met Lys175 180 185CAG CAT ATT TTA CTG CTG GAG ATT TTT GTA GAT GTT ACA AGT TCC GTG 672Gln His Ile Leu Leu Leu Glu Ile Phe Val Asp Val Thr Ser Ser Val190 195 200GAA TGT TTG GAA CTG CGA GAT ACT GAT TTG GAC ACT TTC CAT TTT TCA 720Glu Cys Leu Glu Leu Arg Asp Thr Asp Leu Asp Thr Phe His Phe Ser205 210 215GAA CTA TCC ACT GGT GAA ACA AAT TCA TTG ATT AAA AAG TTT ACA TTT 768Glu Leu Ser Thr Gly Glu Thr Asn Ser Leu Ile Lys Lys Phe Thr Phe220 225 230AGA AAT GTG AAA ATC ACC GAT GAA AGT TTG TTT CAG GTT ATG AAA CTT 816Arg Asn Val Lys Ile Thr Asp Glu Ser Leu Phe Gln Val Met Lys Leu235 240 245 250TTG AAT CAG ATT TCT GGA TTG TTA GAA TTA GAG TTT GAT GAC TGT ACC 864Leu Asn Gln Ile Ser Gly Leu Leu Glu Leu Glu Phe Asp Asp Cys Thr255 260 265CTT AAT GGA GTT GGT AAT TTT AGA GCA TCT GAT AAT GAC AGA GTT ATA 912Leu Asn Gly Val Gly Asn Phe Arg Ala Ser Asp Asn Asp Arg Val Ile270 275 280GAT CCA GGT AAA GTG GAA ACG TTA ACA ATC CGG AGG CTG CAT ATT CCA 960Asp Pro Gly Lys Val Glu Thr Leu Thr Ile Arg Arg Leu His Ile Pro285 290 295AGG TTT TAC TTA TTT TAT GAT CTG AGC ACT TTA TAT TCA CTT ACA GAA 1008Arg Phe Tyr Leu Phe Tyr Asp Leu Ser Thr Leu Tyr Ser Leu Thr Glu300 305 310AGA GTT AAA AGA ATC ACA GTA GAA AAC AGT AAA GTT TTT CTG GTT CCT 1056Arg Val Lys Arg Ile Thr Val Glu Asn Ser Lys Val Phe Leu Val Pro315 320 325 330TGT TTA CTT TCA CAA CAT TTA AAA TCA TTA GAA TAC TTG GAT CTC AGT 1104Cys Leu Leu Ser Gln His Leu Lys Ser Leu Glu Tyr Leu Asp Leu Ser335 340 345GAA AAT TTG ATG GTT GAA GAA TAC TTG AAA AAT TCA GCC TGT GAG GAT 1152Glu Asn Leu Met Val Glu Glu Tyr Leu Lys Asn Ser Ala Cys Glu Asp350 355 360GCC TGG CCC TCT CTA CAA ACT TTA ATT TTA AGG CAA AAT CAT TTG GCA 1200Ala Trp Pro Ser Leu Gln Thr Leu Ile Leu Arg Gln Asn His Leu Ala365 370 375TCA TTG GAA AAA ACC GGA GAG ACT TTG CTC ACT CTG AAA AAC TTG ACT 1248Ser Leu Glu Lys Thr Gly Glu Thr Leu Leu Thr Leu Lys Asn Leu Thr380 385 390AAC ATT GAT ATC AGT AAG AAT AGT TTT CAT TCT ATG CCT GAA ACT TGT 1296Asn Ile Asp Ile Ser Lys Asn Ser Phe His Ser Met Pro Glu Thr Cys395 400 405 410CAG TGG CCA GAA AAG ATG AAA TAT TTG AAC TTA TCC AGC ACA CGA ATA 1344Gln Trp Pro Glu Lys Met Lys Tyr Leu Asn Leu Ser Ser Thr Arg Ile415 420 425CAC AGT GTA ACA GGC TGC ATT CCC AAG ACA CTG GAA ATT TTA GAT GTT 1392His Ser Val Thr Gly Cys Ile Pro Lys Thr Leu Glu Ile Leu Asp Val430 435 440AGC AAC AAC AAT CTC AAT TTA TTT TCT TTG AAT TTG CCG CAA CTC AAA 1440Ser Asn Asn Asn Leu Asn Leu Phe Ser Leu Asn Leu Pro Gln Leu Lys445 450 455GAA CTT TAT ATT TCC AGA AAT AAG TTG ATG ACT CTA CCA GAT GCC TCC 1488Glu Leu Tyr Ile Ser Arg Asn Lys Leu Met Thr Leu Pro Asp Ala Ser460 465 470CTC TTA CCC ATG TTA CTA GTA TTG AAA ATC AGT AGG AAT GCA ATA ACT 1536Leu Leu Pro Met Leu Leu Val Leu Lys Ile Ser Arg Asn Ala Ile Thr475 480 485 490ACG TTT TCT AAG GAG CAA CTT GAC TCA TTT CAC ACA CTG AAG ACT TTG 1584Thr Phe Ser Lys Glu Gln Leu Asp Ser Phe His Thr Leu Lys Thr Leu495 500 505GAA GCT GGT GGC AAT AAC TTC ATT TGC TCC TGT GAA TTC CTC TCC TTC 1632Glu Ala Gly Gly Asn Asn Phe Ile Cys Ser Cys Glu Phe Leu Ser Phe510 515 520ACT CAG GAG CAG CAA GCA CTG GCC AAA GTC TTG ATT GAT TGG CCA GCA 1680Thr Gln Glu Gln Gln Ala Leu Ala Lys Val Leu Ile Asp Trp Pro Ala525 530 535AAT TAC CTG TGT GAC TCT CCA TCC CAT GTG CGT GGC CAG CAG GTT CAG 1728Asn Tyr Leu Cys Asp Ser Pro Ser His Val Arg Gly Gln Gln Val Gln540 545 550GAT GTC CGC CTC TCG GTG TCG GAA TGT CAC AGG ACA GCA CTG GTG TCT 1776Asp Val Arg Leu Ser Val Ser Glu Cys His Arg Thr Ala Leu Val Ser555 560 565 570GGC ATG TGC TGT GCT CTG TTC CTG CTG ATC CTG CTC ACG GGG GTC CTG 1824Gly Met Cys Cys Ala Leu Phe Leu Leu Ile Leu Leu Thr Gly Val Leu575 580 585TGC CAC CGT TTC CAT GGC CTG TGG TAT ATG AAA ATG ATG TGG GCC TGG 1872Cys His Arg Phe His Gly Leu Trp Tyr Met Lys Met Met Trp Ala Trp590 595 600CTC CAG GCC AAA AGG AAG CCC AGG AAA GCT CCC AGC AGG AAC ATC TGC 1920Leu Gln Ala Lys Arg Lys Pro Arg Lys Ala Pro Ser Arg Asn Ile Cys605 610 615TAT GAT GCA TTT GTT TCT TAC AGT GAG CGG GAT GCC TAC TGG GTG GAG 1968Tyr Asp Ala Phe Val Ser Tyr Ser Glu Arg Asp Ala Tyr Trp Val Glu620 625 630AAC CTT ATG GTC CAG GAG CTG GAG AAC TTC AAT CCC CCC TTC AAG TTG 2016Asn Leu Met Val Gln Glu Leu Glu Asn Phe Asn Pro Pro Phe Lys Leu635 640 645 650TGT CTT CAT AAG CGG GAC TTC ATT CCT GGC AAG TGG ATC ATT GAC AAT 2064Cys Leu His Lys Arg Asp Phe Ile Pro Gly Lys Trp Ile Ile Asp Asn655 660 665ATC ATT GAC TCC ATT GAA AAG AGC CAC AAA ACT GTC TTT GTG CTT TCT 2112Ile Ile Asp Ser Ile Glu Lys Ser His Lys Thr Val Phe Val Leu Ser670 675 680GAA AAC TTT GTG AAG AGT GAG TGG TGC AAG TAT GAA CTG GAC TTC TCC 2160Glu Asn Phe Val Lys Ser Glu Trp Cys Lys Tyr Glu Leu Asp Phe Ser685 690 695CAT TTC CGT CTT TTT GAA GAG AAC AAT GAT GCT GCC ATT CTC ATT CTT 2208His Phe Arg Leu Phe Glu Glu Asn Asn Asp Ala Ala Ile Leu Ile Leu700 705 710CTG GAG CCC ATT GAG AAA AAA GCC ATT CCC CAG CGC TTC TGC AAG CTG 2256Leu Glu Pro Ile Glu Lys Lys Ala Ile Pro Gln Arg Phe Cys Lys Leu715 720 725 730CGG AAG ATA ATG AAC ACC AAG ACC TAC CTG GAG TGG CCC ATG GAC GAG 2304Arg Lys Ile Met Asn Thr Lys Thr Tyr Leu Glu Trp Pro Met Asp Glu735 740 745GCT CAG CGG GAA GGA TTT TGG GTA AAT CTG AGA GCT GCG ATA AAG TCC 2352Ala Gln Arg Glu Gly Phe Trp Val Asn Leu Arg Ala Ala Ile Lys Ser750 755 760TAG 2355(2)SEQ ID NO4的信息(i)顺序特征(A)长度784个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO4Met Pro His Thr Leu Trp Met Val Trp Val Leu Gly Val Ile Ile Ser-22 -20 -15 -10Leu Ser Lys Glu Glu Ser Ser Asn Gln Ala Ser Leu Ser Cys Asp Arg-51 5 10Asn Gly Ile Cys Lys Gly Ser Ser Gly Ser Leu Asn Ser Ile Pro Ser15 20 25Gly Leu Thr Glu Ala Val Lys Ser Leu Asp Leu Ser Asn Asn Arg Ile30 35 40Thr Tyr Ile Ser Asn Ser Asp Leu Gln Arg Cys Val Asn Leu Gln Ala45 50 55Leu Val Leu Thr Ser Asn Gly Ile Asn Thr Ile Glu Glu Asp Ser Phe60 65 70Ser Ser Leu Gly Ser Leu Glu His Leu Asp Leu Ser Tyr Asn Tyr Leu75 80 85 90Ser Asn Leu Ser Ser Ser Trp Phe Lys Pro Leu Ser Ser Leu Thr Phe95 100 105Leu Asn Leu Leu Gly Asn Pro Tyr Lys Thr Leu Gly Glu Thr Ser Leu110 115 120Phe Ser His Leu Thr Lys Leu Gln Ile Leu Arg Val Gly Asn Met Asp125 130 135Thr Phe Thr Lys Ile Gln Arg Lys Asp Phe Ala Gly Leu Thr Phe Leu140 145 150Glu Glu Leu Glu Ile Asp Ala Ser Asp Leu Gln Ser Tyr Glu Pro Lys155 160 165 170Ser Leu Lys Ser Ile Gln Asn Val Ser His Leu Ile Leu His Met Lys175 180 185Gln His Ile Leu Leu Leu Glu Ile Phe Val Asp Val Thr Ser Ser Val190 195 200Glu Cys Leu Glu Leu Arg Asp Thr Asp Leu Asp Thr Phe His Phe Ser205 210 215Glu Leu Ser Thr Gly Glu Thr Asn Ser Leu Ile Lys Lys Phe Thr Phe220 225 230Arg Asn Val Lys Ile Thr Asp Glu Ser Leu Phe Gln Val Met Lys Leu235 240 245 250Leu Asn Gln Ile Ser Gly Leu Leu Glu Leu Glu Phe Asp Asp Cys Thr255 260 265Leu Asn Gly Val Gly Asn Phe Arg Ala Ser Asp Asn Asp Arg Val Ile270 275 280Asp Pro Gly Lys Val Glu Thr Leu Thr Ile Arg Arg Leu His Ile Pro285 290 295Arg Phe Tyr Leu Phe Tyr Asp Leu Ser Thr Leu Tyr Ser Leu Thr Glu300 305 310Arg Val Lys Arg Ile Thr Val Glu Asn Ser Lys Val Phe Leu Val Pro315 320 325 330Cys Leu Leu Ser Gln His Leu Lys Ser Leu Glu Tyr Leu Asp Leu Ser335 340 345Glu Asn Leu Met Val Glu Glu Tyr Leu Lys Asn Ser Ala Cys Glu Asp350 355 360Ala Trp Pro Ser Leu Gln Thr Leu Ile Leu Arg Gln Asn His Leu Ala365 370 375Ser Leu Glu Lys Thr Gly Glu Thr Leu Leu Thr Leu Lys Asn Leu Thr380 385 390Asn Ile Asp Ile Ser Lys Asn Ser Phe His Ser Met Pro Glu Thr Cys395 400 405 410Gln Trp Pro Glu Lys Met Lys Tyr Leu Asn Leu Ser Ser Thr Arg Ile415 420 425His Ser Val Thr Gly Cys Ile Pro Lys Thr Leu Glu Ile Leu Asp Val430 435 440Ser Asn Asn Asn Leu Asn Leu Phe Ser Leu Asn Leu Pro Gln Leu Lys445 450 455Glu Leu Tyr Ile Ser Arg Asn Lys Leu Met Thr Leu Pro Asp Ala Ser460 465 470Leu Leu Pro Met Leu Leu Val Leu Lys Ile Ser Arg Asn Ala Ile Thr475 480 485 490Thr Phe Ser Lys Glu Gln Leu Asp Ser Phe His Thr Leu Lys Thr Leu495 500 505Glu Ala Gly Gly Asn Asn Phe Ile Cys Ser Cys Glu Phe Leu Ser Phe510 515 520Thr Gln Glu Gln Gln Ala Leu Ala Lys Val Leu Ile Asp Trp Pro Ala525 530 535Asn Tyr Leu Cys Asp Ser Pro Ser His Val Arg Gly Gln Gln Val Gln540 545 550Asp Val Arg Leu Ser Val Ser Glu Cys His Arg Thr Ala Leu Val Ser555 560 565 570Gly Met Cys Cys Ala Leu Phe Leu Leu Ile Leu Leu Thr Gly Val Leu575 580 585Cys His Arg Phe His Gly Leu Trp Tyr Met Lys Met Met Trp Ala Trp590 595 600Leu Gln Ala Lys Arg Lys Pro Arg Lys Ala Pro Ser Arg Asn Ile Cys605 610 615Tyr Asp Ala Phe Val Ser Tyr Ser Glu Arg Asp Ala Tyr Trp Val Glu620 625 630Asn Leu Met Val Gln Glu Leu Glu Asn Phe Asn Pro Pro Phe Lys Leu635 640 645 650Cys Leu His Lys Arg Asp Phe Ile Pro Gly Lys Trp Ile Ile Asp Asn655 660 665Ile Ile Asp Ser Ile Glu Lys Ser His Lys Thr Val Phe Val Leu Ser670 675 680Glu Asn Phe Val Lys Ser Glu Trp Cys Lys Tyr Glu Leu Asp Phe Ser685 690 695His Phe Arg Leu Phe Glu Glu Asn Asn Asp Ala Ala Ile Leu Ile Leu700 705 710Leu Glu Pro Ile Glu Lys Lys Ala Ile Pro Gln Arg Phe Cys Lys Leu715 720 725 730Arg Lys Ile Met Asn Thr Lys Thr Tyr Leu Glu Trp Pro Met Asp Glu735 740 745Ala Gln Arg Glu Gly Phe Trp Val Asn Leu Arg Ala Ala Ile Lys Ser750 755 760(2)SEQ ID NO5的信息(i)顺序特征(A)长度2715个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...2712(ix)特征(A)名称/关键词成熟肽(B)位置64...2712(xi)顺序描述SEQ ID NO5ATG AGA CAG ACT TTG CCT TGT ATC TAC TTT TGG GGG GGC CTT TTG CCC48Met Arg Gln Thr Leu Pro Cys Ile Tyr Phe Trp Gly Gly Leu Leu Pro-21 -20 -15 -10TTT GGG ATG CTG TGT GCA TCC TCC ACC ACC AAG TGC ACT GTT AGC CAT96Phe Gly Met Leu Cys Ala Ser Ser Thr Thr Lys Cys Thr Val Ser His-5 1 5 10GAA GTT GCT GAC TGC AGC CAC CTG AAG TTG ACT CAG GTA CCC GAT GAT 144Glu Val Ala Asp Cys Ser His Leu Lys Leu Thr Gln Val Pro Asp Asp15 20 25CTA CCC ACA AAC ATA ACA GTG TTG AAC CTT ACC CAT AAT CAA CTC AGA 192Leu Pro Thr Asn Ile Thr Val Leu Asn Leu Thr His Asn Gln Leu Arg30 35 40AGA TTA CCA GCC GCC AAC TTC ACA AGG TAT AGC CAG CTA ACT AGC TTG 240Arg Leu Pro Ala Ala Asn Phe Thr Arg Tyr Ser Gln Leu Thr Ser Leu45 50 55GAT GTA GGA TTT AAC ACC ATC TCA AAA CTG GAG CCA GAA TTG TGC CAG 288Asp Val Gly Phe Asn Thr Ile Ser Lys Leu Glu Pro Glu Leu Cys Gln60 65 70 75AAA CTT CCC ATG TTA AAA GTT TTG AAC CTC CAG CAC AAT GAG CTA TCT 336Lys Leu Pro Met Leu Lys Val Leu Asn Leu Gln His Asn Glu Leu Ser80 85 90CAA CTT TCT GAT AAA ACC TTT GCC TTC TGC ACG AAT TTG ACT GAA CTC 384Gln Leu Ser Asp Lys Thr Phe Ala Phe Cys Thr Asn Leu Thr Glu Leu95 100 105CAT CTC ATG TCC AAC TCA ATC CAG AAA ATT AAA AAT AAT CCC TTT GTC 432His Leu Met Ser Asn Ser Ile Gln Lys Ile Lys Asn Asn Pro Phe Val110 115 120AAG CAG AAG AAT TTA ATC ACA TTA GAT CTG TCT CAT AAT GGC TTG TCA 480Lys Gln Lys Asn Leu Ile Thr Leu Asp Leu Ser His Asn Gly Leu Ser125 130 135TCT ACA AAA TTA GGA ACT CAG GTT CAG CTG GAA AAT CTC CAA GAG CTT 528Ser Thr Lys Leu Gly Thr Gln Val Gln Leu Glu Asn Leu Gln Glu Leu140 145 150 155CTA TTA TCA AAC AAT AAA ATT CAA GCG CTA AAA AGT GAA GAA CTG GAT 576Leu Leu Ser Asn Asn Lys Ile Gln Ala Leu Lys Ser Glu Glu Leu Asp160 165 170ATC TTT GCC AAT TCA TCT TTA AAA AAA TTA GAG TTG TCA TCG AAT CAA 624Ile Phe Ala Asn Ser Ser Leu Lys Lys Leu Glu Leu Ser Ser Asn Gln175 180 185ATT AAA GAG TTT TCT CCA GGG TGT TTT CAC GCA ATT GGA AGA TTA TTT 672Ile Lys Glu Phe Ser Pro Gly Cys Phe His Ala Ile Gly Arg Leu Phe190 195 200GGC CTC TTT CTG AAC AAT GTC CAG CTG GGT CCC AGC CTT ACA GAG AAG 720Gly Leu Phe Leu Asn Asn Val Gln Leu Gly Pro Ser Leu Thr Glu Lys205 210 215CTA TGT TTG GAA TTA GCA AAC ACA AGC ATT CGG AAT CTG TCT CTG AGT 768Leu Cys Leu Glu Leu Ala Asn Thr Ser Ile Arg Asn Leu Ser Leu Ser220 225 230 235AAC AGC CAG CTG TCC ACC ACC AGC AAT ACA ACT TTC TTG GGA CTA AAG 816Asn Ser Gln Leu Ser Thr Thr Ser Asn Thr Thr Phe Leu Gly Leu Lys240 245 250TGG ACA AAT CTC ACT ATG CTC GAT CTT TCC TAC AAC AAC TTA AAT GTG 864Trp Thr Asn Leu Thr Met Leu Asp Leu Ser Tyr Asn Asn Leu Asn Val255 260 265GTT GGT AAC GAT TCC TTT GCT TGG CTT CCA CAA CTA GAA TAT TTC TTC 912Val Gly Asn Asp Ser Phe Ala Trp Leu Pro Gln Leu Glu Tyr Phe Phe270 275 280CTA GAG TAT AAT AAT ATA CAG CAT TTG TTT TCT CAC TCT TTG CAC GGG 960Leu Glu Tyr Asn Asn Ile Gln His Leu Phe Ser His Ser Leu His Gly285 290 295CTT TTC AAT GTG AGG TAC CTG AAT TTG AAA CGG TCT TTT ACT AAA CAA 1008Leu Phe Asn Val Arg Tyr Leu Asn Leu Lys Arg Ser Phe Thr Lys Gln300 305 310 315AGT ATT TCC CTT GCC TCA CTC CCC AAG ATT GAT GAT TTT TCT TTT CAG 1056Ser Ile Ser Leu Ala Ser Leu Pro Lys Ile Asp Asp Phe Ser Phe Gln320 325 330TGG CTA AAA TGT TTG GAG CAC CTT AAC ATG GAA GAT AAT GAT ATT CCA 1104Trp Leu Lys Cys Leu Glu His Leu Asn Met Glu Asp Asn Asp Ile Pro335 340 345GGC ATA AAA AGC AAT ATG TTC ACA GGA TTG ATA AAC CTG AAA TAC TTA 1152Gly Ile Lys Ser Asn Met Phe Thr Gly Leu Ile Asn Leu Lys Tyr Leu350 355 360AGT CTA TCC AAC TCC TTT ACA AGT TTG CGA ACT TTG ACA AAT GAA ACA 1200Ser Leu Ser Asn Ser Phe Thr Ser Leu Arg Thr Leu Thr Asn Glu Thr365 370 375TTT GTA TCA CTT GCT CAT TCT CCC TTA CAC ATA CTC AAC CTA ACC AAG 1248Phe Val Ser Leu Ala His Ser Pro Leu His Ile Leu Asn Leu Thr Lys380 385 390 395AAT AAA ATC TCA AAA ATA GAG AGT GAT GCT TTC TCT TGG TTG GGC CAC 1296Asn Lys Ile Ser Lys Ile Glu Ser Asp Ala Phe Ser Trp Leu Gly His400 405 410CTA GAA GTA CTT GAC CTG GGC CTT AAT GAA ATT GGG CAA GAA CTC ACA 1344Leu Glu Val Leu Asp Leu Gly Leu Asn Glu Ile Gly Gln Glu Leu Thr415 420 425GGC CAG GAA TGG AGA GGT CTA GAA AAT ATT TTC GAA ATC TAT CTT TCC 1392Gly Gln Glu Trp Arg Gly Leu Glu Asn Ile Phe Glu Ile Tyr Leu Ser430 435 440TAC AAC AAG TAC CTG CAG CTG ACT AGG AAC TCC TTT GCC TTG GTC CCA 1440Tyr Asn Lys Tyr Leu Gln Leu Thr Arg Asn Ser Phe Ala Leu Val Pro445 450 455AGC CTT CAA CGA CTG ATG CTC CGA AGG GTG GCC CTT AAA AAT GTG GAT 1488Ser Leu Gln Arg Leu Met Leu Arg Arg Val Ala Leu Lys Asn Val Asp460 465 470 475AGC TCT CCT TCA CCA TTC CAG CCT CTT CGT AAC TTG ACC ATT CTG GAT 1536Ser Ser Pro Ser Pro Phe Gln Pro Leu Arg Asn Leu Thr Ile Leu Asp480 485 490CTA AGC AAC AAC AAC ATA GCC AAC ATA AAT GAT GAC ATG TTG GAG GGT 1584Leu Ser Asn Asn Asn Ile Ala Asn Ile Asn Asp Asp Met Leu Glu Gly495 500 505CTT GAG AAA CTA GAA ATT CTC GAT TTG CAG CAT AAC AAC TTA GCA CGG 1632Leu Glu Lys Leu Glu Ile Leu Asp Leu Gln His Asn Asn Leu Ala Arg510 515 520CTC TGG AAA CAC GCA AAC CCT GGT GGT CCC ATT TAT TTC CTA AAG GGT 1680Leu Trp Lys His Ala Asn Pro Gly Gly Pro Ile Tyr Phe Leu Lys Gly525 530 535CTG TCT CAC CTC CAC ATC CTT AAC TTG GAG TCC AAC GGC TTT GAC GAG 1728Leu Ser His Leu His Ile Leu Asn Leu Glu Ser Asn Gly Phe Asp Glu540 545 550 555ATC CCA GTT GAG GTC TTC AAG GAT TTA TTT GAA CTA AAG ATC ATC GAT 1776Ile Pro Val Glu Val Phe Lys Asp Leu Phe Glu Leu Lys Ile Ile Asp560 565 570TTA GGA TTG AAT AAT TTA AAC ACA CTT CCA GCA TCT GTC TTT AAT AAT 1824Leu Gly Leu Asn Asn Leu Asn Thr Leu Pro Ala Ser Val Phe Asn Asn575 580 585CAG GTG TCT CTA AAG TCA TTG AAC CTT CAG AAG AAT CTC ATA ACA TCC 1872Gln Val Ser Leu Lys Ser Leu Asn Leu Gln Lys Asn Leu Ile Thr Ser590 595 600GTT GAG AAG AAG GTT TTC GGG CCA GCT TTC AGG AAC CTG ACT GAG TTA 1920Val Glu Lys Lys Val Phe Gly Pro Ala Phe Arg Asn Leu Thr Glu Leu605 610 615GAT ATG CGC TTT AAT CCC TTT GAT TGC ACG TGT GAA AGT ATT GCC TGG 1968Asp Met Arg Phe Asn Pro Phe Asp Cys Thr Cys Glu Ser Ile Ala Trp620 625 630 635TTT GTT AAT TGG ATT AAC GAG ACC CAT ACC AAC ATC CCT GAG CTG TCA 2016Phe Val Asn Trp Ile Asn Glu Thr His Thr Asn Ile Pro Glu Leu Ser640 645 650AGC CAC TAC CTT TGC AAC ACT CCA CCT CAC TAT CAT GGG TTC CCA GTG 2064Ser His Tyr Leu Cys Asn Thr Pro Pro His Tyr His Gly Phe Pro Val655 660 665AGA CTT TTT GAT ACA TCA TCT TGC AAA GAC AGT GCC CCC TTT GAA CTC 2112Arg Leu Phe Asp Thr Ser Ser Cys Lys Asp Ser Ala Pro Phe Glu Leu670 675 680TTT TTC ATG ATC AAT ACC AGT ATC CTG TTG ATT TTT ATC TTT ATT GTA 2160Phe Phe Met Ile Asn Thr Ser Ile Leu Leu Ile Phe Ile Phe Ile Val685 690 695CTT CTC ATC CAC TTT GAG GGC TGG AGG ATA TCT TTT TAT TGG AAT GTT 2208Leu Leu Ile His Phe Glu Gly Trp Arg Ile Ser Phe Tyr Trp Asn Val700 705 710 715TCA GTA CAT CGA GTT CTT GGT TTC AAA GAA ATA GAC AGA CAG ACA GAA 2256Ser Val His Arg Val Leu Gly Phe Lys Glu Ile Asp Arg Gln Thr Glu720 725 730CAG TTT GAA TAT GCA GCA TAT ATA ATT CAT GCC TAT AAA GAT AAG GAT 2304Gln Phe Glu Tyr Ala Ala Tyr Ile Ile His Ala Tyr Lys Asp Lys Asp735 740 745TGG GTC TGG GAA CAT TTC TCT TCA ATG GAA AAG GAA GAC CAA TCT CTC 2352Trp Val Trp Glu His Phe Ser Ser Met Glu Lys Glu Asp Gln Ser Leu750 755 760AAA TTT TGT CTG GAA GAA AGG GAC TTT GAG GCG GGT GTT TTT GAA CTA 2400Lys Phe Cys Leu Glu Glu Arg Asp Phe Glu Ala Gly Val Phe Glu Leu765 770 775GAA GCA ATT GTT AAC AGC ATC AAA AGA AGC AGA AAA ATT ATT TTT GTT 2448Glu Ala Ile Val Asn Ser Ile Lys Arg Ser Arg Lys Ile Ile Phe Val780 785 790 795ATA ACA CAC CAT CTA TTA AAA GAC CCA TTA TGC AAA AGA TTC AAG GTA 2496Ile Thr His His Leu Leu Lys Asp Pro Leu Cys Lys Arg Phe Lys Val800 805 810CAT CAT GCA GTT CAA CAA GCT ATT GAA CAA AAT CTG GAT TCC ATT ATA 2544His His Ala Val Gln Gln Ala Ile Glu Gln Asn Leu Asp Ser Ile Ile815 820 825TTG GTT TTC CTT GAG GAG ATT CCA GAT TAT AAA CTG AAC CAT GCA CTC 2592Leu Val Phe Leu Glu Glu Ile Pro Asp Tyr Lys Leu Asn His Ala Leu830 835 840TGT TTG CGA AGA GGA ATG TTT AAA TCT CAC TGC ATC TTG AAC TGG CCA 2640Cys Leu Arg Arg Gly Met Phe Lys Ser His Cys Ile Leu Asn Trp Pro845 850 855GTT CAG AAA GAA CGG ATA GGT GCC TTT CGT CAT AAA TTG CAA GTA GCA 2688Val Gln Lys Glu Arg Ile Gly Ala Phe Arg His Lys Leu Gln Val Ala860 865 870 875CTT GGA TCC AAA AAC TCT GTA CAT TAA 2715Leu Gly Ser Lys Asn Ser Val His880(2)SEQ ID NO6的信息(i)顺序特征(A)长度904个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO6Met Arg Gln Thr Leu Pro Cys Ile Tyr Phe Trp Gly Gly Leu Leu Pro-21 -20 -15 -10Phe Gly Met Leu Cys Ala Ser Ser Thr Thr Lys Cys Thr Val Ser His-5 1 5 10Glu Val Ala Asp Cys Ser His Leu Lys Leu Thr Gln Val Pro Asp Asp15 20 25Leu Pro Thr Asn Ile Thr Val Leu Asn Leu Thr His Asn Gln Leu Arg30 35 40Arg Leu Pro Ala Ala Asn Phe Thr Arg Tyr Ser Gln Leu Thr Ser Leu45 50 55Asp Val Gly Phe Asn Thr Ile Ser Lys Leu Glu Pro Glu Leu Cys Gln60 65 70 75Lys Leu Pro Met Leu Lys Val Leu Asn Leu Gln His Asn Glu Leu Ser80 85 90Gln Leu Ser Asp Lys Thr Phe Ala Phe Cys Thr Asn Leu Thr Glu Leu95 100 105His Leu Met Ser Asn Ser Ile Gln Lys Ile Lys Asn Asn Pro Phe Val110 115 120Lys Gln Lys Asn Leu Ile Thr Leu Asp Leu Ser His Asn Gly Leu Ser125 130 135Ser Thr Lys Leu Gly Thr Gln Val Gln Leu Glu Asn Leu Gln Glu Leu140 145 150 155Leu Leu Ser Asn Asn Lys Ile Gln Ala Leu Lys Ser Glu Glu Leu Asp160 165 170Ile Phe Ala Asn Ser Ser Leu Lys Lys Leu Glu Leu Ser Ser Asn Gln175 180 185Ile Lys Glu Phe Ser Pro Gly Cys Phe His Ala Ile Gly Arg Leu Phe190 195 200Gly Leu Phe Leu Asn Asn Val Gln Leu Gly Pro Ser Leu Thr Glu Lys205 210 215Leu Cys Leu Glu Leu Ala Asn Thr Ser Ile Arg Asn Leu Ser Leu Ser220 225 230 235Asn Ser Gln Leu Ser Thr Thr Ser Asn Thr Thr Phe Leu Gly Leu Lys240 245 250Trp Thr Asn Leu Thr Met Leu Asp Leu Ser Tyr Asn Asn Leu Asn Val255 260 265Val Gly Asn Asp Ser Phe Ala Trp Leu Pro Gln Leu Glu Tyr Phe Phe270 275 280Leu Glu Tyr Asn Asn Ile Gln His Leu Phe Ser His Ser Leu His Gly285 290 295Leu Phe Asn Val Arg Tyr Leu Asn Leu Lys Arg Ser Phe Thr Lys Gln300 305 310 315Ser Ile Ser Leu Ala Ser Leu Pro Lys Ile Asp Asp Phe Ser Phe Gln320 325 330Trp Leu Lys Cys Leu Glu His Leu Asn Met Glu Asp Asn Asp Ile Pro335 340 345Gly Ile Lys Ser Asn Met Phe Thr Gly Leu Ile Asn Leu Lys Tyr Leu350 355 360Ser Leu Ser Asn Ser Phe Thr Ser Leu Arg Thr Leu Thr Asn Glu Thr365 370 375Phe Val Ser Leu Ala His Ser Pro Leu His Ile Leu Asn Leu Thr Lys380 385 390 395Asn Lys Ile Ser Lys Ile Glu Ser Asp Ala Phe Ser Trp Leu Gly His400 405 410Leu Glu Val Leu Asp Leu Gly Leu Asn Glu Ile Gly Gln Glu Leu Thr415 420 425Gly Gln Glu Trp Arg Gly Leu Glu Asn Ile Phe Glu Ile Tyr Leu Ser430 435 440Tyr Asn Lys Tyr Leu Gln Leu Thr Arg Asn Ser Phe Ala Leu Val Pro445 450 455Ser Leu Gln Arg Leu Met Leu Arg Arg Val Ala Leu Lys Asn Val Asp460 465 470 475Ser Ser Pro Ser Pro Phe Gln Pro Leu Arg Asn Leu Thr Ile Leu Asp480 485 490Leu Ser Asn Asn Asn Ile Ala Asn Ile Asn Asp Asp Met Leu Glu Gly495 500 505Leu Glu Lys Leu Glu Ile Leu Asp Leu Gln His Asn Asn Leu Ala Arg510 515 520Leu Trp Lys His Ala Asn Pro Gly Gly Pro Ile Tyr Phe Leu Lys Gly525 530 535Leu Ser His Leu His Ile Leu Asn Leu Glu Ser Asn Gly Phe Asp Glu540 545 550 555Ile Pro Val Glu Val Phe Lys Asp Leu Phe Glu Leu Lys Ile Ile Asp560 565 570Leu Gly Leu Asn Asn Leu Asn Thr Leu Pro Ala Ser Val Phe Asn Asn575 580 585Gln Val Ser Leu Lys Ser Leu Asn Leu Gln Lys Asn Leu Ile Thr Ser590 595 600Val Glu Lys Lys Val Phe Gly Pro Ala Phe Arg Asn Leu Thr Glu Leu605 610 615Asp Met Arg Phe Asn Pro Phe Asp Cys Thr Cys Glu Ser Ile Ala Trp620 625 630 635Phe Val Asn Trp Ile Asn Glu Thr His Thr Asn Ile Pro Glu Leu Ser640 645 650Ser His Tyr Leu Cys Asn Thr Pro Pro His Tyr His Gly Phe Pro Val655 660 665Arg Leu Phe Asp Thr Ser Ser Cys Lys Asp Ser Ala Pro Phe Glu Leu670 675 680Phe Phe Met Ile Asn Thr Ser Ile Leu Leu Ile Phe Ile Phe Ile Val685 690 695Leu Leu Ile His Phe Glu Gly Trp Arg Ile Ser Phe Tyr Trp Asn Val700 705 710 715Ser Val His Arg Val Leu Gly Phe Lys Glu Ile Asp Arg Gln Thr Glu720 725 730Gln Phe Glu Tyr Ala Ala Tyr Ile Ile His Ala Tyr Lys Asp Lys Asp735 740 745Trp Val Trp Glu His Phe Ser Ser Met Glu Lys Glu Asp Gln Ser Leu750 755 760Lys Phe Cys Leu Glu Glu Arg Asp Phe Glu Ala Gly Val Phe Glu Leu765 770 775Glu Ala Ile Val Asn Ser Ile Lys Arg Ser Arg Lys Ile Ile Phe Val780 785 790 795Ile Thr His His Leu Leu Lys Asp Pro Leu Cys Lys Arg Phe Lys Val800 805 810His His Ala Val Gln Gln Ala Ile Glu Gln Asn Leu Asp Ser Ile Ile815 820 825Leu Val Phe Leu Glu Glu Ile Pro Asp Tyr Lys Leu Asn His Ala Leu830 835 840Cys Leu Arg Arg Gly Met Phe Lys Ser His Cys Ile Leu Asn Trp Pro845 850 855Val Gln Lys Glu Arg Ile Gly Ala Phe Arg His Lys Leu Gln Val Ala860 865 870 875Leu Gly Ser Lys Asn Ser Val His880(2)SEQ ID NO7的信息(i)顺序特征(A)长度2400个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...2397(xi)顺序描述SEQ ID NO7ATG GAG CTG AAT TTC TAC AAA ATC CCC GAC AAC CTC CCC TTC TCA ACC48Met Glu Leu Asn Phe Tyr Lys Ile Pro Asp Asn Leu Pro Phe Ser Thr1 5 10 15AAG AAC CTG GAC CTG AGC TTT AAT CCC CTG AGG CAT TTA GGC AGC TAT96Lys Asn Leu Asp Leu Ser Phe Asn Pro Leu Arg His Leu Gly Ser Tyr20 25 30AGC TTC TTC AGT TTC CCA GAA CTG CAG GTG CTG GAT TTA TCC AGG TGT 144Ser Phe Phe Ser Phe Pro Glu Leu Gln Val Leu Asp Leu Ser Arg Cys35 40 45GAA ATC CAG ACA ATT GAA GAT GGG GCA TAT CAG AGC CTA AGC CAC CTC 192Glu Ile Gln Thr Ile Glu Asp Gly Ala Tyr Gln Ser Leu Ser His Leu50 55 60TCT ACC TTA ATA TTG ACA GGA AAC CCC ATC CAG AGT TTA GCC CTG GGA 240Ser Thr Leu Ile Leu Thr Gly Asn Pro Ile Gln Ser Leu Ala Leu Gly65 70 75 80GCC TTT TCT GGA CTA TCA AGT TTA CAG AAG CTG GTG GCT GTG GAG ACA 288Ala Phe Ser Gly Leu Ser Ser Leu Gln Lys Leu Val Ala Val Glu Thr85 90 95AAT CTA GCA TCT CTA GAG AAC TTC CCC ATT GGA CAT CTC AAA ACT TTG 336Asn Leu Ala Ser Leu Glu Asn Phe Pro Ile Gly His Leu Lys Thr Leu100 105 110AAA GAA CTT AAT GTG GCT CAC AAT CTT ATC CAA TCT TTC AAA TTA CCT 384Lys Glu Leu Asn Val Ala His Asn Leu Ile Gln Ser Phe Lys Leu Pro115 120 125GAG TAT TTT TCT AAT CTG ACC AAT CTA GAG CAC TTG GAC CTT TCC AGC 432Glu Tyr Phe Ser Asn Leu Thr Asn Leu Glu His Leu Asp Leu Ser Ser130 135 140AAC AAG ATT CAA AGT ATT TAT TGC ACA GAC TTG CGG GTT CTA CAT CAA 480Asn Lys Ile Gln Ser Ile Tyr Cys Thr Asp Leu Arg Val Leu His Gln145 150 155 160ATG CCC CTA CTC AAT CTC TCT TTA GAC CTG TCC CTG AAC CCT ATG AAC 528Met Pro Leu Leu Asn Leu Ser Leu Asp Leu Ser Leu Asn Pro Met Asn165 170 175TTT ATC CAA CCA GGT GCA TTT AAA GAA ATT AGG CTT CAT AAG CTG ACT 576Phe Ile Gln Pro Gly Ala Phe Lys Glu Ile Arg Leu His Lys Leu Thr180 185 190TTA AGA AAT AAT TTT GAT AGT TTA AAT GTA ATG AAA ACT TGT ATT CAA 624Leu Arg Asn Asn Phe Asp Ser Leu Asn Val Met Lys Thr Cys Ile Gln195 200 205GGT CTG GCT GGT TTA GAA GTC CAT CGT TTG GTT CTG GGA GAA TTT AGA 672Gly Leu Ala Gly Leu Glu Val His Arg Leu Val Leu Gly Glu Phe Arg210 215 220AAT GAA GGA AAC TTG GAA AAG TTT GAC AAA TCT GCT CTA GAG GGC CTG 720Asn Glu Gly Asn Leu Glu Lys Phe Asp Lys Ser Ala Leu Glu Gly Leu225 230 235 240TGC AAT TTG ACC ATT GAA GAA TTC CGA TTA GCA TAC TTA GAC TAC TAC 768Cys Asn Leu Thr Ile Glu Glu Phe Arg Leu Ala Tyr Leu Asp Tyr Tyr245 250 255CTC GAT GAT ATT ATT GAC TTA TTT AAT TGT TTG ACA AAT GTT TCT TCA 816Leu Asp Asp Ile Ile Asp Leu Phe Asn Cys Leu Thr Asn Val Ser Ser260 265 270TTT TCC CTG GTG AGT GTG ACT ATT GAA AGG GTA AAA GAC TTT TCT TAT 864Phe Ser Leu Val Ser Val Thr Ile Glu Arg Val Lys Asp Phe Ser Tyr275 280 285AAT TTC GGA TGG CAA CAT TTA GAA TTA GTT AAC TGT AAA TTT GGA CAG 912Asn Phe Gly Trp Gln His Leu Glu Leu Val Asn Cys Lys Phe Gly Gln290 295 300TTT CCC ACA TTG AAA CTC AAA TCT CTC AAA AGG CTT ACT TTC ACT TCC 960Phe Pro Thr Leu Lys Leu Lys Ser Leu Lys Arg Leu Thr Phe Thr Ser305 310 315 320AAC AAA GGT GGG AAT GCT TTT TCA GAA GTT GAT CTA CCA AGC CTT GAG 1008Asn Lys Gly Gly Asn Ala Phe Ser Glu Val Asp Leu Pro Ser Leu Glu325 330 335TTT CTA GAT GTC AGT AGA AAT GGC TTG AGT TTC AAA GGT TGC TGT TCT 1056Phe Leu Asp Leu Ser Arg Asn Gly Leu Ser Phe Lys Gly Cys Cys Ser340 345 350CAA AGT GAT TTT GGG ACA ACC AGC CTA AAG TAT TTA GAT CTG AGC TTC 1104Gln Ser Asp Phe Gly Thr Thr Ser Leu Lys Tyr Leu Asp Leu Ser Phe355 360 365AAT GGT GTT ATT ACC ATG AGT TCA AAC TTC TTG GGC TTA GAA CAA CTA 1152Asn Gly Val Ile Thr Met Ser Ser Asn Phe Leu Gly Leu Glu Gln Leu370 375 380GAA CAT CTG GAT TTC CAG CAT TCC AAT TTG AAA CAA ATG AGT GAG TTT 1200Glu His Leu Asp Phe Gln His Ser Asn Leu Lys Gln Met Ser Glu Phe385 390 395 400TCA GTA TTC CTA TCA CTC AGA AAC CTC ATT TAC CTT GAC ATT TCT CAT 1248Ser Val Phe Leu Ser Leu Arg Asn Leu Ile Tyr Leu Asp Ile Ser His405 410 415ACT CAC ACC AGA GTT GCT TTC AAT GGC ATC TTC AAT GGC TTG TCC AGT 1296Thr His Thr Arg Val Ala Phe Asn Gly Ile Phe Asn Gly Leu Ser Ser420 425 430CTC GAA GTC TTG AAA ATG GCT GGC AAT TCT TTC CAG GAA AAC TTC CTT 1344Leu Glu Val Leu Lys Met Ala Gly Asn Ser Phe Gln Glu Asn Phe Leu435 440 445CCA GAT ATC TTC ACA GAG CTG AGA AAC TTG ACC TTC CTG GAC CTC TCT 1392Pro Asp Ile Phe Thr Glu Leu Arg Asn Leu Thr Phe Leu Asp Leu Ser450 455 460CAG TGT CAA CTG GAG CAG TTG TCT CCA ACA GCA TTT AAC TCA CTC TCC 1440Gln Cys Gln Leu Glu Gln Leu Ser Pro Thr Ala Phe Asn Ser Leu Ser465 470 475 480AGT CTT CAG GTA CTA AAT ATG AGC CAC AAC AAC TTC TTT TCA TTG GAT 1488Ser Leu Gln Val Leu Asn Met Ser His Asn Asn Phe Phe Ser Leu Asp485 490 495ACG TTT CCT TAT AAG TGT CTG AAC TCC CTC CAG GTT CTT GAT TAC AGT 1536Thr Phe Pro Tyr Lys Cys Leu Asn Ser Leu Gln Val Leu Asp Tyr Ser500 505 510CTC AAT CAC ATA ATG ACT TCC AAA AAA CAG GAA CTA CAG CAT TTT CCA 1584Leu Asn His Ile Met Thr Ser Lys Lys Gln Glu Leu Gln His Phe Pro515 520 525AGT AGT CTA GCT TTC TTA AAT CTT ACT CAG AAT GAC TTT GCT TGT ACT 1632Ser Ser Leu Ala Phe Leu Asn Leu Thr Gln Asn Asp Phe Ala Cys Thr530 535 540TGT GAA CAC CAG AGT TTC CTG CAA TGG ATC AAG GAC CAG AGG CAG CTC 1680Cys Glu His Gln Ser Phe Leu Gln Trp Ile Lys Asp Gln Arg Gln Leu545 550 555 560TTG GTG GAA GTT GAA CGA ATG GAA TGT GCA ACA CCT TCA GAT AAG CAG 1728Leu Val Glu Val Glu Arg Met Glu Cys Ala Thr Pro Ser Asp Lys Gln565 570 575GGC ATG CCT GTG CTG AGT TTG AAT ATC ACC TGT CAG ATG AAT AAG ACC 1776Gly Met Pro Val Leu Ser Leu Asn Ile Thr Cys Gln Met Asn Lys Thr580 585 590ATC ATT GGT GTG TCG GTC CTC AGT GTG CTT GTA GTA TCT GTT GTA GCA 1824Ile Ile Gly Val Ser Val Leu Ser Val Leu Val Val Ser Val Val Ala595 600 605GTT CTG GTC TAT AAG TTC TAT TTT CAC CTG ATG CTT CTT GCT GGC TGC 1872Val Leu Val Tyr Lys Phe Tyr Phe His Leu Met Leu Leu Ala Gly Cys610 615 620ATA AAG TAT GGT AGA GGT GAA AAC ATC TAT GAT GCC TTT GTT ATC TAC 1920Ile Lys Tyr Gly Arg Gly Glu Asn Ile Tyr Asp Ala Phe Val Ile Tyr625 630 635 640TCA AGC CAG GAT GAG GAC TGG GTA AGG AAT GAG CTA GTA AAG AAT TTA 1968Ser Ser Gln Asp Glu Asp Trp Val Arg Asn Glu Leu Val Lys Asn Leu645 650 655GAA GAA GGG GTG CCT CCA TTT CAG CTC TGC CTT CAC TAC AGA GAC TTT 2016Glu Glu Gly Val Pro Pro Phe Gln Leu Cys Leu His Tyr Arg Asp Phe660 665 670ATT CCC GGT GTG GCC ATT GCT GCC AAC ATC ATC CAT GAA GGT TTC CAT 2064Ile Pro Gly Val Ala Ile Ala Ala Asn Ile Ile His Glu Gly Phe His675 680 685AAA AGC CGA AAG GTG ATT GTT GTG GTG TCC CAG CAC TTC ATC CAG AGC 2112Lys Ser Arg Lys Val Ile Val Val Val Ser Gln His Phe Ile Gln Ser690 695 700CGC TGG TGT ATC TTT GAA TAT GAG ATT GCT CAG ACC TGG CAG TTT CTG 2160Arg Trp Cys Ile Phe Glu Tyr Glu Ile Ala Gln Thr Trp Gln Phe Leu705 710 715 720AGC AGT CGT GCT GGT ATC ATC TTC ATT GTC CTG CAG AAG GTG GAG AAG 2208Ser Ser Arg Ala Gly Ile Ile Phe Ile Val Leu Gln Lys Val Glu Lys725 730 735ACC CTG CTC AGG CAG CAG GTG GAG CTG TAC CGC CTT CTC AGC AGG AAC 2256Thr Leu Leu Arg Gln Gln Val Glu Leu Tyr Arg Leu Leu Ser Arg Asn740 745 750ACT TAC CTG GAG TGG GAG GAC AGT GTC CTG GGG CGG CAC ATC TTC TGG 2304Thr Tyr Leu Glu Trp Glu Asp Ser Val Leu Gly Arg His Ile Phe Trp755 760 765AGA CGA CTC AGA AAA GCC CTG CTG GAT GGT AAA TCA TGG AAT CCA GAA 2352Arg Arg Leu Arg Lys Ala Leu Leu Asp Gly Lys Ser Trp Asn Pro Glu770 775 780GGA ACA GTG GGT ACA GGA TGC AAT TGG CAG GAA GCA ACA TCT ATC 2397Gly Thr Val Gly Thr Gly Cys Asn Trp Gln Glu Ala Thr Ser Ile785 790 795TGA 2400(2)SEQ ID NO8的信息(i)顺序特征(A)长度799个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO8Met Glu Leu Asn Phe Tyr Lys Ile Pro Asp Asn Leu Pro Phe Ser Thr1 5 10 15Lys Asn Leu Asp Leu Ser Phe Asn Pro Leu Arg His Leu Gly Ser Tyr20 25 30Ser Phe Phe Ser Phe Pro Glu Leu Gln Val Leu Asp Leu Ser Arg Cys35 40 45Glu Ile Gln Thr Ile Glu Asp Gly Ala Tyr Gln Ser Leu Ser His Leu50 55 60Ser Thr Leu Ile Leu Thr Gly Asn Pro Ile Gln Ser Leu Ala Leu Gly65 70 75 80Ala Phe Ser Gly Leu Ser Ser Leu Gln Lys Leu Val Ala Val Glu Thr85 90 95Asn Leu Ala Ser Leu Glu Asn Phe Pro Ile Gly His Leu Lys Thr Leu100 105 110Lys Glu Leu Asn Val Ala His Asn Leu Ile Gln Ser Phe Lys Leu Pro115 120 125Glu Tyr Phe Ser Asn Leu Thr Asn Leu Glu His Leu Asp Leu Ser Ser130 135 140Asn Lys Ile Gln Ser Ile Tyr Cys Thr Asp Leu Arg Val Leu His Gln145 150 155 160Met Pro Leu Leu Asn Leu Ser Leu Asp Leu Ser Leu Asn Pro Met Asn165 170 175Phe Ile Gln Pro Gly Ala Phe Lys Glu Ile Arg Leu His Lys Leu Thr180 185 190Leu Arg Asn Asn Phe Asp Ser Leu Asn Val Met Lys Thr Cys Ile Gln195 200 205Gly Leu Ala Gly Leu Glu Val His Arg Leu Val Leu Gly Glu Phe Arg210 215 220Asn Glu Gly Asn Leu Glu Lys Phe Asp Lys Ser Ala Leu Glu Gly Leu225 230 235 240Cys Asn Leu Thr Ile Glu Glu Phe Arg Leu Ala Tyr Leu Asp Tyr Tyr245 250 255Leu Asp Asp Ile Ile Asp Leu Phe Asn Cys Leu Thr Asn Val Ser Ser260 265 270Phe Ser Leu Val Ser Val Thr Ile Glu Arg Val Lys Asp Phe Ser Tyr275 280 285Asn Phe Gly Trp Gln His Leu Glu Leu Val Asn Cys Lys Phe Gly Gln290 295 300Phe Pro Thr Leu Lys Leu Lys Ser Leu Lys Arg Leu Thr Phe Thr Ser305 310 315 320Asn Lys Gly Gly Asn Ala Phe Ser Glu Val Asp Leu Pro Ser Leu Glu325 330 335Phe Leu Asp Leu Ser Arg Asn Gly Leu Ser Phe Lys Gly Cys Cys Ser340 345 350Gln Ser Asp Phe Gly Thr Thr Ser Leu Lys Tyr Leu Asp Leu Ser Phe355 360 365Asn Gly Val Ile Thr Met Ser Ser Asn Phe Leu Gly Leu Glu Gln Leu370 375 380Glu His Leu Asp Phe Gln His Ser Asn Leu Lys Gln Met Ser Glu Phe385 390 395 400Ser Val Phe Leu Ser Leu Arg Asn Leu Ile Tyr Leu Asp Ile Ser His405 410 415Thr His Thr Arg Val Ala Phe Asn Gly Ile Phe Asn Gly Leu Ser Ser420 425 430Leu Glu Val Leu Lys Met Ala Gly Asn Ser Phe Gln Glu Asn Phe Leu435 440 445Pro Asp Ile Phe Thr Glu Leu Arg Asn Leu Thr Phe Leu Asp Leu Ser450 455 460Gln Cys Gln Leu Glu Gln Leu Ser Pro Thr Ala Phe Asn Ser Leu Ser465 470 475 480Ser Leu Gln Val Leu Asn Met Ser His Asn Asn Phe Phe Ser Leu Asp485 490 495Thr Phe Pro Tyr Lys Cys Leu Asn Ser Leu Gln Val Leu Asp Tyr Ser500 505 510Leu Asn His Ile Met Thr Ser Lys Lys Gln Glu Leu Gln His Phe Pro515 520 525Ser Ser Leu Ala Phe Leu Asn Leu Thr Gln Asn Asp Phe Ala Cys Thr530 535 540Cys Glu His Gln Ser Phe Leu Gln Trp Ile Lys Asp Gln Arg Gln Leu545 550 555 560Leu Val Glu Val Glu Arg Met Glu Cys Ala Thr Pro Ser Asp Lys Gln565 570 575Gly Met Pro Val Leu Ser Leu Asn Ile Thr Cys Gln Met Asn Lys Thr580 585 590Ile Ile Gly Val Ser Val Leu Ser Val Leu Val Val Ser Val Val Ala595 600 605Val Leu Val Tyr Lys Phe Tyr Phe His Leu Met Leu Leu Ala Gly Cys610 615 620Ile Lys Tyr Gly Arg Gly Glu Asn Ile Tyr Asp Ala Phe Val Ile Tyr625 630 635 640Ser Ser Gln Asp Glu Asp Trp Val Arg Asn Glu Leu Val Lys Asn Leu645 650 655Glu Glu Gly Val Pro Pro Phe Gln Leu Cys Leu His Tyr Arg Asp Phe660 665 670Ile Pro Gly Val Ala Ile Ala Ala Asn Ile Ile His Glu Gly Phe His675 680 685Lys Ser Arg Lys Val Ile Val Val Val Ser Gln His Phe Ile Gln Ser690695 700Arg Trp Cys Ile Phe Glu Tyr Glu Ile Ala Gln Thr Trp Gln Phe Leu705 710 715 720Ser Ser Arg Ala Gly Ile Ile Phe Ile Val Leu Gln Lys Val Glu Lys725 730 735Thr Leu Leu Arg Gln Gln Val Glu Leu Tyr Arg Leu Leu Ser Arg Asn740 745 750Thr Tyr Leu Glu Trp Glu Asp Ser Val Leu Gly Arg His Ile Phe Trp755 760 765Arg Arg Leu Arg Lys Ala Leu Leu Asp Gly Lys Ser Trp Ash Pro Glu770 775 780Gly Thr Val Gly Thr Gly Cys Asn Trp Gln Glu Ala Thr Ser Ile785 790 795(2)SEQ ID NO9的信息(i)顺序特征(A)长度1275个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置l...1095(xi)顺序描述SEQ ID NO9TGT TGG GAT GTT TTT GAG GGA CTT TCT CAT CTT CAA GTT CTG TAT TTG48Cys Trp Asp Val Phe Glu Gly Leu Ser His Leu Gln Val Leu Tyr Leu1 5 10 15AAT CAT AAC TAT CTT AAT TCC CTT CCA CCA GGA GTA TTT AGC CAT CTG96Asn His Asn Tyr Leu Asn Ser Leu Pro Pro Gly Val Phe Ser His Leu20 25 30ACT GCA TTA AGG GGA CTA AGC CTC AAC TCC AAC AGG CTG ACA GTT CTT 144Thr Ala Leu Arg Gly Leu Ser Leu Asn Ser Asn Arg Leu Thr Val Leu35 40 45TCT CAC AAT GAT TTA CCT GCT AAT TTA GAG ATC CTG GAC ATA TCC AGG 192Ser His Asn Asp Leu Pro Ala Asn Leu Glu Ile Leu Asp Ile Ser Arg50 55 60AAC CAG CTC CTA GCT CCT AAT CCT GAT GTA TTT GTA TCA CTT AGT GTC 240Asn Gln Leu Leu Ala Pro Asn Pro Asp Val Phe Val Ser Leu Ser Val65 70 75 80TTG GAT ATA ACT CAT AAC AAG TTC ATT TGT GAA TGT GAA CTT AGC ACT 288Leu Asp Ile Thr His Asn Lys Phe Ile Cys Glu Cys Glu Leu Ser Thr85 90 95TTT ATC AAT TGG CTT AAT CAC ACC AAT GTC ACT ATA GCT GGG CCT CCT 336Phe Ile Asn Trp Leu Asn His Thr Asn Val Thr Ile Ala Gly Pro Pro100 105 110GCA GAC ATA TAT TGT GTG TAC CCT GAC TCG TTC TCT GGG GTT TCC CTC 384Ala Asp Ile Tyr Cys Val Tyr Pro Asp Ser Phe Ser Gly Val Ser Leu115 120 125TTC TCT CTT TCC ACG GAA GGT TGT GAT GAA GAG GAA GTC TTA AAG TCC 432Phe Ser Leu Ser Thr Glu Gly Cys Asp Glu Glu Glu Val Leu Lys Ser130 135 140CTA AAG TTC TCC CTT TTC ATT GTA TGC ACT GTC ACT CTG ACT CTG TTC 480Leu Lys Phe Ser Leu Phe Ile Val Cys Thr Val Thr Leu Thr Leu Phe145 150 155 160CTC ATG ACC ATC CTC ACA GTC ACA AAG TTC CGG GGC TTC TGT TTT ATC 528Leu Met Thr Ile Leu Thr Val Thr Lys Phe Arg Gly Phe Cys Phe Ile165 170 175TGT TAT AAG ACA GCC CAG AGA CTG GTG TTC AAG GAC CAT CCC CAG GGC 576Cys Tyr Lys Thr Ala Gln Arg Leu Val Phe Lys Asp His Pro Gln Gly180 185 190ACA GAA CCT GAT ATG TAC AAA TAT GAT GCC TAT TTG TGC TTC AGC AGC 624Thr Glu Pro Asp Met Tyr Lys Tyr Asp Ala Tyr Leu Cys Phe Ser Ser195 200 205AAA GAC TTC ACA TGG GTG CAG AAT GCT TTG CTC AAA CAC CTG GAC ACT 672Lys Asp Phe Thr Trp Val Gln Asn Ala Leu Leu Lys His Leu Asp Thr210 215 220CAA TAC AGT GAC CAA AAC AGA TTC AAC CTG TGC TTT GAA GAA AGA GAC 720Gln Tyr Ser Asp Gln Asn Arg Phe Asn Leu Cys Phe Glu Glu Arg Asp225 230 235 240TTT GTC CCA GGA GAA AAC CGC ATT GCC AAT ATC CAG GAT GCC ATC TGG 768Phe Val Pro Gly Glu Asn Arg Ile Ala Asn Ile Gln Asp Ala Ile Trp245 250 255AAC AGT AGA AAG ATC GTT TGT CTT GTG AGC AGA CAC TTC CTT AGA GAT 816Asn Ser Arg Lys Ile Val Cys Leu Val Ser Arg His Phe Leu Arg Asp260 265 270GGC TGG TGC CTT GAA GCC TTC AGT TAT GCC CAG GGC AGG TGC TTA TCT 864Gly Trp Cys Leu Glu Ala Phe Ser Tyr Ala Gln Gly Arg Cys Leu Ser275 280 285GAC CTT AAC AGT GCT CTC ATC ATG GTG GTG GTT GGG TCC TTG TCC CAG 912Asp Leu Asn Ser Ala Leu Ile Met Val Val Val Gly Ser Leu Ser Gln290 295 300TAC CAG TTG ATG AAA CAT CAA TCC ATC AGA GGC TTT GTA CAG AAA CAG 960Tyr Gln Leu Met Lys His Gln Ser Ile Arg Gly Phe Val Gln Lys Gln305 310 315 320CAG TAT TTG AGG TGG CCT GAG GAT CTC CAG GAT GTT GGC TGG TTT CTT 1008Gln Tyr Leu Arg Trp Pro Glu Asp Leu Gln Asp Val Gly Trp Phe Leu325 330 335CAT AAA CTC TCT CAA CAG ATA CTA AAG AAA GAA AAG GAA AAG AAG AAA 1056His Lys Leu Ser Gln Gln Ile Leu Lys Lys Glu Lys Glu Lys Lys Lys340 345 350GAC AAT AAC ATT CCG TTG CAA ACT GTA GCA ACC ATC TCC TAATCAAAGG 1105Asp Asn Asn Ile Pro Leu Gln Thr Val Ala Thr Ile Ser355 360 365AGCAATTTCC AACTTATCTC AAGCCACAAA TAACTCTTCA CTTTGTATTT GCACCAAGTT1165ATCATTTTGG GGTCCTCTCT GGAGGTTTTT TTTTTCTTTT TGCTACTATG AAAACAACAT1225AAATCTCTCA ATTTTCGTAT CAAAAAAAAA AAAAAAAAAA TGGCGGCCGC 1275(2)SEQ ID NO10的信息(i)顺序特征(A)长度365个氨基酸(B)类型氨基酸(D)拓扑学线性
(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO10Cys Trp Asp Val Phe Glu Gly Leu Ser His Leu Gln Val Leu Tyr Leu1 5 10 15Asn His Asn Tyr Leu Asn Ser Leu Pro Pro Gly Val Phe Ser His Leu20 25 30Thr Ala Leu Arg Gly Leu Ser Leu Asn Ser Asn Arg Leu Thr Val Leu35 40 45Ser His Asn Asp Leu Pro Ala Asn Leu Glu Ile Leu Asp Ile Ser Arg50 55 60Asn Gln Leu Leu Ala Pro Asn Pro Asp Val Phe Val Ser Leu Ser Val65 70 75 80Leu Asp Ile Thr His Asn Lys Phe Ile Cys Glu Cys Glu Leu Ser Thr85 90 95Phe Ile Asn Trp Leu Asn His Thr Asn Val Thr Ile Ala Gly Pro Pro100 105 110Ala Asp Ile Tyr Cys Val Tyr Pro Asp Ser Phe Ser Gly Val Ser Leu115 120 125Phe Ser Leu Ser Thr Glu Gly Cys Asp Glu Glu Glu Val Leu Lys Ser130 135 140Leu Lys Phe Ser Leu Phe Ile Val Cys Thr Val Thr Leu Thr Leu Phe145 150 155 160Leu Met Thr Ile Leu Thr Val Thr Lys Phe Arg Gly Phe Cys Phe Ile165 170 175Cys Tyr Lys Thr Ala Gln Arg Leu Val Phe Lys Asp His Pro Gln Gly180 185 190Thr Glu Pro Asp Met Tyr Lys Tyr Asp Ala Tyr Leu Cys Phe Ser Ser195 200 205Lys Asp Phe Thr Trp Val Gln Asn Ala Leu Leu Lys His Leu Asp Thr210 215 220Gln Tyr Ser Asp Gln Asn Arg Phe Asn Leu Cys Phe Glu Glu Arg Asp225 230 235 240Phe Val Pro Gly Glu Asn Arg Ile Ala Asn Ile Gln Asp Ala Ile Trp245 250 255Asn Ser Arg Lys Ile Val Cys Leu Val Ser Arg His Phe Leu Arg Asp260 265 270Gly Trp Cys Leu Glu Ala Phe Ser Tyr Ala Gln Gly Arg Cys Leu Ser275 280 285Asp Leu Asn Ser Ala Leu Ile Met Val Val Val Gly Ser Leu Ser Gln290 295 300Tyr Gln Leu Met Lys His Gln Ser Ile Arg Gly Phe Val Gln Lys Gln305 310 315 320Gln Tyr Leu Arg Trp Pro Glu Asp Leu Gln Asp Val Gly Trp Phe Leu325 330 335His Lys Leu Ser Gln Gln Ile Leu Lys Lys Glu Lys Glu Lys Lys Lys340 345 350Asp Asn Asn Ile Pro Leu Gln Thr Val Ala Thr Ile Ser355 360 365(2)SEQ ID NO11的信息(i)顺序特征(A)长度3138个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...3135(ix)特征(A)名称/关键词成熟肽(B)位置67...3135(xi)顺序描述SEQ ID NO11ATG TGG ACA CTG AAG AGA CTA ATT CTT ATC CTT TTT AAC ATA ATC CTA48Met Trp Thr Leu Lys Arg Leu Ile Leu Ile Leu Phe Asn Ile Ile Leu-22 -20 -15 -10ATT TCC AAA CTC CTT GGG GCT AGA TGG TTT CCT AAA ACT CTG CCC TGT96Ile Ser Lys Leu Leu Gly Ala Arg Trp Phe Pro Lys Thr Leu Pro Cys-5 1 5 10GAT GTC ACT CTG GAT GTT CCA AAG AAC CAT GTG ATC GTG GAC TGC ACA 144Asp Val Thr Leu Asp Val Pro Lys Asn His Val Ile Val Asp Cys Thr15 20 25GAC AAG CAT TTG ACA GAA ATT CCT GGA GGT ATT CCC ACG AAC ACC ACG 192Asp Lys His Leu Thr Glu Ile Pro Gly Gly Ile Pro Thr Asn Thr Thr30 35 40AAC CTC ACC CTC ACC ATT AAC CAC ATA CCA GAC ATC TCC CCA GCG TCC 240Asn Leu Thr Leu Thr Ile Asn His Ile Pro Asp Ile Ser Pro Ala Ser45 50 55TTT CAC AGA CTG GAC CAT CTG GTA GAG ATC GAT TTC AGA TGC AAC TGT 288Phe His Arg Leu Asp His Leu Val Glu Ile Asp Phe Arg Cys Asn Cys60 65 70GTA CCT ATT CCA CTG GGG TCA AAA AAC AAC ATG TGC ATC AAG AGG CTG 336Val Pro Ile Pro Leu Gly Ser Lys Asn Asn Met Cys Ile Lys Arg Leu75 80 85 90CAG ATT AAA CCC AGA AGC TTT AGT GGA CTC ACT TAT TTA AAA TCC CTT 384Gln Ile Lys Pro Arg Ser Phe Ser Gly Leu Thr Tyr Leu Lys Ser Leu95 100 105TAC CTG GAT GGA AAC CAG CTA CTA GAG ATA CCG CAG GGC CTC CCG CCT 432Tyr Leu Asp Gly Asn Gln Leu Leu Glu Ile Pro Gln Gly Leu Pro Pro110 115 120AGC TTA CAG CTT CTC AGC CTT GAG GCC AAC AAC ATC TTT TCC ATC AGA 480Ser Leu Gln Leu Leu Ser Leu Glu Ala Asn Asn Ile Phe Ser Ile Arg125 130 135AAA GAG AAT CTA ACA GAA CTG GCC AAC ATA GAA ATA CTC TAC CTG GGC 528Lys Glu Asn Leu Thr Glu Leu Ala Asn Ile Glu Ile Leu Tyr Leu Gly140 145 150CAA AAC TGT TAT TAT CGA AAT CCT TGT TAT GTT TCA TAT TCA ATA GAG 576Gln Asn Cys Tyr Tyr Arg Asn Pro Cys Tyr Val Ser Tyr Ser Ile Glu155 160 165 170AAA GAT GCC TTC CTA AAC TTG ACA AAG TTA AAA GTG CTC TCC CTG AAA 624Lys Asp Ala Phe Leu Asn Leu Thr Lys Leu Lys Val Leu Ser Leu Lys175 180 185GAT AAC AAT GTC ACA GCC GTC CCT ACT GTT TTG CCA TCT ACT TTA ACA 672Asp Asn Asn Val Thr Ala Val Pro Thr Val Leu Pro Ser Thr Leu Thr190 195 200GAA CTA TAT CTC TAC AAC AAC ATG ATT GCA AAA ATC CAA GAA GAT GAT 720Glu Leu Tyr Leu Tyr Asn Asn Met Ile Ala Lys Ile Gln Glu Asp Asp205 210 215TTT AAT AAC CTC AAC CAA TTA CAA ATT CTT GAC CTA AGT GGA AAT TGC 768Phe Asn Asn Leu Asn Gln Leu Gln Ile Leu Asp Leu Ser Gly Asn Cys220 225 230CCT CGT TGT TAT AAT GCC CCA TTT CCT TGT GCG CCG TGT AAA AAT AAT 816Pro Arg Cys Tyr Asn Ala Pro Phe Pro Cys Ala Pro Cys Lys Asn Asn235 240 245 250TCT CCC CTA CAG ATC CCT GTA AAT GCT TTT GAT GCG CTG ACA GAA TTA 864Ser Pro Leu Gln Ile Pro Val Asn Ala Phe Asp Ala Leu Thr Glu Leu255 260 265AAA GTT TTA CGT CTA CAC AGT AAC TCT CTT CAG CAT GTG CCC CCA AGA 912Lys Val Leu Arg Leu His Ser Asn Ser Leu Gln His Val Pro Pro Arg270 275 280TGG TTT AAG AAC ATC AAC AAA CTC CAG GAA CTG GAT CTG TCC CAA AAC 960Trp Phe Lys Asn Ile Asn Lys Leu Gln Glu Leu Asp Leu Ser Gln Asn285 290 295TTC TTG GCC AAA GAA ATT GGG GAT GCT AAA TTT CTG CAT TTT CTC CCC 1008Phe Leu Ala Lys Glu Ile Gly Asp Ala Lys Phe Leu His Phe Leu Pro300 305 310AGC CTC ATC CAA TTG GAT CTG TCT TTC AAT TTT GAA CTT CAG GTC TAT 1056Ser Leu Ile Gln Leu Asp Leu Ser Phe Asn Phe Glu Leu Gln Val Tyr315 320 325 330CGT GCA TCT ATG AAT CTA TCA CAA GCA TTT TCT TCA CTG AAA AGC CTG 1104Arg Ala Ser Met Asn Leu Ser Gln Ala Phe Ser Ser Leu Lys Ser Leu335 340 345AAA ATT CTG CGG ATC AGA GGA TAT GTC TTT AAA GAG TTG AAA AGC TTT 1152Lys Ile Leu Arg Ile Arg Gly Tyr Val Phe Lys Glu Leu Lys Ser Phe350 355 360AAC CTC TCG CCA TTA CAT AAT CTT CAA AAT CTT GAA GTT CTT GAT CTT 1200Asn Leu Ser Pro Leu His Asn Leu Gln Asn Leu Glu Val Leu Asp Leu365 370 375GGC ACT AAC TTT ATA AAA ATT GCT AAC CTC AGC ATG TTT AAA CAA TTT 1248Gly Thr Asn Phe Ile Lys Ile Ala Asn Leu Ser Met Phe Lys Gln Phe380 385 390AAA AGA CTG AAA GTC ATA GAT CTT TCA GTG AAT AAA ATA TCA CCT TCA 1296Lys Arg Leu Lys Val Ile Asp Leu Ser Val Asn Lys Ile Ser Pro Ser395 400 405 410GGA GAT TCA AGT GAA GTT GGC TTC TGC TCA AAT GCC AGA ACT TCT GTA 1344Gly Asp Ser Ser Glu Val Gly Phe Cys Ser Asn Ala Arg Thr Ser Val415 420 425GAA AGT TAT GAA CCC CAG GTC CTG GAA CAA TTA CAT TAT TTC AGA TAT 1392Glu Ser Tyr Glu Pro Gln Val Leu Glu Gln Leu His Tyr Phe Arg Tyr430 435 440GAT AAG TAT GCA AGG AGT TGC AGA TTC AAA AAC AAA GAG GCT TCT TTC 1440Asp Lys Tyr Ala Arg Ser Cys Arg Phe Lys Asn Lys Glu Ala Ser Phe445 450 455ATG TCT GTT AAT GAA AGC TGC TAC AAG TAT GGG CAG ACC TTG GAT CTA 1488Met Ser Val Asn Glu Ser Cys Tyr Lys Tyr Gly Gln Thr Leu Asp Leu460 465 470AGT AAA AAT AGT ATA TTT TTT GTC AAG TCC TCT GAT TTT CAG CAT CTT 1536Ser Lys Asn Ser Ile Phe Phe Val Lys Ser Ser Asp Phe Gln His Leu475 480 485 490TCT TTC CTC AAA TGC CTG AAT CTG TCA GGA AAT CTC ATT AGC CAA ACT 1584Ser Phe Leu Lys Cys Leu Asn Leu Ser Gly Asn Leu Ile Ser Gln Thr495 500 505CTT AAT GGC AGT GAA TTC CAA CCT TTA GCA GAG CTG AGA TAT TTG GAC 1632Leu Asn Gly Ser Glu Phe Gln Pro Leu Ala Glu Leu Arg Tyr Leu Asp510 515 520TTC TCC AAC AAC CGG CTT GAT TTA CTC CAT TCA ACA GCA TTT GAA GAG 1680Phe Ser Asn Asn Arg Leu Asp Leu Leu His Ser Thr Ala Phe Glu Glu525 530 535CTT CAC AAA CTG GAA GTT CTG GAT ATA AGC AGT AAT AGC CAT TAT TTT 1728Leu His Lys Leu Glu Val Leu Asp Ile Ser Ser Asn Ser His Tyr Phe540 545 550CAA TCA GAA GGA ATT ACT CAT ATG CTA AAC TTT ACC AAG AAC CTA AAG 1776Gln Ser Glu Gly Ile Thr His Met Leu Asn Phe Thr Lys Asn Leu Lys555 560 565 570GTT CTG CAG AAA CTG ATG ATG AAC GAC AAT GAC ATC TCT TCC TCC ACC 1824Val Leu Gln Lys Leu Met Met Asn Asp Asn Asp Ile Ser Ser Ser Thr575 580 585AGC AGG ACC ATG GAG AGT GAG TCT CTT AGA ACT CTG GAA TTC AGA GGA 1872Ser Arg Thr Met Glu Ser Glu Ser Leu Arg Thr Leu Glu Phe Arg Gly590 595 600AAT CAC TTA GAT GTT TTA TGG AGA GAA GGT GAT AAC AGA TAC TTA CAA 1920Asn His Leu Asp Val Leu Trp Arg Glu Gly Asp Asn Arg Tyr Leu Gln605 610 615TTA TTC AAG AAT CTG CTA AAA TTA GAG GAA TTA GAC ATC TCT AAA AAT 1968Leu Phe Lys Asn Leu Leu Lys Leu Glu Glu Leu Asp Ile Ser Lys Asn620 625 630TCC CTA AGT TTC TTG CCT TCT GGA GTT TTT GAT GGT ATG CCT CCA AAT 2016Ser Leu Ser Phe Leu Pro Ser Gly Val Phe Asp Gly Met Pro Pro Asn635 640 645 650CTA AAG AAT CTC TCT TTG GCC AAA AAT GGG CTC AAA TCT TTC AGT TGG 2064Leu Lys Asn Leu Ser Leu Ala Lys Asn Gly Leu Lys Ser Phe Ser Trp655 660 665AAG AAA CTC CAG TGT CTA AAG AAC CTG GAA ACT TTG GAC CTC AGC CAC 2112Lys Lys Leu Gln Cys Leu Lys Asn Leu Glu Thr Leu Asp Leu Ser His670 675 680AAC CAA CTG ACC ACT GTC CCT GAG AGA TTA TCC AAC TGT TCC AGA AGC 2160Asn Gln Leu Thr Thr Val Pro Glu Arg Leu Ser Asn Cys Ser Arg Ser685 690 695CTC AAG AAT CTG ATT CTT AAG AAT AAT CAA ATC AGG AGT CTG ACG AAG 2208Leu Lys Asn Leu Ile Leu Lys Asn Asn Gln Ile Arg Ser Leu Thr Lys700 705 710TAT TTT CTA CAA GAT GCC TTC CAG TTG CGA TAT CTG GAT CTC AGC TCA 2256Tyr Phe Leu Gln Asp Ala Phe Gln Leu Arg Tyr Leu Asp Leu Ser Ser715 720 725 730AAT AAA ATC CAG ATG ATC CAA AAG ACC AGC TTC CCA GAA AAT GTC CTC 2304Asn Lys Ile Gln Met Ile Gln Lys Thr Ser Phe Pro Glu Asn Val Leu735 740 745AAC AAT CTG AAG ATG TTG CTT TTG CAT CAT AAT CGG TTT CTG TGC ACC 2352Asn Asn Leu Lys Met Leu Leu Leu His His Asn Arg Phe Leu Cys Thr750 755 760TGT GAT GCT GTG TGG TTT GTC TGG TGG GTT AAC CAT ACG GAG GTG ACT 2400Cys Asp Ala Val Trp Phe Val Trp Trp Val Asn His Thr Glu Val Thr765 770 775ATT CCT TAC CTG GCC ACA GAT GTG ACT TGT GTG GGG CCA GGA GCA CAC 2448Ile Pro Tyr Leu Ala Thr Asp Val Thr Cys Val Gly Pro Gly Ala His780 785 790AAG GGC CAA AGT GTG ATC TCC CTG GAT CTG TAC ACC TGT GAG TTA GAT 2496Lys Gly Gln Ser Val Ile Ser Leu Asp Leu Tyr Thr Cys Glu Leu Asp795 800 805 810CTG ACT AAC CTG ATT CTG TTC TCA CTT TCC ATA TCT GTA TCT CTC TTT 2544Leu Thr Asn Leu Ile Leu Phe Ser Leu Ser Ile Ser Val Ser Leu Phe815 820 825CTC ATG GTG ATG ATG ACA GCA AGT CAC CTC TAT TTC TGG GAT GTG TGG 2592Leu Met Val Met Met Thr Ala Ser His Leu Tyr Phe Trp Asp Val Trp830 835 840TAT ATT TAC CAT TTC TGT AAG GCC AAG ATA AAG GGG TAT CAG CGT CTA 2640Tyr Ile Tyr His Phe Cys Lys Ala Lys Ile Lys Gly Tyr Gln Arg Leu845 850 855ATA TCA CCA GAC TGT TGC TAT GAT GCT TTT ATT GTG TAT GAC ACT AAA 2688Ile Ser Pro Asp Cys Cys Tyr Asp Ala Phe Ile Val Tyr Asp Thr Lys860 865 870GAC CCA GCT GTG ACC GAG TGG GTT TTG GCT GAG CTG GTG GCC AAA CTG 2736Asp Pro Ala Val Thr Glu Trp Val Leu Ala Glu Leu Val Ala Lys Leu875 880 885 890GAA GAC CCA AGA GAG AAA CAT TTT AAT TTA TGT CTC GAG GAA AGG GAC 2784Glu Asp Pro Arg Glu Lys His Phe Asn Leu Cys Leu Glu Glu Arg Asp895 900 905TGG TTA CCA GGG CAG CCA GTT CTG GAA AAC CTT TCC CAG AGC ATA CAG 2832Trp Leu Pro Gly Gln Pro Val Leu Glu Asn Leu Ser Gln Ser Ile Gln910 915 920CTT AGC AAA AAG ACA GTG TTT GTG ATG ACA GAC AAG TAT GCA AAG ACT 2880Leu Ser Lys Lys Thr Val Phe Val Met Thr Asp Lys Tyr Ala Lys Thr925 930 935GAA AAT TTT AAG ATA GCA TTT TAC TTG TCC CAT CAG AGG CTC ATG GAT 2928Glu Asn Phe Lys Ile Ala Phe Tyr Leu Ser His Gln Arg Leu Met Asp940 945 950GAA AAA GTT GAT GTG ATT ATC TTG ATA TTT CTT GAG AAG CCC TTT CAG 2976Glu Lys Val Asp Val Ile Ile Leu Ile Phe Leu Glu Lys Pro Phe Gln955 960 965 970AAG TCC AAG TTC CTC CAG CTC CGG AAA AGG CTC TGT GGG AGT TCT GTC 3024Lys Ser Lys Phe Leu Gln Leu Arg Lys Arg Leu Cys Gly Ser Ser Val975 980 985CTT GAG TGG CCA ACA AAC CCG CAA GCT CAC CCA TAC TTC TGG CAG TGT 3072Leu Glu Trp Pro Thr Asn Pro Gln Ala His Pro Tyr Phe Trp Gln Cys990 995 1000CTA AAG AAC GCC CTG GCC ACA GAC AAT CAT GTG GCC TAT AGT CAG GTG 3120Leu Lys Asn Ala Leu Ala Thr Asp Asn His Val Ala Tyr Ser Gln Val100510101015TTC AAG GAA ACG GTC TAG 3138Phe Lys Glu Thr Val1020(2)SEQ ID NO12的信息(i)顺序特征(A)长度1045个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO12Met Trp Thr Leu Lys Arg Leu Ile Leu Ile Leu Phe Asn Ile Ile Leu-22 -20 -15 -10Ile Ser Lys Leu Leu Gly Ala Arg Trp Phe Pro Lys Thr Leu Pro Cys-5 1 5 10Asp Val Thr Leu Asp Val Pro Lys Asn His Val Ile Val Asp Cys Thr15 20 25Asp Lys His Leu Thr Glu Ile Pro Gly Gly Ile Pro Thr Asn Thr Thr30 35 40Asn Leu Thr Leu Thr Ile Asn His Ile Pro Asp Ile Ser Pro Ala Ser45 50 55Phe His Arg Leu Asp His Leu Val Glu Ile Asp Phe Arg Cys Asn Cys60 65 70Val Pro Ile Pro Leu Gly Ser Lys Asn Asn Met Cys Ile Lys Arg Leu75 80 85 90Gln Ile Lys Pro Arg Ser Phe Ser Gly Leu Thr Tyr Leu Lys Ser Leu95 100 105Tyr Leu Asp Gly Asn Gln Leu Leu Glu Ile Pro Gln Gly Leu Pro Pro110 115 120Ser Leu Gln Leu Leu Ser Leu Glu Ala Asn Asn Ile Phe Ser Ile Arg125 130 135Lys Glu Asn Leu Thr Glu Leu Ala Asn Ile Glu Ile Leu Tyr Leu Gly140 145 150Gln Asn Cys Tyr Tyr Arg Asn Pro Cys Tyr Val Ser Tyr Ser Ile Glu155 160 165 170Lys Asp Ala Phe Leu Asn Leu Thr Lys Leu Lys Val Leu Ser Leu Lys175 180 185Asp Asn Asn Val Thr Ala Val Pro Thr Val Leu Pro Ser Thr Leu Thr190 195 200Glu Leu Tyr Leu Tyr Asn Asn Met Ile Ala Lys Ile Gln Glu Asp Asp205 210 215Phe Asn Asn Leu Asn Gln Leu Gln Ile Leu Asp Leu Ser Gly Asn Cys220 225 230Pro Arg Cys Tyr Asn Ala Pro Phe Pro Cys Ala Pro Cys Lys Asn Asn235 240 245 250Ser Pro Leu Gln Ile Pro Val Asn Ala Phe Asp Ala Leu Thr Glu Leu255 260 265Lys Val Leu Arg Leu His Ser Asn Ser Leu Gln His Val Pro Pro Arg270 275 280Trp Phe Lys Asn Ile Asn Lys Leu Gln Glu Leu Asp Leu Ser Gln Asn285 290 295Phe Leu Ala Lys Glu Ile Gly Asp Ala Lys Phe Leu His Phe Leu Pro300 305 310Ser Leu Ile Gln Leu Asp Leu Ser Phe Asn Phe Glu Leu Gln Val Tyr315 320 325 330Arg Ala Ser Met Asn Leu Ser Gln Ala Phe Ser Ser Leu Lys Ser Leu335 340 345Lys Ile Leu Arg Ile Arg Gly Tyr Val Phe Lys Glu Leu Lys Ser Phe350 355 360Asn Leu Ser Pro Leu His Asn Leu Gln Asn Leu Glu Val Leu Asp Leu365 370 375Gly Thr Asn Phe Ile Lys Ile Ala Asn Leu Ser Met Phe Lys Gln Phe380 385 390Lys Arg Leu Lys Val Ile Asp Leu Ser Val Asn Lys Ile Ser Pro Ser395 400 405 410Gly Asp Ser Ser Glu Val Gly Phe Cys Ser Asn Ala Arg Thr Ser Val415 420 425Glu Ser Tyr Glu Pro Gln Val Leu Glu Gln Leu His Tyr Phe Arg Tyr430 435 440Asp Lys Tyr Ala Arg Ser Cys Arg Phe Lys Asn Lys Glu Ala Ser Phe445 450 455Met Ser Val Asn Glu Ser Cys Tyr Lys Tyr Gly Gln Thr Leu Asp Leu460 465 470Ser Lys Asn Ser Ile Phe Phe Val Lys Ser Ser Asp Phe Gln His Leu475 480 485 490Ser Phe Leu Lys Cys Leu Asn Leu Ser Gly Asn Leu Ile Ser Gln Thr495 500 505Leu Asn Gly Ser Glu Phe Gln Pro Leu Ala Glu Leu Arg Tyr Leu Asp510 515 520Phe Ser Asn Asn Arg Leu Asp Leu Leu His Ser Thr Ala Phe Glu Glu525 530 535Leu His Lys Leu Glu Val Leu Asp Ile Ser Ser Asn Ser His Tyr Phe540 545 550Gln Ser Glu Gly Ile Thr His Met Leu Asn Phe Thr Lys Asn Leu Lys555 560 565 570Val Leu Gln Lys Leu Met Met Asn Asp Asn Asp Ile Ser Ser Ser Thr575 580 585Ser Arg Thr Met Glu Ser Glu Ser Leu Arg Thr Leu Glu Phe Arg Gly590 595 600Asn His Leu Asp Val Leu Trp Arg Glu Gly Asp Asn Arg Tyr Leu Gln605 610 615Leu Phe Lys Asn Leu Leu Lys Leu Glu Glu Leu Asp Ile Ser Lys Asn620 625 630Ser Leu Ser Phe Leu Pro Ser Gly Val Phe Asp Gly Met Pro Pro Asn635 640 645 650Leu Lys Asn Leu Ser Leu Ala Lys Asn Gly Leu Lys Ser Phe Ser Trp655 660 665Lys Lys Leu Gln Cys Leu Lys Asn Leu Glu Thr Leu Asp Leu Ser His670 675 680Asn Gln Leu Thr Thr Val Pro Glu Arg Leu Ser Asn Cys Ser Arg Ser685 690 695Leu Lys Asn Leu Ile Leu Lys Asn Asn Gln Ile Arg Ser Leu Thr Lys700 705 710Tyr Phe Leu Gln Asp Ala Phe Gln Leu Arg Tyr Leu Asp Leu Ser Ser715 720 725 730Asn Lys Ile Gln Met Ile Gln Lys Thr Ser Phe Pro Glu Asn Val Leu735 740 745Asn Asn Leu Lys Met Leu Leu Leu His His Asn Arg Phe Leu Cys Thr750 755 760Cys Asp Ala Val Trp Phe Val Trp Trp Val Asn His Thr Glu Val Thr765 770 775Ile Pro Tyr Leu Ala Thr Asp Val Thr Cys Val Gly Pro Gly Ala His780 785 790Lys Gly Gln Ser Val Ile Ser Leu Asp Leu Tyr Thr Cys Glu Leu Asp795 800 805 810Leu Thr Asn Leu Ile Leu Phe Ser Leu Ser Ile Ser Val Ser Leu Phe815 820 825Leu Met Val Met Met Thr Ala Ser His Leu Tyr Phe Trp Asp Val Trp830 835 840Tyr Ile Tyr His Phe Cys Lys Ala Lys Ile Lys Gly Tyr Gln Arg Leu845 850 855Ile Ser Pro Asp Cys Cys Tyr Asp Ala Phe Ile Val Tyr Asp Thr Lys860 865 870Asp Pro Ala Val Thr Glu Trp Val Leu Ala Glu Leu Val Ala Lys Leu875 880 885 890Glu Asp Pro Arg Glu Lys His Phe Asn Leu Cys Leu Glu Glu Arg Asp895 900 905Trp Leu Pro Gly Gln Pro Val Leu Glu Asn Leu Ser Gln Ser Ile Gln910 915 920Leu Ser Lys Lys Thr Val Phe Val Met Thr Asp Lys Tyr Ala Lys Thr925 930 935Glu Asn Phe Lys Ile Ala Phe Tyr Leu Ser His Gln Arg Leu Met Asp940 945 950Glu Lys Val Asp Val Ile Ile Leu Ile Phe Leu Glu Lys Pro Phe Gln955 960 965 970Lys Ser Lys Phe Leu Gln Leu Arg Lys Arg Leu Cys Gly Ser Ser Val975 980 985Leu Glu Trp Pro Thr Asn Pro Gln Ala His Pro Tyr Phe Trp Gln Cys990 995 1000Leu Lys Asn Ala Leu Ala Thr Asp Asn His Val Ala Tyr Ser Gln Val1005l0l01015Phe Lys Glu Thr Val1020(2)SEQ ID NO13的信息(i)顺序特征(A)长度180个碱基对(B)类型核酸(C)链型单链
(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置l...177(xi)顺序描述SEQ ID NO13CTT GGA AAA CCT CTT CAG AAG TCT AAG TTT CTT CAG CTC AGG AAG AGA48Leu Gly Lys Pro Leu Gln Lys Ser Lys Phe Leu Gln Leu Arg Lys Arg1 5 10 15CTC TGC AGG AGC TCT GTC CTT GAG TGG CCT GCA AAT CCA CAG GCT CAC96Leu Cys Arg Ser Ser Val Leu Glu Trp Pro Ala Asn Pro Gln Ala His20 25 30CCA TAC TTC TGG CAG TGC CTG AAA AAT GCC CTG ACC ACA GAC AAT CAT 144Pro Tyr Phe Trp Gln Cys Leu Lys Asn Ala Leu Thr Thr Asp Asn His35 40 45GTG GCT TAT AGT CAA ATG TTC AAG GAA ACA GTC TAG 180Val Ala Tyr Ser Gln Met Phe Lys Glu Thr Val50 55(2)SEQ ID NO14的信息(i)顺序特征(A)长度59个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO14Leu Gly Lys Pro Leu Gln Lys Ser Lys Phe Leu Gln Leu Arg Lys Arg1 5 10 15Leu Cys Arg Ser Ser Val Leu Glu Trp Pro Ala Asn Pro Gln Ala His20 25 30Pro Tyr Phe Trp Gln Cys Leu Lys Asn Ala Leu Thr Thr Asp Asn His35 40 45Val Ala Tyr Ser Gln Met Phe Lys Glu Thr Val50 55(2)SEQ ID NO15的信息(i)顺序特征(A)长度990个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置2...988(xi)顺序描述SEQ ID NO15G AAT TCC AGA CTT ATA AAC TTG AAA AAT CTC TAT TTG GCC TGG AAC 46Asn Ser Arg Leu Ile Asn Leu Lys Asn Leu Tyr Leu Ala Trp Asn1 5 10 15TGC TAT TTT AAC AAA GTT TGC GAG AAA ACT AAC ATA GAA GAT GGA GTA94Cys Tyr Phe Asn Lys Val Cys Glu Lys Thr Asn Ile Glu Asp Gly Val20 25 30TTT GAA ACG CTG ACA AAT TTG GAG TTG CTA TCA CTA TCT TTC AAT TCT 142Phe Glu Thr Leu Thr Asn Leu Glu Leu Leu Ser Leu Ser Phe Asn Ser35 40 45CTT TCA CAT GTG CCA CCC AAA CTG CCA AGC TCC CTA CGC AAA CTT TTT 190Leu Ser His Val Pro Pro Lys Leu Pro Ser Ser Leu Arg Lys Leu Phe50 55 60CTG AGC AAC ACC CAG ATC AAA TAC ATT AGT GAA GAA GAT TTC AAG GGA 238Leu Ser Asn Thr Gln Ile Lys Tyr Ile Ser Glu Glu Asp Phe Lys Gly65 70 75TTG ATA AAT TTA ACA TTA CTA GAT TTA AGC GGG AAC TGT CCG AGG TGC 286Leu Ile Asn Leu Thr Leu Leu Asp Leu Ser Gly Asn Cys Pro Arg Cys80 85 90 95TTC AAT GCC CCA TTT CCA TGC GTG CCT TGT GAT GGT GGT GCT TCA ATT 334Phe Asn Ala Pro Phe Pro Cys Val Pro Cys Asp Gly Gly Ala Ser Ile100 105 110AAT ATA GAT CGT TTT GCT TTT CAA AAC TTG ACC CAA CTT CGA TAC CTA 382Asn Ile Asp Arg Phe Ala Phe Gln Asn Leu Thr Gln Leu Arg Tyr Leu115 120 125AAC CTC TCT AGC ACT TCC CTC AGG AAG ATT AAT GCT GCC TGG TTT AAA 430Asn Leu Ser Ser Thr Ser Leu Arg Lys Ile Asn Ala Ala Trp Phe Lys130 135 140AAT ATG CCT CAT CTG AAG GTG CTG GAT CTT GAA TTC AAC TAT TTA GTG 478Asn Met Pro His Leu Lys Val Leu Asp Leu Glu Phe Asn Tyr Leu Val145 150 155GGA GAA ATA GCC TCT GGG GCA TTT TTA ACG ATG CTG CCC CGC TTA GAA 526Gly Glu Ile Ala Ser Gly Ala Phe Leu Thr Met Leu Pro Arg Leu Glu160 165 170 175ATA CTT GAC TTG TCT TTT AAC TAT ATA AAG GGG AGT TAT CCA CAG CAT 574Ile Leu Asp Leu Ser Phe Asn Tyr Ile Lys Gly Ser Tyr Pro Gln His180 185 190ATT AAT ATT TCC AGA AAC TTC TCT AAA CTT TTG TCT CTA CGG GCA TTG 622Ile Asn Ile Ser Arg Asn Phe Ser Lys Leu Leu Ser Leu Arg Ala Leu195 200 205CAT TTA AGA GGT TAT GTG TTC CAG GAA CTC AGA GAA GAT GAT TTC CAG 670His Leu Arg Gly Tyr Val Phe Gln Glu Leu Arg Glu Asp Asp Phe Gln210 215 220CCC CTG ATG CAG CTT CCA AAC TTA TCG ACT ATC AAC TTG GGT ATT AAT 718Pro Leu Met Gln Leu Pro Asn Leu Ser Thr Ile Asn Leu Gly Ile Asn225 230 235TTT ATT AAG CAA ATC GAT TTC AAA CTT TTC CAA AAT TTC TCC AAT CTG 766Phe Ile Lys Gln Ile Asp Phe Lys Leu Phe Gln Asn Phe Ser Asn Leu240 245 250 255GAA ATT ATT TAC TTG TCA GAA AAC AGA ATA TCA CCG TTG GTA AAA GAT 814Glu Ile Ile Tyr Leu Ser Glu Asn Arg Ile Ser Pro Leu Val Lys Asp260 265 270ACC CGG CAG AGT TAT GCA AAT AGT TCC TCT TTT CAA CGT CAT ATC CGG 862Thr Arg Gln Ser Tyr Ala Asn Ser Ser Ser Phe Gln Arg His Ile Arg275 280 285AAA CGA CGC TCA ACA GAT TTT GAG TTT GAC CCA CAT TCG AAC TTT TAT 910Lys Arg Arg Ser Thr Asp Phe Glu Phe Asp Pro His Ser Asn Phe Tyr290 295 300CAT TTC ACC CGT CCT TTA ATA AAG CCA CAA TGT GCT GCT TAT GGA AAA 958His Phe Thr Arg Pro Leu Ile Lys Pro Gln Cys Ala Ala Tyr Gly Lys305 310 315GCC TTA GAT TTA AGC CTC AAC AGT ATT TTC TT 990Ala Leu Asp Leu Ser Leu Asn Ser Ile Phe320 325(2)SEQ ID NO16的信息(i)顺序特征(A)长度329个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO16Asn Ser Arg Leu Ile Asn Leu Lys Asn Leu Tyr Leu Ala Trp Asn Cys1 5 10 15Tyr Phe Asn Lys Val Cys Glu Lys Thr Asn Ile Glu Asp Gly Val Phe20 25 30Glu Thr Leu Thr Asn Leu Glu Leu Leu Ser Leu Ser Phe Asn Ser Leu35 40 45Ser His Val Pro Pro Lys Leu Pro Ser Ser Leu Arg Lys Leu Phe Leu50 55 60Ser Asn Thr Gln Ile Lys Tyr Ile Ser Glu Glu Asp Phe Lys Gly Leu65 70 75 80Ile Asn Leu Thr Leu Leu Asp Leu Ser Gly Asn Cys Pro Arg Cys Phe85 90 95Asn Ala Pro Phe Pro Cys Val Pro Cys Asp Gly Gly Ala Ser Ile Asn100 105 110Ile Asp Arg Phe Ala Phe Gln Asn Leu Thr Gln Leu Arg Tyr Leu Asn115 120 125Leu Ser Ser Thr Ser Leu Arg Lys Ile Asn Ala Ala Trp Phe Lys Asn130 135 140Met Pro His Leu Lys Val Leu Asp Leu Glu Phe Asn Tyr Leu Val Gly145 150 155 160Glu Ile Ala Ser Gly Ala Phe Leu Thr Met Leu Pro Arg Leu Glu Ile165 170 175Leu Asp Leu Ser Phe Asn Tyr Ile Lys Gly Ser Tyr Pro Gln His Ile180 185 190Asn Ile Ser Arg Asn Phe Ser Lys Leu Leu Ser Leu Arg Ala Leu His195 200 205Leu Arg Gly Tyr Val Phe Gln Glu Leu Arg Glu Asp Asp Phe Gln Pro210 215 220Leu Met Gln Leu Pro Asn Leu Ser Thr Ile Asn Leu Gly Ile Asn Phe225 230 235 240Ile Lys Gln Ile Asp Phe Lys Leu Phe Gln Asn Phe Ser Asn Leu Glu245 250 255Ile Ile Tyr Leu Ser Glu Asn Arg Ile Ser Pro Leu Val Lys Asp Thr260 265 270Arg Gln Ser Tyr Ala Asn Ser Ser Ser Phe Gln Arg His Ile Arg Lys275 280 285Arg Arg Ser Thr Asp Phe Glu Phe Asp Pro His Ser Asn Phe Tyr His290 295 300Phe Thr Arg Pro Leu Ile Lys Pro Gln Cys Ala Ala Tyr Gly Lys Ala305 310 315 320Leu Asp Leu Ser Leu Asn Ser Ile Phe325(2)SEQ ID NO17的信息(i)顺序特征(A)长度1557个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...513(ix)特征(A)名称/关键词misc特征(B)位置278
(D)其它信息/注释=“核苷酸278标示为G,可以为G或C”(ix)特征(A)名称/关键词misc特征(B)位置445(D)其它信息/注释=“核苷酸445标示为A,可以为A或T”(ix)特征(A)名称/关键词misc特征(B)位置572(D)其它信息/注释=“核苷酸572、593、600、607、617、622、631、640、646、653、719、755和861标示为C;每个可以为A、C、G或T”(xi)顺序描述SEQ ID NO17CAG TCT CTT TCC ACA TCC CAA ACT TTC TAT GAT GCT TAC ATT TCT TAT48Gln Ser Leu Ser Thr Ser Gln Thr Phe Tyr Asp Ala Tyr Ile Ser Tyr1 5 10 15GAC ACC AAA GAT GCC TCT GTT ACT GAC TGG GTG ATA AAT GAG CTG CGC96Asp Thr Lys Asp Ala Ser Val Thr Asp Trp Val Ile Asn Glu Leu Arg20 25 30TAC CAC CTT GAA GAG AGC CGA GAC AAA AAC GTT CTC CTT TGT CTA GAG 144Tyr His Leu Glu Glu Ser Arg Asp Lys Asn Val Leu Leu Cys Leu Glu35 40 45GAG AGG GAT TGG GAC CCG GGA TTG GCC ATC ATC GAC AAC CTC ATG CAG 192Glu Arg Asp Trp Asp Pro Gly Leu Ala Ile Ile Asp Asn Leu Met Gln50 55 60AGC ATC AAC CAA AGC AAG AAA ACA GTA TTT GTT TTA ACC AAA AAA TAT 240Ser Ile Asn Gln Ser Lys Lys Thr Val Phe Val Leu Thr Lys Lys Tyr65 70 75 80GCA AAA AGC TGG AAC TTT AAA ACA GCT TTT TAC TTG GGC TTG CAG AGG 288Ala Lys Ser Trp Asn Phe Lys Thr Ala Phe Tyr Leu Gly Leu Gln Arg85 90 95CTA ATG GGT GAG AAC ATG GAT GTG ATT ATA TTT ATC CTG CTG GAG CCA 336Leu Met Gly Glu Asn Met Asp Val Ile Ile Phe Ile Leu Leu Glu Pro100 105 110GTG TTA CAG CAT TCT CCG TAT TTG AGG CTA CGG CAG CGG ATC TGT AAG 384Val Leu Gln His Ser Pro Tyr Leu Arg Leu Arg Gln Arg Ile Cys Lys115 120 125AGC TCC ATC CTC CAG TGG CCT GAC AAC CCG AAG GCA GAA AGG TTG TTT 432Ser Ser Ile Leu Gln Trp Pro Asp Asn Pro Lys Ala Glu Arg Leu Phe130 135 140TGG CAA ACT CTG AGA AAT GTG GTC TTG ACT GAA AAT GAT TCA CGG TAT 480Trp Gln Thr Leu Arg Asn Val Val Leu Thr Glu Asn Asp Ser Arg Tyr145 150 155 160AAC AAT ATG TAT GTC GAT TCC ATT AAG CAA TAC TAACTGACGT TAAGTCATGA 533Asn Asn Met Tyr Val Asp Ser Ile Lys Gln Tyr165 170TTTCGCGCCA TAATAAAGAT GCAAAGGAAT GACATTTCCG TATTAGTTAT CTATTGCTAC 593GGTAACCAAA TTACTCCCAA AAACCTTACG TCGGTTTCAA AACAACCACA TTCTGCTGGC 653CCCACAGTTT TTGAGGGTCA GGAGTCCAGG CCCAGCATAA CTGGGTCTTC TGCTTCAGGG 713TGTCTCCAGA GGCTGCAATG TAGGTGTTCA CCAGAGACAT AGGCATCACT GGGGTCACAC 773TCCATGTGGT TGTTTTCTGG ATTCAATTCC TCCTGGGCTA TTGGCCAAAG GCTATACTCA 833TGTAAGCCAT GCGAGCCTAT CCCACAACGG CAGCTTGCTT CATCAGAGCT AGCAAAAAAG 893AGAGGTTGCT AGCAAGATGA AGTCACAATC TTTTGTAATC GAATCAAAAA AGTGATATCT 953CATCACTTTG GCCATATTCT ATTTGTTAGA AGTAAACCAC AGGTCCCACC AGCTCCATGG1013GAGTGACCAC CTCAGTCCAG GGAAAACAGC TGAAGACCAA GATGGTGAGC TCTGATTGCT1073TCAGTTGGTC ATCAACTATT TTCCCTTGAC TGCTGTCCTG GGATGGCCGG CTATCTTGAT1133GGATAGATTG TGAATATCAG GAGGCCAGGG ATCACTGTGG ACCATCTTAG CAGTTGACCT1193AACACATCTT CTTTTCAATA TCTAAGAACT TTTGCCACTG TGACTAATGG TCCTAATATT1253AAGCTGTTGT TTATATTTAT CATATATCTA TGGCTACATG GTTATATTAT GCTGTGGTTG1313CGTTCGGTTT TATTTACAGT TGCTTTTACA AATATTTGCT GTAACATTTG ACTTCTAAGG1373TTTAGATGCC ATTTAAGAAC TGAGATGGAT AGCTTTTAAA GCATCTTTTA CTTCTTACCA1433TTTTTTAAAA GTATGCAGCT AAATTCGAAG CTTTTGGTCT ATATTGTTAA TTGCCATTGC1493TGTAAATCTT AAAATGAATG AATAAAAATG TTTCATTTTA AAAAAAAAAA AAAAAAAAAA1553AAAA 1557(2)SEQ ID NO18的信息(i)顺序特征(A)长度171个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO18Gln Ser Leu Ser Thr Ser Gln Thr Phe Tyr Asp Ala Tyr Ile Ser Tyr1 5 10 15Asp Thr Lys Asp Ala Ser Val Thr Asp Trp Val Ile Asn Glu Leu Arg20 25 30Tyr His Leu Glu Glu Ser Arg Asp Lys Asn Val Leu Leu Cys Leu Glu35 40 45Glu Arg Asp Trp Asp Pro Gly Leu Ala Ile Ile Asp Asn Leu Met Gln50 55 60Ser Ile Asn Gln Ser Lys Lys Thr Val Phe Val Leu Thr Lys Lys Tyr65 70 75 80Ala Lys Ser Trp Asn Phe Lys Thr Ala Phe Tyr Leu Gly Leu Gln Arg85 90 95Leu Met Gly Glu Asn Met Asp Val Ile Ile Phe Ile Leu Leu Glu Pro100 105 110Val Leu Gln His Ser Pro Tyr Leu Arg Leu Arg Gln Arg Ile Cys Lys115 120 125Ser Ser Ile Leu Gln Trp Pro Asp Asn Pro Lys Ala Glu Arg Leu Phe130 135 140Trp Gln Thr Leu Arg Asn Val Val Leu Thr Glu Asn Asp Ser Arg Tyr145 150 155 160Asn Asn Met Tyr Val Asp Ser Ile Lys Gln Tyr165 170(2)SEQ ID NO19的信息(i)顺序特征(A)长度629个碱基对
(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置l...486(ix)特征(A)名称/关键词misc特征(B)位置144(D)其它信息/注释=“核苷酸144和225标示为C;可以为C或T”(xi)顺序描述SEQ ID NO19AAT GAA TTG ATC CCC AAT CTA GAG AAG GAA GAT GGT TCT ATC TTG ATT48Asn Glu Leu Ile Pro Asn Leu Glu Lys Glu Asp Gly Ser Ile Leu Ile1 5 10 15TGC CTT TAT GAA AGC TAC TTT GAC CCT GGC AAA AGC ATT AGT GAA AAT96Cys Leu Tyr Glu Ser Tyr Phe Asp Pro Gly Lys Ser Ile Ser Glu Asn20 25 30ATT GTA AGC TTC ATT GAG AAA AGC TAT AAG TCC ATC TTT GTT TTG TCC 144Ile Val Ser Phe Ile Glu Lys Ser Tyr Lys Ser Ile Phe Val Leu Ser35 40 45CCC AAC TTT GTC CAG AAT GAG TGG TGC CAT TAT GAA TTC TAC TTT GCC 192Pro Asn Phe Val Gln Asn Glu Trp Cys His Tyr Glu Phe Tyr Phe Ala50 55 60CAC CAC AAT CTC TTC CAT GAA AAT TCT GAT CAC ATA ATT CTT ATC TTA 240His His Asn Leu Phe His Glu Asn Ser Asp His Ile Ile Leu Ile Leu65 70 75 80CTG GAA CCC ATT CCA TTC TAT TGC ATT CCC ACC AGG TAT CAT AAA CTG 288Leu Glu Pro Ile Pro Phe Tyr Cys Ile Pro Thr Arg Tyr His Lys Leu85 90 95GAA GCT CTC CTG GAA AAA AAA GCA TAC TTG GAA TGG CCC AAG GAT AGG 336Glu Ala Leu Leu Glu Lys Lys Ala Tyr Leu Glu Trp Pro Lys Asp Arg100 105 110CGT AAA TGT GGG CTT TTC TGG GCA AAC CTT CGA GCT GCT GTT AAT GTT 384Arg Lys Cys Gly Leu Phe Trp Ala Asn Leu Arg Ala Ala Val Asn Val115 120 125AAT GTA TTA GCC ACC AGA GAA ATG TAT GAA CTG CAG ACA TTC ACA GAG 432Asn Val Leu Ala Thr Arg Glu Met Tyr Glu Leu Gln Thr Phe Thr Glu130 135 140TTA AAT GAA GAG TCT CGA GGT TCT ACA ATC TCT CTG ATG AGA ACA GAC 480Leu Asn Glu Glu Ser Arg Gly Ser Thr Ile Ser Leu Met Arg Thr Asp145 150 155 160TGT CTA TAAAATCCCA CAGTCCTTGG GAAGTTGGGG ACCACATACA CTGTTGGGAT536Cys LeuGTACATTGAT ACAACCTTTA TGATGGCAAT TTGACAATAT TTATTAAAAT AAAAAATGGT 596TATTCCCTTC AAAAAAAAAA AAAAAAAAAA AAA 629(2)SEQ ID NO20的信息(i)顺序特征(A)长度162个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO20Asn Glu Leu Ile Pro Asn Leu Glu Lys Glu Asp Gly Ser Ile Leu Ile1 5 10 15Cys Leu Tyr Glu Ser Tyr Phe Asp Pro Gly Lys Ser Ile Ser Glu Asn20 25 30Ile Val Ser Phe Ile Glu Lys Ser Tyr Lys Ser Ile Phe Val Leu Ser35 40 45Pro Asn Phe Val Gln Asn Glu Trp Cys His Tyr Glu Phe Tyr Phe Ala50 55 60His His Asn Leu Phe His Glu Asn Ser Asp His Ile Ile Leu Ile Leu65 70 75 80Leu Glu Pro Ile Pro Phe Tyr Cys Ile Pro Thr Arg Tyr His Lys Leu85 90 95Glu Ala Leu Leu Glu Lys Lys Ala Tyr Leu Glu Trp Pro Lys Asp Arg100 105 110Arg Lys Cys Gly Leu Phe Trp Ala Asn Leu Arg Ala Ala Val Asn Val115 120 125Asn Val Leu Ala Thr Arg Glu Met Tyr Glu Leu Gln Thr Phe Thr Glu130 135 140Leu Asn Glu Glu Ser Arg Gly Ser Thr Ile Ser Leu Met Arg Thr Asp145 150 155 160Cys Leu(2)SEQ ID NO21的信息(i)顺序特征(A)长度427个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...426(xi)顺序描述SEQ ID NO21AAG AAC TCC AAA GAA AAC CTC CAG TTT CAT GCT TTT ATT TCA TAT AGT48Lys Asn Ser Lys Glu Asn Leu Gln Phe His Ala Phe Ile Ser Tyr Ser1 5 10 15GAA CAT GAT TCT GCC TGG GTG AAA AGT GAA TTG GTA CCT TAC CTA GAA96Glu His Asp Ser Ala Trp Val Lys Ser Glu Leu Val Pro Tyr Leu Glu20 25 30AAA GAA GAT ATA CAG ATT TGT CTT CAT GAG AGA AAC TTT GTC CCT GGC 144Lys Glu Asp Ile Gln Ile Cys Leu His Glu Arg Asn Phe Val Pro Gly35 40 45AAG AGC ATT GTG GAA AAT ATC ATC AAC TGC ATT GAG AAG AGT TAC AAG 192Lys Ser Ile Val Glu Asn Ile Ile Asn Cys Ile Glu Lys Ser Tyr Lys50 55 60TCC ATC TTT GTT TTG TCT CCC AAC TTT GTC CAG AGT GAG TGG TGC CAT 240Ser Ile Phe Val Leu Ser Pro Asn Phe Val Gln Ser Glu Trp Cys His65 70 75 80TAC GAA CTC TAT TTT GCC CAT CAC AAT CTC TTT CAT GAA GGA TCT AAT 288Tyr Glu Leu Tyr Phe Ala His His Asn Leu Phe His Glu Gly Ser Asn85 90 95AAC TTA ATC CTC ATC TTA CTG GAA CCC ATT CCA CAG AAC AGC ATT CCC 336Asn Leu Ile Leu Ile Leu Leu Glu Pro Ile Pro Gln Asn Ser Ile Pro100 105 110AAC AAG TAC CAC AAG CTG AAG GCT CTC ATG ACG CAG CGG ACT TAT TTG 384Asn Lys Tyr His Lys Leu Lys Ala Leu Met Thr Gln Arg Thr Tyr Leu115 120 125CAG TGG CCC AAG GAG AAA AGC AAA CGT GGG CTC TTT TGG GCT 426Gln Trp Pro Lys Glu Lys Ser Lys Arg Gly Leu Phe Trp Ala130 135 140A 427(2)SEQ ID NO22的信息(i)顺序特征(A)长度142个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO22Lys Asn Ser Lys Glu Asn Leu Gln Phe His Ala Phe Ile Ser Tyr Ser1 5 10 15Glu His Asp Ser Ala Trp Val Lys Ser Glu Leu Val Pro Tyr Leu Glu20 25 30Lys Glu Asp Ile Gln Ile Cys Leu His Glu Arg Asn Phe Val Pro Gly35 40 45Lys Ser Ile Val Glu Asn Ile Ile Asn Cys Ile Glu Lys Ser Tyr Lys50 55 60Ser Ile Phe Val Leu Ser Pro Asn Phe Val Gln Ser Glu Trp Cys His65 70 75 80Tyr Glu Leu Tyr Phe Ala His His Asn Leu Phe His Glu Gly Ser Asn85 90 95Asn Leu Ile Leu Ile Leu Leu Glu Pro Ile Pro Gln Asn Ser Ile Pro100 105 110Asn Lys Tyr His Lys Leu Lys Ala Leu Met Thr Gln Arg Thr Tyr Leu115 120 125Gln Trp Pro Lys Glu Lys Ser Lys Arg Gly Leu Phe Trp Ala130 135 140(2)SEQ ID NO23的信息(i)顺序特征(A)长度662个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...627(ix)特征(A)名称/关键词misc特征(B)位置54(D)其它信息/注释=“核苷酸54、103和345标示为A;每个可以为A或G”(ix)特征(A)名称/关键词misc特征(B)位置313(D)其它信息/注释=“核苷酸313标示为G;可以为G或T”(ix)特征(A)名称/关键词misc特征(B)位置316(D)其它信息/注释=“核苷酸316、380、407和408标示为C;可以为A、C、G或T”(xi)顺序描述SEQ ID NO23GCT TCC ACC TGT GCC TGG CCT GGC TTC CCT GGC GGG GGC GGC AAA GTG48Ala Ser Thr Cys Ala Trp Pro Gly Phe Pro Gly Gly Gly Gly Lys Val1 5 10 15GGC GAA ATG AGG ATG CCC TGC CCT ACG ATG CCT TCG TGG TCT TCG ACA96Gly Glu Met Arg Met Pro Cys Pro Thr Met Pro Ser Trp Ser Ser Thr20 25 30AAA CGC AGA GCG CAG TGG CAG ACT GGG TGT ACA ACG AGC TTC GGG GGC 144Lys Arg Arg Ala Gln Trp Gln Thr Gly Cys Thr Thr Ser Phe Gly Gly35 40 45AGC TGG AGG AGT GCC GTG GGC GCT GGG CAC TCC GCC TGT GCC TGG AGG 192Ser Trp Arg Ser Ala Val Gly Ala Gly His Ser Ala Cys Ala Trp Arg50 55 60AAC GCG ACT GGC TGC CTG GCA AAA CCC TCT TTG AGA ACC TGT GGG CCT 240Asn Ala Thr Gly Cys Leu Ala Lys Pro Ser Leu Arg Thr Cys Gly Pro65 70 75 80CGG TCT ATG GCA GCC GCA AGA CGC TGT TTG TGC TGG CCC ACA CGG ACC 288Arg Ser Met Ala Ala Ala Arg Arg Cys Leu Cys Trp Pro Thr Arg Thr85 90 95GGG TCA GTG GTC TCT TGC GCG CCA GTT CTC CTG CTG GCC CAG CAG CGC 336Gly Ser Val Val Ser Cys Ala Pro Val Leu Leu Leu Ala Gln Gln Arg100 105 110CTG CTG GAA GAC CGC AAG GAC GTC GTG GTG CTG GTG ATC CTA ACG CCT 384Leu Leu Glu Asp Arg Lys Asp Val Val Val Leu Val Ile Leu Thr Pro115 120 125GAC GGC CAA GCC TCC CGA CTA CCC GAT GCG CTG ACC AGC GCC TCT GCC 432Asp Gly Gln Ala Ser Arg Leu Pro Asp Ala Leu Thr Ser Ala Ser Ala130 135 140GCC AGA GTG TCC TCC TCT GGC CCC ACC AGC CCA GTG GTC GCG CAG CTT 480Ala Arg Val Ser Ser Ser Gly Pro Thr Ser Pro Val Val Ala Gln Leu145 150 155 160CTG AGG CCA GCA TGC ATG GCC CTG ACC AGG GAC AAC CAC CAC TTC TAT 528Leu Arg Pro Ala Cys Met Ala Leu Thr Arg Asp Asn His His Phe Tyr165 170 175AAC CGG AAC TTC TGC CAG GGA ACC CAC GGC CGA ATA GCC GTG AGC CGG 576Asn Arg Asn Phe Cys Gln Gly Thr His Gly Arg Ile Ala Val Ser Arg180 185 190AAT CCT GCA CGG TGC CAC CTC CAC ACA CAC CTA ACA TAT GCC TGC CTG 624Asn Pro Ala Arg Cys His Leu His Thr His Leu Thr Tyr Ala Cys Leu195 200 205ATC TGACCAACAC ATGCTCGCCA CCCTCACCAC ACACC662Ile(2)SEQ ID NO24的信息(i)顺序特征(A)长度209个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO24Ala Ser Thr Cys Ala Trp Pro Gly Phe Pro Gly Gly Gly Gly Lys Val1 5 10 15Gly Glu Met Arg Met Pro Cys Pro Thr Met Pro Ser Trp Ser Ser Thr20 25 30Lys Arg Arg Ala Gln Trp Gln Thr Gly Cys Thr Thr Ser Phe Gly Gly35 40 45Ser Trp Arg Ser Ala Val Gly Ala Gly His Ser Ala Cys Ala Trp Arg50 55 60Asn Ala Thr Gly Cys Leu Ala Lys Pro Ser Leu Arg Thr Cys Gly Pro65 70 75 80Arg Ser Met Ala Ala Ala Arg Arg Cys Leu Cys Trp Pro Thr Arg Thr85 90 95Gly Ser Val Val Ser Cys Ala Pro Val Leu Leu Leu Ala Gln Gln Arg100 105 110Leu Leu Glu Asp Arg Lys Asp Val Val Val Leu Val Ile Leu Thr Pro115 120 125Asp Gly Gln Ala Ser Arg Leu Pro Asp Ala Leu Thr Ser Ala Ser Ala130 135 140Ala Arg Val Ser Ser Ser Gly Pro Thr Ser Pro Val Val Ala Gln Leu145 150 155 160Leu Arg Pro Ala Cys Met Ala Leu Thr Arg Asp Asn His His Phe Tyr165 170 175Asn Arg Asn Phe Cys Gln Gly Thr His Gly Arg Ile Ala Val Ser Arg180 185 190Asn Pro Ala Arg Cys His Leu His Thr His Leu Thr Tyr Ala Cys Leu195 200 205Ile(2)SEQ ID NO25的信息(i)顺序特征(A)长度4865个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置107...2617(ix)特征(A)名称/关键词成熟肽(B)位置173...2617(ix)特征(A)名称/关键词misc特征(B)位置81(D)其它信息/注释=“核苷酸81、3144、3205和3563标示为A,每个可以为A、C、G或T”(ix)特征(A)名称/关键词misc特征(B)位置84(D)其它信息/注释=“核苷酸84标示为C,可以为C或G”(ix)特征(A)名称/关键词misc特征(B)位置739(D)其它信息/注释=“核苷酸739标示为C,可以为C或T”(ix)特征(A)名称/关键词misc特征(B)位置3132(D)其它信息/注释=“核苷酸3132、3532、3538和3553标示为G,每个可以为G或T”(ix)特征(A)名称/关键词misc特征(B)位置3638(D)其它信息/注释=“核苷酸A,可以为A或T”
(ix)特征(A)名称/关键词misc特征(B)位置3677(D)其它信息/注释=“核苷酸3677、3685和3736标示为C,每个可以为A或C”(xi)顺序描述SEQ ID NO25AAAATACTCC CTTGCCTCAA AAACTGCTCG GTCAAACGGT GATAGCAAAC CACGCATTCA 60CAGGGCCACT GCTGCTCACA AAACCAGTGA GGATGATGCC AGGATG ATG TCT GCC115Met Ser Ala-22 -20TCG CGC CTG GCT GGG ACT CTG ATC CCA GCC ATG GCC TTC CTC TCC TGC 163Ser Arg Leu Ala Gly Thr Leu Ile Pro Ala Met Ala Phe Leu Ser Cys-15 -10 -5GTG AGA CCA GAA AGC TGG GAG CCC TGC GTG GAG GTT CCT AAT ATT ACT 211Val Arg Pro Glu Ser Trp Glu Pro Cys Val Glu Val Pro Asn Ile Thr1 5 10TAT CAA TGC ATG GAG CTG AAT TTC TAC AAA ATC CCC GAC AAC CTC CCC 259Tyr Gln Cys Met Glu Leu Asn Phe Tyr Lys Ile Pro Asp Asn Leu Pro15 20 25TTC TCA ACC AAG AAC CTG GAC CTG AGC TTT AAT CCC CTG AGG CAT TTA 307Phe Ser Thr Lys Asn Leu Asp Leu Ser Phe Asn Pro Leu Arg His Leu30 35 40 45GGC AGC TAT AGC TTC TTC AGT TTC CCA GAA CTG CAG GTG CTG GAT TTA 355Gly Ser Tyr Ser Phe Phe Ser Phe Pro Glu Leu Gln Val Leu Asp Leu50 55 60TCC AGG TGT GAA ATC CAG ACA ATT GAA GAT GGG GCA TAT CAG AGC CTA 403Ser Arg Cys Glu Ile Gln Thr Ile Glu Asp Gly Ala Tyr Gln Ser Leu65 70 75AGC CAC CTC TCT ACC TTA ATA TTG ACA GGA AAC CCC ATC CAG AGT TTA 451Ser His Leu Ser Thr Leu Ile Leu Thr Gly Asn Pro Ile Gln Ser Leu80 85 90GCC CTG GGA GCC TTT TCT GGA CTA TCA AGT TTA CAG AAG CTG GTG GCT 499Ala Leu Gly Ala Phe Ser Gly Leu Ser Ser Leu Gln Lys Leu Val Ala95 100 105GTG GAG ACA AAT CTA GCA TCT CTA GAG AAC TTC CCC ATT GGA CAT CTC 547Val Glu Thr Asn Leu Ala Ser Leu Glu Asn Phe Pro Ile Gly His Leu110 115 120 125AAA ACT TTG AAA GAA CTT AAT GTG GCT CAC AAT CTT ATC CAA TCT TTC 595Lys Thr Leu Lys Glu Leu Asn Val Ala His Asn Leu Ile Gln Ser Phe130 135 140AAA TTA CCT GAG TAT TTT TCT AAT CTG ACC AAT CTA GAG CAC TTG GAC 643Lys Leu Pro Glu Tyr Phe Ser Asn Leu Thr Asn Leu Glu His Leu Asp145 150 155CTT TCC AGC AAC AAG ATT CAA AGT ATT TAT TGC ACA GAC TTG CGG GTT 691Leu Ser Ser Asn Lys Ile Gln Ser Ile Tyr Cys Thr Asp Leu Arg Val160 165 170CTA CAT CAA ATG CCC CTA CTC AAT CTC TCT TTA GAC CTG TCC CTG AAC 739Leu His Gln Met Pro Leu Leu Asn Leu Ser Leu Asp Leu Ser Leu Asn175 180 185CCT ATG AAC TTT ATC CAA CCA GGT GCA TTT AAA GAA ATT AGG CTT CAT 787Pro Met Asn Phe Ile Gln Pro Gly Ala Phe Lys Glu Ile Arg Leu His190 195 200 205AAG CTG ACT TTA AGA AAT AAT TTT GAT AGT TTA AAT GTA ATG AAA ACT 835Lys Leu Thr Leu Arg Asn Asn Phe Asp Ser Leu Asn Val Met Lys Thr210 215 220TGT ATT CAA GGT CTG GCT GGT TTA GAA GTC CAT CGT TTG GTT CTG GGA 883Cys Ile Gln Gly Leu Ala Gly Leu Glu Val His Arg Leu Val Leu Gly225 230 235GAA TTT AGA AAT GAA GGA AAC TTG GAA AAG TTT GAC AAA TCT GCT CTA 931Glu Phe Arg Asn Glu Gly Asn Leu Glu Lys Phe Asp Lys Ser Ala Leu240 245 250GAG GGC CTG TGC AAT TTG ACC ATT GAA GAA TTC CGA TTA GCA TAC TTA 979Glu Gly Leu Cys Asn Leu Thr Ile Glu Glu Phe Arg Leu Ala Tyr Leu255 260265GAC TAC TAC CTC GAT GAT ATT ATT GAC TTA TTT AAT TGT TTG ACA AAT 1027Asp Tyr Tyr Leu Asp Asp Ile Ile Asp Leu Phe Asn Cys Leu Thr Asn270 275 280 285GTT TCT TCA TTT TCC CTG GTG AGT GTG ACT ATT GAA AGG GTA AAA GAC 1075Val Ser Ser Phe Ser Leu Val Ser Val Thr Ile Glu Arg Val Lys Asp290 295 300TTT TCT TAT AAT TTC GGA TGG CAA CAT TTA GAA TTA GTT AAC TGT AAA 1123Phe Ser Tyr Asn Phe Gly Trp Gln His Leu Glu Leu Val Asn Cys Lys305 310 315TTT GGA CAG TTT CCC ACA TTG AAA CTC AAA TCT CTC AAA AGG CTT ACT 117lPhe Gly Gln Phe Pro Thr Leu Lys Leu Lys Ser Leu Lys Arg Leu Thr320 325 330TTC ACT TCC AAC AAA GGT GGG AAT GCT TTT TCA GAA GTT GAT CTA CCA 1219Phe Thr Ser Asn Lys Gly Gly Asn Ala Phe Ser Glu Val Asp Leu Pro335 340 345AGC CTT GAG TTT CTA GAT CTC AGT AGA AAT GGC TTG AGT TTC AAA GGT 1267Ser Leu Glu Phe Leu Asp Leu Ser Arg Asn Gly Leu Ser Phe Lys Gly350 355 360 365TGC TGT TCT CAA AGT GAT TTT GGG ACA ACC AGC CTA AAG TAT TTA GAT 1315Cys Cys Ser Gln Ser Asp Phe Gly Thr Thr Ser Leu Lys Tyr Leu Asp370 375 380CTG AGC TTC AAT GGT GTT ATT ACC ATG AGT TCA AAC TTC TTG GGC TTA 1363Leu Ser Phe Asn Gly Val Ile Thr Met Ser Ser Asn Phe Leu Gly Leu385 390 395GAA CAA CTA GAA CAT CTG GAT TTC CAG CAT TCC AAT TTG AAA CAA ATG 1411Glu Gln Leu Glu His Leu Asp Phe Gln His Ser Asn Leu Lys Gln Met400 405 410AGT GAG TTT TCA GTA TTC CTA TCA CTC AGA AAC CTC ATT TAC CTT GAC 1459Ser Glu Phe Ser Val Phe Leu Ser Leu Arg Asn Leu Ile Tyr Leu Asp415 420 425ATT TCT CAT ACT CAC ACC AGA GTT GCT TTC AAT GGC ATC TTC AAT GGC 1507Ile Ser His Thr His Thr Arg Val Ala Phe Asn Gly Ile Phe Asn Gly430 435 440 445TTG TCC AGT CTC GAA GTC TTG AAA ATG GCT GGC AAT TCT TTC CAG GAA 1555Leu Ser Ser Leu Glu Val Leu Lys Met Ala Gly Asn Ser Phe Gln Glu450 455 460AAC TTC CTT CCA GAT ATC TTC ACA GAG CTG AGA AAC TTG ACC TTC CTG 1603Asn Phe Leu Pro Asp Ile Phe Thr Glu Leu Arg Asn Leu Thr Phe Leu465 470 475GAC CTC TCT CAG TGT CAA CTG GAG CAG TTG TCT CCA ACA GCA TTT AAC 1651Asp Leu Ser Gln Cys Gln Leu Glu Gln Leu Ser Pro Thr Ala Phe Asn480 485 490TCA CTC TCC AGT CTT CAG GTA CTA AAT ATG AGC CAC AAC AAC TTC TTT 1699Ser Leu Ser Ser Leu Gln Val Leu Asn Met Ser His Asn Asn Phe Phe495 500 505TCA TTG GAT ACG TTT CCT TAT AAG TGT CTG AAC TCC CTC CAG GTT CTT 1747Ser Leu Asp Thr Phe Pro Tyr Lys Cys Leu Asn Ser Leu Gln Val Leu510 515 520 525GAT TAC AGT CTC AAT CAC ATA ATG ACT TCC AAA AAA CAG GAA CTA CAG 1795Asp Tyr Ser Leu Asn His Ile Met Thr Ser Lys Lys Gln Glu Leu Gln530 535 540CAT TTT CCA AGT AGT CTA GCT TTC TTA AAT CTT ACT CAG AAT GAC TTT 1843His Phe Pro Ser Ser Leu Ala Phe Leu Asn Leu Thr Gln Asn Asp Phe545 550 555GCT TGT ACT TGT GAA CAC CAG AGT TTC CTG CAA TGG ATC AAG GAC CAG 1891Ala Cys Thr Cys Glu His Gln Ser Phe Leu Gln Trp Ile Lys Asp Gln560 565 570AGG CAG CTC TTG GTG GAA GTT GAA CGA ATG GAA TGT GCA ACA CCT TCA 1939Arg Gln Leu Leu Val Glu Val Glu Arg Met Glu Cys Ala Thr Pro Ser575 580 585GAT AAG CAG GGC ATG CCT GTG CTG AGT TTG AAT ATC ACC TGT CAG ATG 1987Asp Lys Gln Gly Met Pro Val Leu Ser Leu Asn Ile Thr Cys Gln Met590 595 600 605AAT AAG ACC ATC ATT GGT GTG TCG GTC CTC AGT GTG CTT GTA GTA TCT 2035Asn Lys Thr Ile Ile Gly Val Ser Val Leu Ser Val Leu Val Val Ser610 615 620GTT GTA GCA GTT CTG GTC TAT AAG TTC TAT TTT CAC CTG ATG CTT CTT 2083Val Val Ala Val Leu Val Tyr Lys Phe Tyr Phe His Leu Met Leu Leu625 630 635GCT GGC TGC ATA AAG TAT GGT AGA GGT GAA AAC ATC TAT GAT GCC TTT 2131Ala Gly Cys Ile Lys Tyr Gly Arg Gly Glu Asn Ile Tyr Asp Ala Phe640 645 650GTT ATC TAC TCA AGC CAG GAT GAG GAC TGG GTA AGG AAT GAG CTA GTA 2179Val Ile Tyr Ser Ser Gln Asp Glu Asp Trp Val Arg Asn Glu Leu Val655 660 665AAG AAT TTA GAA GAA GGG GTG CCT CCA TTT CAG CTC TGC CTT CAC TAC 2227Lys Asn Leu Glu Glu Gly Val Pro Pro Phe Gln Leu Cys Leu His Tyr670 675 680 685AGA GAC TTT ATT CCC GGT GTG GCC ATT GCT GCC AAC ATC ATC CAT GAA 2275Arg Asp Phe Ile Pro Gly Val Ala Ile Ala Ala Asn Ile Ile His Glu690 695 700GGT TTC CAT AAA AGC CGA AAG GTG ATT GTT GTG GTG TCC CAG CAC TTC 2323Gly Phe His Lys Ser Arg Lys Val Ile Val Val Val Ser Gln His Phe705 710 715ATC CAG AGC CGC TGG TGT ATC TTT GAA TAT GAG ATT GCT CAG ACC TGG 2371Ile Gln Ser Arg Trp Cys Ile Phe Glu Tyr Glu Ile Ala Gln Thr Trp720 725 730CAG TTT CTG AGC AGT CGT GCT GGT ATC ATC TTC ATT GTC CTG CAG AAG 2419Gln Phe Leu Ser Ser Arg Ala Gly Ile Ile Phe Ile Val Leu Gln Lys735 740 745GTG GAG AAG ACC CTG CTC AGG CAG CAG GTG GAG CTG TAC CGC CTT CTC 2467Val Glu Lys Thr Leu Leu Arg Gln Gln Val Glu Leu Tyr Arg Leu Leu750 755 760 765AGC AGG AAC ACT TAC CTG GAG TGG GAG GAC AGT GTC CTG GGG CGG CAC 2515Ser Arg Asn Thr Tyr Leu Glu Trp Glu Asp Ser Val Leu Gly Arg His770 775 780ATC TTC TGG AGA CGA CTC AGA AAA GCC CTG CTG GAT GGT AAA TCA TGG 2563Ile Phe Trp Arg Arg Leu Arg Lys Ala Leu Leu Asp Gly Lys Ser Trp785 790 795AAT CCA GAA GGA ACA GTG GGT ACA GGA TGC AAT TGG CAG GAA GCA ACA 2611Asn Pro Glu Gly Thr Val Gly Thr Gly Cys Asn Trp Gln Glu Ala Thr800 805 810TCT ATC TGAAGAGGAA AAATAAAAAC CTCCTGAGGC ATTTCTTGCC CAGCTGGGTC 2667Ser Ile815CAACACTTGT TCAGTTAATA AGTATTAAAT GCTGCCACAT GTCAGGCCTT ATGCTAAGGG2727TGAGTAATTC CATGGTGCAC TAGATATGCA GGGCTGCTAA TCTCAAGGAG CTTCCAGTGC2787AGAGGGAATA AATGCTAGAC TAAAATACAG AGTCTTCCAG GTGGGCATTT CAACCAACTC2847AGTCAAGGAA CCCATGACAA AGAAAGTCAT TTCAACTCTT ACCTCATCAA GTTGAATAAA2907GACAGAGAAA ACAGAAAGAG ACATTGTTCT TTTCCTGAGT CTTTTGAATG GAAATTGTAT2967TATGTTATAG CCATCATAAA ACCATTTTGG TAGTTTTGAC TGAACTGGGT GTTCACTTTT3027TCCTTTTTGA TTGAATACAA TTTAAATTCT ACTTGATGAC TGCAGTCGTC AAGGGGCTCC3087TGATGCAAGA TGCCCCTTCC ATTTTAAGTC TGTCTCCTTA CAGAGGTTAA AGTCTAATGG3147CTAATTCCTA AGGAAACCTG ATTAACACAT GCTCACAACC ATCCTGGTCA TTCTCGAACA3207TGTTCTATTT TTTAACTAAT CACCCCTGAT ATATTTTTAT TTTTATATAT CCAGTTTTCA3267TTTTTTTACG TCTTGCCTAT AAGCTAATAT CATAAATAAG GTTGTTTAAG ACGTGCTTCA3327AATATCCATA TTAACCACTA TTTTTCAAGG AAGTATGGAA AAGTACACTC TGTCACTTTG3387TCACTCGATG TCATTCCAAA GTTATTGCCT ACTAAGTAAT GACTGTCATG AAAGCAGCAT3447TGAAATAATT TGTTTAAAGG GGGCACTCTT TTAAACGGGA AGAAAATTTC CGCTTCCTGG3507TCTTATCATG GACAATTTGG GCTAGAGGCA GGAAGGAAGT GGGATGACCT CAGGAAGTCA3567CCTTTTCTTG ATTCCAGAAA CATATGGGCT GATAAACCCG GGGTGACCTC ATGAAATGAG3627TTGCAGCAGA AGTTTATTTT TTTCAGAACA AGTGATGTTT GATGGACCTC TGAATCTCTT3687TAGGGAGACA CAGATGGCTG GGATCCCTCC CCTGTACCCT TCTCACTGCC AGGAGAACTA3747CGTGTGAAGG TATTCAAGGC AGGGAGTATA CATTGCTGTT TCCTGTTGGG CAATGCTCCT3807TGACCACATT TTGGGAAGAG TGGATGTTAT CATTGAGAAA ACAATGTGTC TGGAATTAAT3867GGGGTTCTTA TAAAGAAGGT TCCCAGAAAA GAATGTTCAT TCCAGCTTCT TCAGGAAACA3927GGAACATTCA AGGAAAAGGA CAATCAGGAT GTCATCAGGG AAATGAAAAT AAAAACCACA3987ATGAGATATC ACCTTATACC AGGTAGATGG CTACTATAAA AAAATGAAGT GTCATCAAGG4047ATATAGAGAA ATTGGAACCC TTCTTCACTG CTGGAGGGAA TGGAAAATGG TGTAGCCGTT4107ATGAAAAACA GTACGGAGGT TTCTCAAAAA TTAAAAATAG AACTGCTATA TGATCCAGCA4167ATCTCACTTC TGTATATATA CCCAAAATAA TTGAAATCAG AATTTCAAGA AAATATTTAC4227ACTCCCATGT TCATTGTGGC ACTCTTCACA ATCACTGTTT CCAAAGTTAT GGAAACAACC4287CAAATTTCCA TTGGAAAATA AATGGACAAA GGAAATGTGC ATATAACGTA CAATGGGGAT4347ATTATTCAGC CTAAAAAAAG GGGGGATCCT GTTATTTATG ACAACATGAA TAAACCCGGA4407GGCCATTATG CTATGTAAAA TGAGCAAGTA ACAGAAAGAC AAATACTGCC TGATTTCATT4467TATATGAGGT TCTAAAATAG TCAAACTCAT AGAAGCAGAG AATAGAACAG TGGTTCCTAG4527GGAAAAGGAG GAAGGGAGAA ATGAGGAAAT AGGGAGTTGT CTAATTGGTA TAAAATTATA4587GTATGCAAGA TGAATTAGCT CTAAAGATCA GCTGTATAGC AGAGTTCGTA TAATGAACAA4647TACTGTATTA TGCACTTAAC ATTTTGTTAA GAGGGTACCT CTCATGTTAA GTGTTCTTAC4707CATATACATA TACACAAGGA AGCTTTTGGA GGTGATGGAT ATATTTATTA CCTTGATTGT4767GGTGATGGTT TGACAGGTAT GTGACTATGT CTAAACTCAT CAAATTGTAT ACATTAAATA4827TATGCAGTTT TATAATATCA AAAAAAAAAA AAAAAAAA4865(2)SEQ ID NO26的信息(i)顺序特征(A)长度837个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO26Met Ser Ala Ser Arg Leu Ala Gly Thr Leu Ile Pro Ala Met Ala Phe-22 -20 -15 -10Leu Ser Cys Val Arg Pro Glu Ser Trp Glu Pro Cys Val Glu Val Pro-5 1 5 10Asn Ile Thr Tyr Gln Cys Met Glu Leu Asn Phe Tyr Lys Ile Pro Asp15 20 25Asn Leu Pro Phe Ser Thr Lys Asn Leu Asp Leu Ser Phe Asn Pro Leu30 35 40Arg His Leu Gly Ser Tyr Ser Phe Phe Ser Phe Pro Glu Leu Gln Val45 50 55Leu Asp Leu Ser Arg Cys Glu Ile Gln Thr Ile Glu Asp Gly Ala Tyr60 65 70Gln Ser Leu Ser His Leu Ser Thr Leu Ile Leu Thr Gly Asn Pro Ile75 80 85 90Gln Ser Leu Ala Leu Gly Ala Phe Ser Gly Leu Ser Ser Leu Gln Lys95 100 105Leu Val Ala Val Glu Thr Asn Leu Ala Ser Leu Glu Asn Phe Pro Ile110 115 120Gly His Leu Lys Thr Leu Lys Glu Leu Asn Val Ala His Asn Leu Ile125 130 135Gln Ser Phe Lys Leu Pro Glu Tyr Phe Ser Asn Leu Thr Asn Leu Glu140 145 150His Leu Asp Leu Ser Ser Asn Lys Ile Gln Ser Ile Tyr Cys Thr Asp155 160 165 170Leu Arg Val Leu His Gln Met Pro Leu Leu Asn Leu Ser Leu Asp Leu175 180 185Ser Leu Asn Pro Met Asn Phe Ile Gln Pro Gly Ala Phe Lys Glu Ile190 195 200Arg Leu His Lys Leu Thr Leu Arg Asn Asn Phe Asp Ser Leu Asn Val205210 215Met Lys Thr Cys Ile Gln Gly Leu Ala Gly Leu Glu Val His Arg Leu220 225 230Val Leu Gly Glu Phe Arg Asn Glu Gly Asn Leu Glu Lys Phe Asp Lys235 240 245 250Ser Ala Leu Glu Gly Leu Cys Asn Leu Thr Ile Glu Glu Phe Arg Leu255 260 265Ala Tyr Leu Asp Tyr Tyr Leu Asp Asp Ile Ile Asp Leu Phe Asn Cys270 275 280Leu Thr Asn Val Ser Ser Phe Ser Leu Val Ser Val Thr Ile Glu Arg285 290 295Val Lys Asp Phe Ser Tyr Asn Phe Gly Trp Gln His Leu Glu Leu Val300 305 310Asn Cys Lys Phe Gly Gln Phe Pro Thr Leu Lys Leu Lys Ser Leu Lys315 320 325 330Arg Leu Thr Phe Thr Ser Asn Lys Gly Gly Asn Ala Phe Ser Glu Val335 340 345Asp Leu Pro Ser Leu Glu Phe Leu Asp Leu Ser Arg Asn Gly Leu Ser350 355 360Phe Lys Gly Cys Cys Ser Gln Ser Asp Phe Gly Thr Thr Ser Leu Lys365 370 375Tyr Leu Asp Leu Ser Phe Asn Gly Val Ile Thr Met Ser Ser Asn Phe380 385 390Leu Gly Leu Glu Gln Leu Glu His Leu Asp Phe Gln His Ser Asn Leu395 400 405 410Lys Gln Met Ser Glu Phe Ser Val Phe Leu Ser Leu Arg Asn Leu Ile415 420 425Tyr Leu Asp Ile Ser His Thr His Thr Arg Val Ala Phe Asn Gly Ile430 435 440Phe Asn Gly Leu Ser Ser Leu Glu Val Leu Lys Met Ala Gly Asn Ser445 450 455Phe Gln Glu Asn Phe Leu Pro Asp Ile Phe Thr Glu Leu Arg Asn Leu460 465 470Thr Phe Leu Asp Leu Ser Gln Cys Gln Leu Glu Gln Leu Ser Pro Thr475 480 485 490Ala Phe Asn Ser Leu Ser Ser Leu Gln Val Leu Asn Met Ser His Asn495 500 505Asn Phe Phe Ser Leu Asp Thr Phe Pro Tyr Lys Cys Leu Asn Ser Leu510 515 520Gln Val Leu Asp Tyr Ser Leu Asn His Ile Met Thr Ser Lys Lys Gln525 530 535Glu Leu Gln His Phe Pro Ser Ser Leu Ala Phe Leu Asn Leu Thr Gln540 545 550Asn Asp Phe Ala Cys Thr Cys Glu His Gln Ser Phe Leu Gln Trp Ile555 560 565 570Lys Asp Gln Arg Gln Leu Leu Val Glu Val Glu Arg Met Glu Cys Ala575 580 585Thr Pro Ser Asp Lys Gln Gly Met Pro Val Leu Ser Leu Asn Ile Thr590 595 600Cys Gln Met Asn Lys Thr Ile Ile Gly Val Ser Val Leu Ser Val Leu605 610 615Val Val Ser Val Val Ala Val Leu Val Tyr Lys Phe Tyr Phe His Leu620 625 630Met Leu Leu Ala Gly Cys Ile Lys Tyr Gly Arg Gly Glu Asn Ile Tyr635 640 645 650Asp Ala Phe Val Ile Tyr Ser Ser Gln Asp Glu Asp Trp Val Arg Asn655 660 665Glu Leu Val Lys Asn Leu Glu Glu Gly Val Pro Pro Phe Gln Leu Cys670 675 680Leu His Tyr Arg Asp Phe Ile Pro Gly Val Ala Ile Ala Ala Asn Ile685 690 695Ile His Glu Gly Phe His Lys Ser Arg Lys Val Ile Val Val Val Ser700 705 710Gln His Phe Ile Gln Ser Arg Trp Cys Ile Phe Glu Tyr Glu Ile Ala715 720 725 730Gln Thr Trp Gln Phe Leu Ser Ser Arg Ala Gly Ile Ile Phe Ile Val735 740 745Leu Gln Lys Val Glu Lys Thr Leu Leu Arg Gln Gln Val Glu Leu Tyr750 755 760Arg Leu Leu Ser Arg Asn Thr Tyr Leu Glu Trp Glu Asp Ser Val Leu765 770 775Gly Arg His Ile Phe Trp Arg Arg Leu Arg Lys Ala Leu Leu Asp Gly780 785 790Lys Ser Trp Asn Pro Glu Gly Thr Val Gly Thr Gly Cys Asn Trp Gln795 800 805 810Glu Ala Thr Ser Ile815(2)SEQ ID NO27的信息(i)顺序特征(A)长度300个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性
(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...300(ix)特征(A)名称/关键词misc特征(B)位置186(D)其它信息/注释=“核苷酸186、196、217、276和300标示为C,每个可以为A、C、G或T”(xi)顺序描述SEQ ID NO27TCC TAT TCT ATG GAA AAA GAT GCT TTC CTA TTT ATG AGA AAT TTG AAG48Ser Tyr Ser Met Glu Lys Asp Ala Phe Leu Phe Met Arg Asn Leu Lys1 5 10 15GTT CTC TCA CTA AAA GAT AAC AAT GTC ACA GCT GTC CCC ACC ACT TTG96Val Leu Ser Leu Lys Asp Asn Asn Val Thr Ala Val Pro Thr Thr Leu20 25 30CCA CCT AAT TTA CTA GAG CTC TAT CTT TAT AAC AAT ATC ATT AAG AAA 144Pro Pro Asn Leu Leu Glu Leu Tyr Leu Tyr Asn Asn Ile Ile Lys Lys35 40 45ATC CAA GAA AAT GAT TTC AAT AAC CTC AAT GAG TTG CAA GTC CTT GAC 192Ile Gln Glu Asn Asp Phe Asn Asn Leu Asn Glu Leu Gln Val Leu Asp50 55 60CTA CGT GGA AAT TGC CCT CGA TGT CAT AAT GTC CCA TAT CCG TGT ACA 240Leu Arg Gly Asn Cys Pro Arg Cys His Asn Val Pro Tyr Pro Cys Thr65 70 75 80CCG TGT GAA AAT AAT TCC CCC TTA CAG ATC CAT GAC AAT GCT TTC AAT 288Pro Cys Glu Asn Asn Ser Pro Leu Gln Ile His Asp Asn Ala Phe Asn85 90 95TCA TCG ACA GAC 300Ser Ser Thr Asp100(2)SEQ ID NO28的信息(i)顺序特征(A)长度100个氨基酸(B)类型氨基酸(D)拓扑学线性
(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO28Ser Tyr Ser Met Glu Lys Asp Ala Phe Leu Phe Met Arg Asn Leu Lys1 5 10 15Val Leu Ser Leu Lys Asp Asn Asn Val Thr Ala Val Pro Thr Thr Leu20 25 30Pro Pro Asn Leu Leu Glu Leu Tyr Leu Tyr Asn Asn Ile Ile Lys Lys35 40 45Ile Gln Glu Asn Asp Phe Asn Asn Leu Asn Glu Leu Gln Val Leu Asp50 55 60Leu Arg Gly Asn Cys Pro Arg Cys His Asn Val Pro Tyr Pro Cys Thr65 70 75 80Pro Cys Glu Asn Asn Ser Pro Leu Gln Ile His Asp Asn Ala Phe Asn85 90 95Ser Ser Thr Asp100(2)SEQ ID NO29的信息(i)顺序特征(A)长度1756个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...1182(ix)特征(A)名称/关键词misc特征(B)位置1643(D)其它信息/注释=“核苷酸1643标示为A,可以为A或G”(ix)特征(A)名称/关键词misc特征(B)位置1664(D)其它信息/注释=“核苷酸1664标示为C,可以为A、C、G或T”
(ix)特征(A)名称/关键词misc特征(B)位置1680(D)其它信息/注释=“核苷酸1680和1735标示为G,可以为G或T”(ix)特征(A)名称/关键词misc特征(B)位置1719(D)其它信息/注释=“核苷酸1719标示为C,可以为C或T”(ix)特征(A)名称/关键词misc特征(B)位置1727(D)其它信息/注释=“核苷酸1727标示为A,可以为A、G或T”(xi)顺序描述SEQ ID NO29TCT CCA GAA ATT CCC TGG AAT TCC TTG CCT CCT GAG GTT TTT GAG GGT48Ser Pro Glu Ile Pro Trp Asn Ser Leu Pro Pro Glu Val Phe Glu Gly1 5 10 15ATG CCG CCA AAT CTA AAG AAT CTC TCC TTG GCC AAA AAT GGG CTC AAA96Met Pro Pro Asn Leu Lys Asn Leu Ser Leu Ala Lys Asn Gly Leu Lys20 25 30TCT TTC TTT TGG GAC AGA CTC CAG TTA CTG AAG CAT TTG GAA ATT TTG 144Ser Phe Phe Trp Asp Arg Leu Gln Leu Leu Lys His Leu Glu Ile Leu35 40 45GAC CTC AGC CAT AAC CAG CTG ACA AAA GTA CCT GAG AGA TTG GCC AAC 192Asp Leu Ser His Asn Gln Leu Thr Lys Val Pro Glu Arg Leu Ala Asn50 55 60TGT TCC AAA AGT CTC ACA ACA CTG ATT CTT AAG CAT AAT CAA ATC AGG 240Cys Ser Lys Ser Leu Thr Thr Leu Ile Leu Lys His Asn Gln Ile Arg65 70 75 80CAA TTG ACA AAA TAT TTT CTA GAA GAT GCT TTG CAA TTG CGC TAT CTA 288Gln Leu Thr Lys Tyr Phe Leu Glu Asp Ala Leu Gln Leu Arg Tyr Leu85 90 95GAC ATC AGT TCA AAT AAA ATC CAG GTC ATT CAG AAG ACT AGC TTC CCA 336Asp Ile Ser Ser Asn Lys Ile Gln Val Ile Gln Lys Thr Ser Phe Pro100 105 110GAA AAT GTC CTC AAC AAT CTG GAG ATG TTG GTT TTA CAT CAC AAT CGC 384Glu Asn Val Leu Asn Asn Leu Glu Met Leu Val Leu His His Asn Arg115 120 125TTT CTT TGC AAC TGT GAT GCT GTG TGG TTT GTC TGG TGG GTT AAC CAT 432Phe Leu Cys Asn Cys Asp Ala Val Trp Phe Val Trp Trp Val Asn His130 135 140ACA GAT GTT ACT ATT CCA TAC CTG GCC ACT GAT GTG ACT TGT GTA GGT 480Thr Asp Val Thr Ile Pro Tyr Leu Ala Thr Asp Val Thr Cys Val Gly145 150 155 160CCA GGA GCA CAC AAA GGT CAA AGT GTC ATA TCC CTT GAT CTG TAT ACG 528Pro Gly Ala His Lys Gly Gln Ser Val Ile Ser Leu Asp Leu Tyr Thr165 170 175TGT GAG TTA GAT CTC ACA AAC CTG ATT CTG TTC TCA GTT TCC ATA TCA 576Cys Glu Leu Asp Leu Thr Asn Leu Ile Leu Phe Ser Val Ser Ile Ser180 185 190TCA GTC CTC TTT CTT ATG GTA GTT ATG ACA ACA AGT CAC CTC TTT TTC 624Ser Val Leu Phe Leu Met Val Val Met Thr Thr Ser His Leu Phe Phe195 200 205TGG GAT ATG TGG TAC ATT TAT TAT TTT TGG AAA GCA AAG ATA AAG GGG 672Trp Asp Met Trp Tyr Ile Tyr Tyr Phe Trp Lys Ala Lys Ile Lys Gly210 215 220TAT CCA GCA TCT GCA ATC CCA TGG AGT CCT TGT TAT GAT GCT TTT ATT 720Tyr Pro Ala Ser Ala Ile Pro Trp Ser Pro Cys Tyr Asp Ala Phe Ile225 230 235 240GTG TAT GAC ACT AAA AAC TCA GCT GTG ACA GAA TGG GTT TTG CAG GAG 768Val Tyr Asp Thr Lys Asn Ser Ala Val Thr Glu Trp Val Leu Gln Glu245 250 255CTG GTG GCA AAA TTG GAA GAT CCA AGA GAA AAA CAC TTC AAT TTG TGT 816Leu Val Ala Lys Leu Glu Asp Pro Arg Glu Lys His Phe Asn Leu Cys260 265 270CTA GAA GAA AGA GAC TGG CTA CCA GGA CAG CCA GTT CTA GAA AAC CTT 864Leu Glu Glu Arg Asp Trp Leu Pro Gly Gln Pro Val Leu Glu Asn Leu275 280 285TCC CAG AGC ATA CAG CTC AGC AAA AAG ACA GTG TTT GTG ATG ACA CAG 912Ser Gln Ser Ile Gln Leu Ser Lys Lys Thr Val Phe Val Met Thr Gln290 295 300AAA TAT GCT AAG ACT GAG AGT TTT AAG ATG GCA TTT TAT TTG TCT CAT 960Lys Tyr Ala Lys Thr Glu Ser Phe Lys Mer Ala Phe Tyr Leu Ser His305 310 315 320CAG AGG CTC CTG GAT GAA AAA GTG GAT GTG ATT ATC TTG ATA TTC TTG 1008Gln Arg Leu Leu Asp Glu Lys Val Asp Val Ile Ile Leu Ile Phe Leu325 330 335GAA AGA CCT CTT CAG AAG TCT AAG TTT CTT CAG CTC AGG AAG AGA CTC 1056Glu Arg Pro Leu Gln Lys Ser Lys Phe Leu Gln Leu Arg Lys Arg Leu340 345 350TGC AGG AGC TCT GTC CTT GAG TGG CCT GCA AAT CCA CAG GCT CAC CCA 1104Cys Arg Ser Ser Val Leu Glu Trp Pro Ala Asn Pro Gln Ala His Pro355 360 365TAC TTC TGG CAG TGC CTG AAA AAT GCC CTG ACC ACA GAC AAT CAT GTG 1152Tyr Phe Trp Gln Cys Leu Lys Asn Ala Leu Thr Thr Asp Asn His Val370 375 380GCT TAT AGT CAA ATG TTC AAG GAA ACA GTC TAGCTCTCTG AAGAATGTCA1202Ala Tyr Ser Gln Met Phe Lys Glu Thr Val385 390CCACCTAGGA CATGCCTTGG TACCTGAAGT TTTCATAAAG GTTTCCATAA ATGAAGGTCT1262GAATTTTTCC TAACAGTTGT CATGGCTCAG ATTGGTGGGA AATCATCAAT ATATGGCTAA1322GAAATTAAGA AGGGGAGACT GATAGAAGAT AATTTCTTTC TTCATGTGCC ATGCTCAGTT1382AAATATTTCC CCTAGCTCAA ATCTGAAAAA CTGTGCCTAG GAGACAACAC AAGGCTTTGA1442TTTATCTGCA TACAATTGAT AAGAGCCACA CATCTGCCCT GAAGAAGTAC TAGTAGTTTT1502AGTAGTAGGG TAAAAATTAC ACAAGCTTTC TCTCTCTCTG ATACTGAACT GTACCAGAGT1562TCAATGAAAT AAAAGCCCAG AGAACTTCTC AGTAAATGGT TTCATTATCA TGTAGTATCC1622ACCATGCAAT ATGCCACAAA ACCGCTACTG GTACAGGACA GCTGGTAGCT GCTTCAAGGC1682CTCTTATCAT TTTCTTGGGG CCCATGGAGG GGTTCTCTGG GAAAAAGGGA AGGTTTTTTT1742TGGCCATCCA TGAA 1756(2)SEQ ID NO30的信息(i)顺序特征(A)长度394个氨基酸
(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO30Ser Pro Glu Ile Pro Trp Asn Ser Leu Pro Pro Glu Val Phe Glu Gly1 5 10 15Met Pro Pro Asn Leu Lys Asn Leu Ser Leu Ala Lys Asn Gly Leu Lys20 25 30Ser Phe Phe Trp Asp Arg Leu Gln Leu Leu Lys His Leu Glu Ile Leu35 40 45Asp Leu Ser His Asn Gln Leu Thr Lys Val Pro Glu Arg Leu Ala Asn50 55 60Cys Ser Lys Ser Leu Thr Thr Leu Ile Leu Lys His Asn Gln Ile Arg65 70 75 80Gln Leu Thr Lys Tyr Phe Leu Glu Asp Ala Leu Gln Leu Arg Tyr Leu85 90 95Asp Ile Ser Ser Asn Lys Ile Gln Val Ile Gln Lys Thr Ser Phe Pro100 105 110Glu Asn Val Leu Asn Asn Leu Glu Met Leu Val Leu His His Asn Arg115 120 125Phe Leu Cys Asn Cys Asp Ala Val Trp Phe Val Trp Trp Val Asn His130 135 140Thr Asp Val Thr Ile Pro Tyr Leu Ala Thr Asp Val Thr Cys Val Gly145 150 155 160Pro Gly Ala His Lys Gly Gln Ser Val Ile Ser Leu Asp Leu Tyr Thr165 170 175Cys Glu Leu Asp Leu Thr Asn Leu Ile Leu Phe Ser Val Ser Ile Ser180 185 190Ser Val Leu Phe Leu Met Val Val Met Thr Thr Ser His Leu Phe Phe195 200 205Trp Asp Met Trp Tyr Ile Tyr Tyr Phe Trp Lys Ala Lys Ile Lys Gly210 215 220Tyr Pro Ala Ser Ala Ile Pro Trp Ser Pro Cys Tyr Asp Ala Phe Ile225 230 235 240Val Tyr Asp Thr Lys Asn Ser Ala Val Thr Glu Trp Val Leu Gln Glu245 250 255Leu Val Ala Lys Leu Glu Asp Pro Arg Glu Lys His Phe Asn Leu Cys260 265 270Leu Glu Glu Arg Asp Trp Leu Pro Gly Gln Pro Val Leu Glu Asn Leu275 280 285Ser Gln Ser Ile Gln Leu Ser Lys Lys Thr Val Phe Val Met Thr Gln290 295 300Lys Tyr Ala Lys Thr Glu Ser Phe Lys Met Ala Phe Tyr Leu Ser His305 310 315 320Gln Arg Leu Leu Asp Glu Lys Val Asp Val Ile Ile Leu Ile Phe Leu325 330 335Glu Arg Pro Leu Gln Lys Ser Lys Phe Leu Gln Leu Arg Lys Arg Leu340 345 350Cys Arg Ser Ser Val Leu Glu Trp Pro Ala Asn Pro Gln Ala His Pro355 360 365Tyr Phe Trp Gln Cys Leu Lys Asn Ala Leu Thr Thr Asp Asn His Val370 375 380Ala Tyr Ser Gln Met Phe Lys Glu Thr Val385 390(2)SEQ ID NO31的信息(i)顺序特征(A)长度999个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置2..847
(ix)特征(A)名称/关键词misc特征(B)位置4(D)其它信息/注释=“核苷酸4和23标示为C,每个可以为A、C、G或T”(ix)特征(A)名称/关键词misc特征(B)位置650(D)其它信息/注释=“核苷酸650标示为G,可以为A或G”(ix)特征(A)名称/关键词misc特征(B)位置715(D)其它信息/注释=“核苷酸715、825和845标示为C,每个可以为C或T”(xi)顺序描述SEQ ID NO31C TCC GAT GCC AAG ATT CGG CAC CAG GCA TAT TCA GAG GTC ATG ATG 46Ser Asp Ala Lys Ile Arg His Gln Ala Tyr Ser Glu Val Met Met1 5 10 15GTT GGA TGG TCA GAT TCA TAC ACC TGT GAA TAC CCT TTA AAC CTA AGG94Val Gly Trp Ser Asp Ser Tyr Thr Cys Glu Tyr Pro Leu Asn Leu Arg20 25 30GGA ACT AGG TTA AAA GAC GTT CAT CTC CAC GAA TTA TCT TGC AAC ACA 142Gly Thr Arg Leu Lys Asp Val His Leu His Glu Leu Ser Cys Asn Thr35 40 45GCT CTG TTG ATT GTC ACC ATT GTG GTT ATT ATG CTA GTT CTG GGG TTG 190Ala Leu Leu Ile Val Thr Ile Val Val Ile Met Leu Val Leu Gly Leu50 55 60GCT GTG GCC TTC TGC TGT CTC CAC TTT GAT CTG CCC TGG TAT CTC AGG 238Ala Val Ala Phe Cys Cys Leu His Phe Asp Leu Pro Trp Tyr Leu Arg65 70 75ATG CTA GGT CAA TGC ACA CAA ACA TGG CAC AGG GTT AGG AAA ACA ACC 286Met Leu Gly Gln Cys Thr Gln Thr Trp His Arg Val Arg Lys Thr Thr80 85 90 95CAA GAA CAA CTC AAG AGA AAT GTC CGA TTC CAC GCA TTT ATT TCA TAC 334Gln Glu Gln Leu Lys Arg Asn Val Arg Phe His Ala Phe Ile Ser Tyr100 105 110AGT GAA CAT GAT TCT CTG TGG GTG AAG AAT GAA TTG ATC CCC AAT CTA 382Ser Glu His Asp Ser Leu Trp Val Lys Asn Glu Leu Ile Pro Asn Leu115 120 125GAG AAG GAA GAT GGT TCT ATC TTG ATT TGC CTT TAT GAA AGC TAC TTT 430Glu Lys Glu Asp Gly Ser Ile Leu Ile Cys Leu Tyr Glu Ser Tyr Phe130 135 140GAC CCT GGC AAA AGC ATT AGT GAA AAT ATT GTA AGC TTC ATT GAG AAA 478Asp Pro Gly Lys Ser Ile Ser Glu Asn Ile Val Ser Phe Ile Glu Lys145 150 155AGC TAT AAG TCC ATC TTT GTT TTG TCT CCC AAC TTT GTC CAG AAT GAG 526Ser Tyr Lys Ser Ile Phe Val Leu Ser Pro Asn Phe Val Gln Asn Glu160 165 170 175TGG TGC CAT TAT GAA TTC TAC TTT GCC CAC CAC AAT CTC TTC CAT GAA 574Trp Cys His Tyr Glu Phe Tyr Phe Ala His His Asn Leu Phe His Glu180 185 190AAT TCT GAT CAC ATA ATT CTT ATC TTA CTG GAA CCC ATT CCA TTC TAT 622Asn Ser Asp His Ile Ile Leu Ile Leu Leu Glu Pro Ile Pro Phe Tyr195 200 205TGC ATT CCC ACC AGG TAT CAT AAA CTG GAA GCT CTC CTG GAA AAA AAA 670Cys Ile Pro Thr Arg Tyr His Lys Leu Glu Ala Leu Leu Glu Lys Lys210 215 220GCA TAC TTG GAA TGG CCC AAG GAT AGG CGT AAA TGT GGG CTT TTC TGG 718Ala Tyr Leu Glu Trp Pro Lys Asp Arg Arg Lys Cys Gly Leu Phe Trp225 230 235GCA AAC CTT CGA GCT GCT GTT AAT GTT AAT GTA TTA GCC ACC AGA GAA 766Ala Asn Leu Arg Ala Ala Val Asn Val Asn Val Leu Ala Thr Arg Glu240 245 250 255ATG TAT GAA CTG CAG ACA TTC ACA GAG TTA AAT GAA GAG TCT CGA GGT 814Met Tyr Glu Leu Gln Thr Phe Thr Glu Leu Asn Glu Glu Ser Arg Gly260 265 270TCT ACA ATC TCT CTG ATG AGA ACA GAC TGT CTA TAAAATCCCA CAGTCCTTGG 867Ser Thr Ile Ser Leu Met Arg Thr Asp Cys Leu275 280GAAGTTGGGG ACCACATACA CTGTTGGGAT GTACATTGAT ACAACCTTTA TGATGGCAAT 927TTGACAATAT TTATTAAAAT AAAAAATGGT TATTCCCTTC AAAAAAAAAA AAAAAAAAAA 987AAAAAAAAAA AA 999(2)SEQ ID NO32的信息(i)顺序特征(A)长度282个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质(xi)顺序描述SEQ ID NO32Ser Asp Ala Lys Ile Arg His Gln Ala Tyr Ser Glu Val Met Met Val1 5 10 15Gly Trp Ser Asp Ser Tyr Thr Cys Glu Tyr Pro Leu Asn Leu Arg Gly20 25 30Thr Arg Leu Lys Asp Val His Leu His Glu Leu Ser Cys Asn Thr Ala35 40 45Leu Leu Ile Val Thr Ile Val Val Ile Met Leu Val Leu Gly Leu Ala50 55 60Val Ala Phe Cys Cys Leu His Phe Asp Leu Pro Trp Tyr Leu Arg Met65 70 75 80Leu Gly Gln Cys Thr Gln Thr Trp His Arg Val Arg Lys Thr Thr Gln85 90 95Glu Gln Leu Lys Arg Asn Val Arg Phe His Ala Phe Ile Ser Tyr Ser100 105 110Glu His Asp Ser Leu Trp Val Lys Asn Glu Leu Ile Pro Asn Leu Glu115 120 125Lys Glu Asp Gly Ser Ile Leu Ile Cys Leu Tyr Glu Ser Tyr Phe Asp130 135 140Pro Gly Lys Ser Ile Ser Glu Asn Ile Val Ser Phe Ile Glu Lys Ser145 150 155 160Tyr Lys Ser Ile Phe Val Leu Ser Pro Asn Phe Val Gln Asn Glu Trp165 170 175Cys His Tyr Glu Phe Tyr Phe Ala His His Asn Leu Phe His Glu Asn180 185 190Ser Asp His Ile Ile Leu Ile Leu Leu Glu Pro Ile Pro Phe Tyr Cys195 200 205Ile Pro Thr Arg Tyr His Lys Leu Glu Ala Leu Leu Glu Lys Lys Ala210 215 220Tyr Leu Glu Trp Pro Lys Asp Arg Arg Lys Cys Gly Leu Phe Trp Ala225 230 235 240Asn Leu Arg Ala Ala Val Asn Val Asn Val Leu Ala Thr Arg Glu Met245 250 255Tyr Glu Leu Gln Thr Phe Thr Glu Leu Asn Glu Glu Ser Arg Gly Ser260 265 270Thr Ile Ser Leu Met Arg Thr Asp Cys Leu275 280(2)SEQ ID NO33的信息(i)顺序特征(A)长度1173个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置1...1008(ix)特征(A)名称/关键词misc特征(B)位置854(D)其它信息/注释=“核苷酸854标示为A,可以为A或T”(ix)特征(A)名称/关键词misc特征(B)位置1171(D)其它信息/注释=“核苷酸1171和1172标示为C,每个可以为A、C、G或T”(xi)顺序描述SEQ ID NO33CTG CCT GCT GGC ACC CGG CTC CGG AGG CTG GAT GTC AGC TGC AAC AGC48Leu Pro Ala Gly Thr Arg Leu Arg Arg Leu Asp Val Ser Cys Asn Ser1 5 10 15ATC AGC TTC GTG GCC CCC GGC TTC TTT TCC AAG GCC AAG GAG CTG CGA96Ile Ser Phe Val Ala Pro Gly Phe Phe Ser Lys Ala Lys Glu Leu Arg20 25 30GAG CTC AAC CTT AGC GCC AAC GCC CTC AAG ACA GTG GAC CAC TCC TGG 144Glu Leu Asn Leu Ser Ala Asn Ala Leu Lys Thr Val Asp His Ser Trp35 40 45TTT GGG CCC CTG GCG AGT GCC CTG CAA ATA CTA GAT GTA AGC GCC AAC 192Phe Gly Pro Leu Ala Ser Ala Leu Gln Ile Leu Asp Val Ser Ala Asn50 55 60CCT CTG CAC TGC GCC TGT GGG GCG GCC TTT ATG GAC TTC CTG CTG GAG 240Pro Leu His Cys Ala Cys Gly Ala Ala Phe Met Asp Phe Leu Leu Glu65 70 75 80GTG CAG GCT GCC GTG CCC GGT CTG CCC AGC CGG GTG AAG TGT GGC AGT 288Val Gln Ala Ala Val Pro Gly Leu Pro Ser Arg Val Lys Cys Gly Ser85 90 95CCG GGC CAG CTC CAG GGC CTC AGC ATC TTT GCA CAG GAC CTG CGC CTC 336Pro Gly Gln Leu Gln Gly Leu Ser Ile Phe Ala Gln Asp Leu Arg Leu100 105 110TGC CTG GAT GAG GCC CTC TCC TGG GAC TGT TTC GCC CTC TCG CTG CTG 384Cys Leu Asp Glu Ala Leu Ser Trp Asp Cys Phe Ala Leu Ser Leu Leu115 120 125GCT GTG GCT CTG GGC CTG GGT GTG CCC ATG CTG CAT CAC CTC TGT GGC 432Ala Val Ala Leu Gly Leu Gly Val Pro Met Leu His His Leu Cys Gly130 135 140TGG GAC CTC TGG TAC TGC TTC CAC CTG TGC CTG GCC TGG CTT CCC TGG 480Trp Asp Leu Trp Tyr Cys Phe His Leu Cys Leu Ala Trp Leu Pro Trp145 150 155 160CGG GGG CGG CAA AGT GGG CGA GAT GAG GAT GCC CTG CCC TAC GAT GCC 528Arg Gly Arg Gln Ser Gly Arg Asp Glu Asp Ala Leu Pro Tyr Asp Ala165 170 175TTC GTG GTC TTC GAC AAA ACG CAG AGC GCA GTG GCA GAC TGG GTG TAC 576Phe Val Val Phe Asp Lys Thr Gln Ser Ala Val Ala Asp Trp Val Tyr180 185 190AAC GAG CTT CGG GGG CAG CTG GAG GAG TGC CGT GGG CGC TGG GCA CTC 624Asn Glu Leu Arg Gly Gln Leu Glu Glu Cys Arg Gly Arg Trp Ala Leu
195 200 205CGC CTG TGC CTG GAG GAA CGC GAC TGG CTG CCT GGC AAA ACC CTC TTT 672Arg Leu Cys Leu Glu Glu Arg Asp Trp Leu Pro Gly Lys Thr Leu Phe210 215 220GAG AAC CTG TGG GCC TCG GTC TAT GGC AGC CGC AAG ACG CTG TTT GTG 720Glu Asn Leu Trp Ala Ser Val Tyr Gly Ser Arg Lys Thr Leu Phe Val225 230 235 240CTG GCC CAC ACG GAC CGG GTC AGT GGT CTC TTG CGC GCC AGC TTC CTG 768Leu Ala His Thr Asp Arg Val Ser Gly Leu Leu Arg Ala Ser Phe Leu245 250 255CTG GCC CAG CAG CGC CTG CTG GAG GAC CGC AAG GAC GTC GTG GTG CTG 816Leu Ala Gln Gln Arg Leu Leu Glu Asp Arg Lys Asp Val Val Val Leu260 265 270GTG ATC CTG AGC CCT GAC GGC CGC CGC TCC CGC TAC GAG CGG CTG CGC 864Val Ile Leu Ser Pro Asp Gly Arg Arg Ser Arg Tyr Glu Arg Leu Arg275 280 285CAG CGC CTC TGC CGC CAG AGT GTC CTC CTC TGG CCC CAC CAG CCC AGT 912Gln Arg Leu Cys Arg Gln Ser Val Leu Leu Trp Pro His Gln Pro Ser290 295 300GGT CAG CGC AGC TTC TGG GCC CAG CTG GGC ATG GCC CTG ACC AGG GAC 960Gly Gln Arg Ser Phe Trp Ala Gln Leu Gly Met Ala Leu Thr Arg Asp305 310 315 320AAC CAC CAC TTC TAT AAC CGG AAC TTC TGC CAG GGA CCC ACG GCC GAA 1008Asn His His Phe Tyr Asn Arg Asn Phe Cys Gln Gly Pro Thr Ala Glu325 330 335TAGCCGTGAG CCGGAATCCT GCACGGTGCC ACCTCCACAC TCACCTCACC TCTGCCTGCC1068TGGTCTGACC CTCCCCTGCT CGCCTCCCTC ACCCCACACC TGACACAGAG CAGGCACTCA1128ATAAATGCTA CCGAAGGCTA AAAAAAAAAA AAAAAAAAAA AACCA1173(2)SEQ ID NO34的信息(i)顺序特征(A)长度336个氨基酸(B)类型氨基酸(D)拓扑学线性(ii)分子类型蛋白质
(xi)顺序描述SEQ ID NO34Leu Pro Ala Gly Thr Arg Leu Arg Arg Leu Asp Val Ser Cys Asn Ser1 5 10 15Ile Ser Phe Val Ala Pro Gly Phe Phe Ser Lys Ala Lys Glu Leu Arg20 25 30Glu Leu Asn Leu Ser Ala Asn Ala Leu Lys Thr Val Asp His Ser Trp35 40 45Phe Gly Pro Leu Ala Ser Ala Leu Gln Ile Leu Asp Val Ser Ala Asn50 55 60Pro Leu His Cys Ala Cys Gly Ala Ala Phe Met Asp Phe Leu Leu Glu65 70 75 80Val Gln Ala Ala Val Pro Gly Leu Pro Ser Arg Val Lys Cys Gly Ser85 90 95Pro Gly Gln Leu Gln Gly Leu Ser Ile Phe Ala Gln Asp Leu Arg Leu100 105 110Cys Leu Asp Glu Ala Leu Ser Trp Asp Cys Phe Ala Leu Ser Leu Leu115 120 125Ala Val Ala Leu Gly Leu Gly Val Pro Met Leu His His Leu Cys Gly130 135 140Trp Asp Leu Trp Tyr Cys Phe His Leu Cys Leu Ala Trp Leu Pro Trp145 150 155 160Arg Gly Arg Gln Ser Gly Arg Asp Glu Asp Ala Leu Pro Tyr Asp Ala165 170 175Phe Val Val Phe Asp Lys Thr Gln Ser Ala Val Ala Asp Trp Val Tyr180 185 190Asn Glu Leu Arg Gly Gln Leu Glu Glu Cys Arg Gly Arg Trp Ala Leu195 200 205Arg Leu Cys Leu Glu Glu Arg Asp Trp Leu Pro Gly Lys Thr Leu Phe210 215 220Glu Asn Leu Trp Ala Ser Val Tyr Gly Ser Arg Lys Thr Leu Phe Val225 230 235 240Leu Ala His Thr Asp Arg Val Ser Gly Leu Leu Arg Ala Ser Phe Leu245 250 255Leu Ala Gln Gln Arg Leu Leu Glu Asp Arg Lys Asp Val Val Val Leu260 265 270Val Ile Leu Ser Pro Asp Gly Arg Arg Ser Arg Tyr Glu Arg Leu Arg275 280 285Gln Arg Leu Cys Arg Gln Ser Val Leu Leu Trp Pro His Gln Pro Ser290 295 300Gly Gln Arg Ser Phe Trp Ala Gln Leu Gly Met Ala Leu Thr Arg Asp305 310 315 320Asn His His Phe Tyr Asn Arg Asn Phe Cys Gln Gly Pro Thr Ala Glu325 330 335(2)SEQ ID NO35的信息(i)顺序特征(A)长度497个碱基对(B)类型核酸(C)链型单链(D)拓扑学线性(ii)分子类型cDNA(xi)顺序描述SEQ ID NO35TGGCCCACAC GGACCGCGTC AGTGGCCTCC TGCGCACCAG CTTCCTGCTG GCTCAGCAGC 60GCCTGTTGGA AGACCGCAAG GACGTGGTGG TGTTGGTGAT CCTGCGTCCG GATGCCCCAC 120CGTCCCGCTA TGTGCGACTG CGCCAGCGTC TCTGCCGCCA GAGTGTGCTC TTCTGGCCCC 180AGCGACCCAA CGGGCAGGGG GGCTTCTGGG CCCAGCTGAG TACAGCCCTG ACTAGGGACA 240ACCGCCACTT CTATAACCAG AACTTCTGCC GGGGACCTAC AGCAGAATAG CTCAGAGCAA 300CAGCTGGAAA CAGCTGCATC TTCATGTCTG GTTCCCGAGT TGCTCTGCCT GCCTTGCTCT 360GTCTTACTAC ACCGCTATTT GGCAAGTGCG CAATATATGC TACCAAGCCA CCAGGCCCAC 420GGAGCAAAGG TTGGCTGTAA AGGGTAGTTT TCTTCCCATG CATCTTTCAG GAGAGTGAAG 480ATAGACACCA AACCCAC49权利要求
1.大致纯的或重组的DTLR2蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO4的序列同一性至少为大约85%。
2.大致纯的或重组的DTLR3蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO6的序列同一性至少为大约85%。
3.大致纯的或重组的DTLR4蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO26的序列同一性至少为大约85%。
4.大致纯的或重组的DTLR5蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO10的序列同一性至少为大约85%。
5.大致纯的或重组的DTLR6蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO12的序列同一性至少为大约85%。
6.大致纯的或重组的DTLR7蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO16或18的序列同一性至少为大约85%。
7.大致纯的或重组的DTLR8蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO32的序列同一性至少为大约85%。
8.大致纯的或重组的DTLR9蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO22的序列同一性至少为大约85%。
9.大致纯的或重组的DTLR10蛋白或肽,它们在至少大约12个氨基酸的长度内,表现出与SEQ ID NO34的序列同一性至少为大约85%。
10.融合蛋白,它包含权利要求1-9中任一项的蛋白或肽。
11.结合化合物,它与权利要求1-9中任一项的蛋白或肽特异性地结合。
12.权利要求11的结合化合物,它是一种抗体或抗体片段。
13.核酸,它编码权利要求1-9中任一项的的蛋白或肽。
14.表达载体,它包含权利要求13的核酸。
15.宿主细胞,它包含权利要求14的载体。
16.重组生产多肽的方法,所述方法包括在表达所述多肽的条件下,培养权利要求15的宿主细胞。
全文摘要
编码与果蝇属Toll受体和人IL-1受体同源的9种人受体的核酸,所述受体命名为DNAXToll样受体2—10(DTLR2—10);纯化的DTLR蛋白及其片段;针对这些受体的单克隆抗体/多克隆抗体;和诊断和治疗使用的方法。
文档编号C07K14/705GK1263555SQ98806640
公开日2000年8月16日 申请日期1998年5月7日 优先权日1997年5月7日
发明者G·T·哈迪曼, F·L·罗克, J·F·巴赞, R·A·卡斯特莱恩 申请人:先灵公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1