能调节对细胞因子的细胞反应性的治疗和诊断制剂的制作方法

文档序号：1063300阅读：2581来源：国知局

专利名称：能调节对细胞因子的细胞反应性的治疗和诊断制剂的制作方法
技术领域：
本发明总的涉及治疗和诊断制剂。更具体地，本发明提供能够调节信号传导，例如但不限于细胞因子介导的信号传导的治疗分子。本发明在调节对细胞因子及其它信号传导介质如内源或外源分子、抗原、微生物群体和微生物产物、病毒或其组成成分、离子、激素和寄生物的细胞反应性中有用。
作者将本说明书提及的公开文献的目录细节收在本说明书后。本说明中提及的核苷酸和氨基酸的序列鉴定号在文献目录后定义。SEQID NO总结于表1。
在下面说明书和权利要求书中，除非内容需求，否则词“包括”或“包含”应理解将为含有所述的整数或整数群但不排除任何其它整数或整数群。发明背景为调节生理和生化过程，继而影响将发生的行为，细胞持续地监测着它们的环境。一般地，细胞与其周边之间最初的相互作用经质膜上表达的受体发生。受体经内源配体(如细胞因子)或外源配体(如抗原)结合而活化，激发从膜到细胞质至细胞核的生化级联反应。
在内源配体中，细胞因子为特别重要和熟悉的一类。细胞因子是调节存活、繁殖、分化和体内名种细胞功能的蛋白(Nicola，1994)。造血细胞因子有共同的4个α螺旋串结构并且大多数与结构相关的细胞表面受体家族I型和II型细胞因子受体相互作用(Bazan，1990；Sprang，1993)。在所有情况下，配体诱导的受体聚集看来是启动细胞内信号传导级联反应的关键事件。一些细胞因子如生长激素、促红细胞生成素和粒细胞集落刺激因子(G-CSF)激发受体同源二聚体的形成，而对于其它细胞因子，异源二聚体或异源三聚体形成是关键的。对于后一种情况，几种细胞因子使用共同的受体亚单位，并且基于此可以将它们归为具有相似的细胞内活化模式和相似的生物效应的三个家族(Hilton，1994)。白细胞介素-3(IL-3)、IL-5和粒细胞—巨噬细胞集落刺激因子(G-CSF)使用共同的β受体亚单位，并且每个细胞因子都刺激粒细胞和巨噬细胞的合成和功能性活性。IL-2、IL-4、IL-7、IL-9和IL-15都使用共同的γ链(γc)，而IL-4和IL-13使用可选择的γ链(γC或IL-13受体α链)。这些细胞因子都在调节淋巴系统内获得性免疫方面起重要作用。最后，IL-6、IL-11、白血病抑制因子(LIF)、制癌蛋白-M(OSM)、睫状神经营养因子(CNTF)和促心激素(CT)使用受体亚单位gp130。这些细胞因子都表现高度多效性，在造血系统内外都有效力[Nicola，1994)。
在所有上述情况中，每种受体复合物的至少一个亚单位在它们的胞质尾部含有保守的序列元件，称为元件盒1和元件盒2[Murakami，1991]。元件盒1是富集脯氨酸的基序，位于比酸性元件盒2元件离转膜结构域更近的位置。元件盒1区域作用为称为JAK(Janus激酶)的一类胞质酪氨酸激酶的结合位点。配体诱导的受体二聚体形成导致结合的JAK通过交叉磷酸化作用增加催化活性。然后活化的JAK对几种底物包括受体本身进行酪氨酸磷酸化。然后受体上特异的磷酸酪氨酸残基作用为含SH2蛋白的对接位点，含SH2蛋白的最佳典型是信号转导蛋白、转录激活物(STAT)和转接蛋白shc。然后STAT可能在酪氨酸处被JAK磷酸化，从受体上解离并通过一个STAT的SH2结构域和另一个STAT的磷酸酪氨酸残基位点间的相互作用形成同源二聚体和异源二聚体。然后STAT二聚体转移到核内，在那里它们与特异的细胞因子反应性启动子结合并活化转录[Darnell，1994；Ihle，1995，Ihle，1995)。在另一通路中，酪氨酸磷酸化的Shc与另一含有SH2结构域的蛋白Grb-2相互作用最终导致MAP激酶家族成员的活化并继而导致转录因子如fos和jun的激活[San，1993；Culter，1993]。这些通路不是细胞因子受体家族成员专有的，因为结合受体酪氨酸激酶的细胞因子也能激活STAT和MAP激酶家族的成员[David，1996；Leamen，1996；Shual，1993；Sato，1993；Cutler，1993]。
已有JAK胞质酪氨酸激酶家族的四个成员JAK1、JAK2、JAK3和JYK2得到描述，这四个成员的每一个都与细胞因子受体亚单位的特定亚型结合。也有6个STAT得到描述(STAT1-STAT6)，它们也由不同的细胞因子/受体复合物活化。例如，STAT1看来对于扰素系统有功能特异性，STAT4看来对IL-12特异，而STAT6对IL-4和IL-13特异。因此，尽管有相同的活化机制，但是某些程度的细胞因子特异性可以通过使用特异的JAK和STAT得到[Thierfelder，1996；Kaplan，1996；Takeda，1996；Shimoda，1996；Meraz，1996；Durbin，1996]。
除了上述的那些，也有一些这些通路活化的其它机制。例如，JAK/STAT通路看来能独立于shc诱导的通路活化MAP激酶[David，1995]，并且STAT本身也许可以在不与受体结合时通过与JAK直接相互作用活化[Gupta，1996]。相反地，STAT的完全活化可能需要MAP激酶的活化和JAK的活化[David，1995；Wen 1995]。
尽管对这些信号通路活化的了解越来越多，但是对这些通路的调节包括正或负反馈环的情况了解还很少。既然一旦细胞开始对刺激反应是重要的，那么调节反应的强度和时间及信号传导的关闭也是关键的。同样，系统地或甚至局部地在所需的位置增强反应的强度是有利的。
在取得本发明的工作中，发明人设法分离信号传导的负调节因子。本发明人目前已鉴定了能作用为信号调节因子的新蛋白家族。根据最初鉴定的新蛋白家族分子抑制细胞因子介导的信号传导的能力，将它们定义为细胞因子信号传导抑制剂(SOCS)家族。然而应当注意的是，不是所有的SOCS家族成员一定有抑制功能或只是靶向细胞因子介导的信号传导。依据位于称为SOCS元件盒的C末端基序的N端氨基酸，SOCS家族包含至少三类蛋白分子。新的调节分子家族的鉴定使得可以制备一系列能够调节信号传导并因此能调节对一系列分子包括细胞因子的反应性的效应物或调节剂分子。因此，本发明提供以SOCS蛋白，其衍生物、同系物、类似物和模拟物以及SOCS蛋白的拮抗剂和兴奋剂为基础的治疗和诊断试剂。发明概述本发明尤其提供编码SOCS蛋白家族成员的核酸分子以及蛋白本身。此后提及的“SOCS”包括任何或所有SOCS家族成员。特异的SOCS分子用数字定义，如SOCS1、SOCS2和SOCS3。从中得到SOCS的物种可以用开始的单字母缩写表示，其中“h”是人，“m”是小鼠，“r”是大鼠。因此，“mSOCS1”是来自动物小鼠的特异的SOCS。此处提及的“SOCS”不是指蛋白专门抑制细胞因子介导的信号传导，分子也可以调节其它效应物如通过激素或其它内源或外源分子、抗原、微生物群体和微生物产物、病毒或其成分、离子、寄生物介导的信号传导。术语“调节”包括正调节、负调节及特定水平的维持。
本发明的一方面提供包含编码在其C末端区域含有SOCS元件盒的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
本发明的另一方面提供包含编码含有在其C末端区域的SOCS元件盒和蛋白分子相互作用区域的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
本发明的另一方面针对包含编码含有C末端区域SOCS元件盒和位于SOCS元件盒的N端区域的蛋白分子相互作用区域的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核昔酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
优选地，蛋白分子相互作用区域是蛋白DNA或蛋白蛋白结合区域。
本发明的另一方面提供包含编码含有在其C末端区域的SOCS元件盒和SOCS元件盒N端的一个或多个SH2结构域、WD-40重复或锚蛋白重复的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
本发明的另一方面针对包含编码在其C末端区域含有SOCS元件盒的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子，其中SOCS元件盒含有以下氨基酸序列X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；
X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；并且在SOCS元件盒的N端的蛋白分子相互作用区域例如但不限于一个或多个SH2结构域、WD-40重复和/或锚蛋白重复。
本发明的另一方面针对包含编码表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子(i)在其C末端区域包含具有如下氨基酸序列的SOCS元件盒X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；
X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白分子相互作用区域。
优选地，SOCS分子调节诸如来自细胞因子或激素或其它外源或内源分子、微生物群体或微生物产物、抗原或寄生物的信号传导。
更优选地，SOC分子调节细胞因子介导的信号传导。
本发明的另一方面提供包含编码表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子(i)能调节信号传导；(ii)在其C末端包含具有以下氨基酸序列的SOCS元件盒X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；
X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；(iii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白分子相互作用结构域。
优选地，信号传导由细胞因子如一个或多个EPO，TPO，G-CSF，GM-CSF，IL-3，IL-2，IL-4，IL-7，IL-13，IL-6，LIF，IL-12，IFNα，TNFα，IL-1和/或M-CSF介导。
优选地，信号传导由一个或多个白细胞介素6(IL-6)、白血病抑制因子(LIF)、制癌蛋白(OSM)、干扰素(IFN)-α和/或促血小板生成素介导。
优选地，信号传导由IL-6介导。
特别优选的核酸分子包含主要如下列出的核苷酸序列SEQ ID NO3(mSOCS1)，SEQ ID NO5(mSOCS2)，SEQ ID NO7(mSOCS3)，SEQID NO9(hSOCS1)，SEQ ID NO11(rSOCS1)，SEQ ID NO13(mSOCS4)，SEQ ID NO15和SEQ ID NO16(hSOCS4)，SEQ ID NO17(mSOCS5)，SEQ ID NO19(hSOCS5)，SEQID NO20(mSOCS6)，SEQ ID NO22和SEQ ID NO23(hSOCS6)，SEQ ID NO24(mSOCS7)，SEQ ID NO26和SEQ ID NO27(hSOCS7)，SEQ ID NO28(mSOCS8)，SEQID NO30(mSOCS9)，SEQ ID NO31(hSOCS9)，SEQ ID NO32(mSOCS 10)，SEQ ID NO33和SEQ ID NO34(hSOCS10)，SEQ ID NO35(hSOCS11)，SEQ ID NO37(mSOCS12)，SEQ ID NO38和SEQ ID NO39(hSOCS12)，SEQ ID NO40(mSOCS13)，SEQ ID NO42(hSOCS 13)，SEQ ID NO43(mSOCS 14)，SEQ ID NO45(mSOCS15)和SEQ ID NO47(hSOCS15)或与任一列出的序列的所有或部分区域有至少约15％相似性的核苷酸序列或能与任一列出的序列在42℃低严格条件下杂交的核酸分子。
本发明的另一方面涉及在其C末端区域包含SOCS元件盒的蛋白或其同系物、类似物或模拟物。
本发明的另一方面针对包含在其C末端区域的SOCS元件盒和蛋白分子相互作用区域的蛋白或其同系物、类似物或模拟物。
本发明的另一方面提供在SOCS元件盒的N端区域含有相互作用区域的蛋白或其同系物、类似物或模拟物。
优选地，蛋白分子相互作用区域是蛋白DNA或蛋白蛋白结合区域。
本发明的另一方面包括包含在其C末端区域的SOCS元件盒和SOCS元件盒N端的SH2结构域、WD-40重复成锚蛋白重复的蛋白或其同系物、类似物或模拟物。
本发明的另一方面提供表现以特征的蛋白或其同系物、类似物或模拟物。
(i)在其C末端包含具有以下氨基酸序列的SOCS元件盒X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；
X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白分子相互作用结构域。
优选地，蛋白调节信号传导如细胞因子介导的信号传导。
优选的细胞因子是EPO，TPO，G-CSF，GM-CSF，IL-3，IL-2，IL-4，IL-7，IL-13，IL-6，LIF，IL-12，IFYγ，TNFα，IL-1和/或M-CSF。
特别优选的细胞因子是IL-6。
本发明的另一方面提供表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物
(i)能调节信号传导如细胞因子介导的信号传导；(ii)在其C末端包含具有以下氨基酸序列的SOCS元件盒X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；(iii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白分子相互作用结构域。
特别优选的SOCS蛋白包含主要如下列出的氨基酸序列SEQ ID NO4(mSOCS1)，SEQ ID NO6(mSOCS2)，SEQ ID NO8(mSOCS3)，SEQ IDNO10(hSOCS1)，SEQ ID NO12(rSOCS1)，SEQ ID NO14(mSOCS4)，SEQ ID NO18(mSOCS5)，SEQ ID NO21(mSOCS6)，SEQ ID NO25(mSOCS7)，SEQ ID NO29(mSOCS8)，SEQ ID NO36(hSOCS11)，SEQ ID NO41(mSOCS13)，SEQ ID NO44(mSOCS14)，SEQ ID NO46(mSOCS15)和SEQ ID NO48(hSOCS15)或与任一列出的序列的所有或部分区域有15％相似性的氨基酸序列。
本发明的另一方面包括调节细胞内SOCS蛋白水平的方法，该方法包括使含有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂在足以调节所述SOCS蛋白水平的条件下接触一段时间。
本发明的另一方面提供调节含有SOCS基因的细胞内信号传导的方法，该方法包括使所述细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
本发明的另一方面针对影响其中至少一种细胞带有SOCS基因的细胞间相互作用的方法，该方法包括使带有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
根据本发明，[Xi]n和[Xj]n中的n除了1-50外，还可以是1-30，1-20，1-10和1-5。
在本说明书中提及的SEQ ID NO的总结在表1中给出。表1 序列鉴定号的总结序列序列鉴定号(SEQ ID NO.)PCR引物1PCR引物2小鼠SOCS1(核苷酸) 3小鼠SOCS1(氨基酸) 4小鼠SOCS2(核苷酸) 5小鼠SOCS2(氨基酸) 6小鼠SOCS3(核苷酸) 7小鼠SOCS3(氨基酸) 8人SOCS1(核苷酸)9人SOCS1(氨基酸)10大鼠SOCS1(核苷酸) 11大鼠SOCS1(氨基酸) 12鼠SOCS4的核苷酸序列13鼠SOCS4的氨基酸序列14人SOCS4 cDNA4.1的核苷酸序列15人SOCS4 cDNA4.2的核苷酸序列16鼠SOCS5的核苷酸序列17鼠SOCS5的氨基酸序列18人SOCS5的核苷酸序列19鼠SOCS6的核苷酸序列20鼠SOCS6的氨基酸21人SOCS6重叠群h6.1的核苷酸序列 22人SOCS6重叠群h6.2的核苷酸序列 23鼠SOCS7的核苷酸序列24鼠SOCS7的氨基酸序列25人SOCS7重叠群h7.1的核苷酸序列 26人SOCS7重叠群h7.2的核苷酸序列 27鼠SOCS8的核苷酸序列28鼠SOCS8的氨基酸序列29鼠SOCS9的核苷酸序列30人SOCS9的核苷酸序列31鼠SOCS10的核苷酸序列 32人SOCS10重叠群h10.1的核苷酸序列33人SOCS10重叠群h10.2的核苷酸序列34人SOCS11的核苷酸序列 35人SOCS11的氨基酸序列 36小鼠SOCS12的核苷酸序列 37人SOCS12重叠群h12.1的核苷酸序列38人SOCS12重叠群h12.2的核苷酸序列39鼠SOCS13的核苷酸序列 40鼠SOCS13的氨基酸序列 41人SOCS13 cDNA重叠群h13.1的核苷酸序列 42鼠SOCS14 cDNA的核苷酸序列 43鼠SOCS14的氨基酸序列 44鼠SOCS15 cDNA的核苷酸序列 45鼠SOCS15的氨基酸序列 46人SOCS15的核苷酸序列 47人SOCS15的氨基酸序列 48
使用单字母和三字母缩写指代氨基酸残基并且将它们总结在表2中。表2氨基酸三字母缩写单字母符号丙氨酸 Ala A精氨酸 Arg R天冬酰胺 Asn N天冬氨酸 Asp D半胱氨酸 Cys C谷氨酰胺 Gln Q各氨酸 Glu E甘氨酸 Gly G组氨酸 His H异亮氨酸 Ile I亮氨酸 Leu L赖氨酸 Lys K蛋氨酸 Met M苯丙氨酸 Phe F脯氨酸 Pro P丝氨酸 Ser S苏氨酸 Thr T色氨酸 Trp W酩氨酸 Tyr Y缬氨酸 Val V任意残基 Xaa X附图简述在一些图中，使用缩写来指代具有特定结合基序的SOCS蛋白。含有WD-40重复的SOCS蛋白称为WSB1-WSB4。带有锚蛋白重复的SOCS蛋白称为ASB1-ASB3。

图1是表示制备在逆转录病毒RUFneo逆转录病毒侵染时IL-6非反应性的M1克隆的图示，表示了限制性内切酶标记、4A2 cDNA插入和PCR引物序列的位置。
图2是Southern和Northern分析的摄影图示。左边和中间板表示克隆4A2和对照侵染的M1克隆的基因组DNA的Southern印迹分析。用BamHI消化DNA以揭示每个克隆携带的逆转录病毒的数目，用SacI消化以估计逆转录病毒cDNA插入的大小。左边板用neo探测。右边板用XhoI消化的4A2 PCR产物探测。左边板表示用XhoI消化的4A2 PCR产物探测克隆4A2和对照侵染的M1克隆的总RNA的Northern印迹分析。两条带表示来自逆转录病毒基因组剪接供体和受体位点的未剪接的和剪接的逆转录病毒转录物。
图3是SOCS1基因的氨基酸序列和结构图示。A鼠染色体16上与鱼精蛋白基因簇相关的SOCS1的基因组前后关系。该基因座的登记号是MMPRMGNS(直接提交；G.Schlueter，1996)。BSOCS1 cDNA的核苷酸序列和推测的氨基酸序列。使用传统的单字母缩写代表氨基酸序列，星号代表终止密码子。编码区域以大写字母表示，非编码区域以小写字母表示。
图4是细胞因子参与的细胞分化图示。使用亲本M1细胞(M1和M1.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)的半固体培养物并测定对1mg/ml IL-6(●)，100ng/ml LIF(◇)，1mg/ml OSM(□)，100ng/m IFN-γ(▲)，500ng/ml TPO(●)或3×10-6M地塞米松的滴度反应分化的克隆百分数。
图5是在含有10ng/ml IL-6或盐水时培养4天的亲本M1细胞(M1和M1.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)的液体培养物的细胞自旋(Cytospin)摄影图示。
图6是表示SOCS1抑制信号传导磷酸化作用的摄影图示。亲本M1细胞(M1和M1.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)于37℃在含有(+)或不含有(-)10ng/ml IL-6的情况下培养4分钟。裂解细胞抽提物或者在SDS-PAGE前用抗小鼠gp130的抗体免疫沉淀(上面两板)或直接电泳(下面两板)。然后将胶印迹并用抗磷酸酪氨酸的抗体(上面板)、抗gp130的抗体(上面第二块板)、抗磷酸STAT3的抗体(底部第二块板)或抗STAT3的抗体(下面板)探测膜。使用过氧化物酶偶联的二抗和加强的Chemiluminescence(ECL)试剂使印迹可见。
图7是从于37℃在10ml含盐水、100ng/ml IL-6或100ng/ml IFN-γ的无血清DME中培养10分钟的(A)M1细胞或表达SOCS1的M1细胞(4A2)和(B)M1.mpl细胞或M1.mpl.SOCS1细胞制备的蛋白提取物图示。结合反应包含4-6μg蛋白(在给定实验中不变)、5ng32P标记的编码高亲和性SIF(c-sis诱导的因子)结合位点的m67寡核苷酸和800ng超声处理的鲑精DNA。在某些实验中，蛋白样品与过量的未标记的m67寡核苷酸或与对STAT1或STAT2特异的抗体一起预培养。
图8是Northern杂交的摄影图示。用2μg在不同时间间期后静脉注射小鼠，取出肝脏并纯化多聚腺苷酸化mRNA。用500ng/ml IL-6对M1细胞刺激不同长度时间之后分离多聚腺苷酸化mRNA。通过电泳分离mRNA并固定在尼龙膜上。对Northern印迹进行预杂交，用随机引物标记的32P标记的SOCS1或GAPDH DNA片段杂交、洗涤并对胶片曝光过夜。
图9表示SOCS1、SOCS2、SOCS3和CIS氨基酸序列的比较，小鼠(mm)、人(hs)和大鼠(rr)SOCS1、SOCS2、SOCS3和CIS的推测氨基酸序列的匹配。画上阴影的残基在三个或四个小鼠SOCS家族成员中保守。SH2结构域框在实线内，而SOCS元件盒包在双线内。
图10是表示IL-6非反应性M1细胞克隆4A2的表型的摄影图示。亲本M1细胞(左板)和克隆4A2(右板)的集落在半固体培养基中在盐水或100ng/ml IL-6中培养7天。
图11表示SOCS家族成员的mRNA体外和体内表达的摄影图示。
(A)来自一系列鼠器官的mRNA的Northern分析，表示SOCS家族成员在有限数量的组织中组成型表达。
(B)来自肝和M1细胞的mRNA的Northern分析，表示与IL-6接触后SOCS家族成员的表达诱导。
(C)来自骨髓的mRNA的反转录酶PCR分析，表示一系列细胞因子诱导SOCS家族成员的表达。
图12是表示SOCS1抑制gp130和STAT3的磷酸化和活化的摄影图示。
(A)来自用(+)或不用(-)100ng/ml IL-6刺激的亲本M1细胞(M儿M.mpl)和表达SOCS1的M1细胞(4A2和M1.mpl.SOCS1)的抽提物的Western印迹。顶部用抗gp130(αgp130)的抗体免疫沉淀并用抗磷酸酪氨酸的抗体(αPY-STAT3，或对于STAT3的αSTAT3)免疫印迹以确定上样蛋白量相同。条带的分子量在右边表示。
(B)用(+)或不用(-)100ng/ml IL-6或100ng/ml IFNγ刺激的M1.mpl和M1.mpl.SOCS1细胞的EMSA。DNA结合复合物SIFA、B和C在左边表示。
图13表示SOCS蛋白的氨基酸序列比较，(A)SOCS蛋白包括含WD-40重复(WSB)和锚蛋白重复(ASB)的蛋白的结构图，(B)SOCS蛋白N末端区域的匹配，(C)CIS，COS1，2，3，5，9，11和14的SH2结构域的匹配，(D)SOCS4、SOCS6、SOCS13和SOCS15的WD-40重复的匹配，(E)SOCS7和SOCS10的锚蛋白重复的匹配。(F)SOCS元件盒的匹配。在每种情况下，使用传统的氨基酸单字母缩写，X指代不确定身份的残基，○○○代表重叠群的开始和结束。由来自分离的cDNA的核苷酸序列的概念翻译得来的氨基酸序列以大写字母表示，而由EST的概念翻译得来的氨基酸序列以小写字母表示并且仅仅是大约的。在SH2结构域、WD-40重复、锚蛋白重复和SOCS元件盒中定义为(LIVMA)、(FYW)、(DE)、(QN)、(C，S，T)、(KRH)、(PG)的保留残基上画上阴影。对于SH2结构域、WD-40重复、锚蛋白重复的匹配在上面表示。在每种情况中，均从大量不同的结构域配套的检查中得来(Neer等，1994；Bork，1993)。
图14(A)和(B)是小鼠SOCS1和SOCS5及含有WD-40重复(WSB2)和锚蛋白重复(ASB1)的SOCS的mRNA表达分析的摄影图示。
图15是表示鼠SOCS4 cDNA的核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸用大写字母表示，而推测的5′和3′非翻译区以小写字母表示。小鼠和人EST重叠群与小鼠cDNA序列的关系在图17中表示。
图16是表示从图15中核苷酸序列得来的小鼠SOCS4蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图18是表示从对表4.1中列出的EST的分析得来的人SOCS4cDNA重叠群h4.1和h4.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图17中表示。
图19是表示从对小鼠EST(表5.1)和人cDNA克隆(5-94-2)和EST(表5.2)的分析得来的小鼠SOCS5基因组(57-2)和cDNA(5-3-2)克隆与重叠群关系的图示。小鼠SOCS5重叠群的核苷酸序列在图20中表示，人SOCS5重叠群(h5.1)的序列在图21中表示。小鼠SOCS5的推测氨基酸序列在图20B中表示。蛋白的结构以图解表示，SH2结构域和SOCS元件盒以()表示。推测的5′和3′非翻译区用细实线表示。
图20A是表示从对基因组和cDNA克隆的分析得来的小鼠SOCS5的核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸以大写字母表示，而推测的5′和3′非翻译区以小写字母表示。小鼠cDNA序列和人EST重叠群的关系在图19中表示。
图20B是表示从图20A中核苷酸序列得来的小鼠SOCS5蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图21是表示从对cDNA克隆5-94-2和表5.2中列出的EST的分析得来的人SOCS5 cDNA重叠群h5.1的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图19中表示。
图22是表示从对小鼠EST(表6.1)和人EST(表6.2)的分析得来的小鼠SOCS6 cDNA(6-1A，6-2A，6-5B，6-4N，6-18，6-29，6-3N和6-5N)克隆与重叠群的关系的图示。小鼠SOCS6重叠群的核苷酸序列在图23中表示，人SOCS6重叠群(h6.1和h6.2)的序列在图24中表示。小鼠SOCS6的推测氨基酸序列在图23B中表示。蛋白的结构以图解表示，WD-40重复和SOCS元件盒以()表示。推测的5′和3′非翻译区用细实线表示。
图23A是表示从对cDNA克隆64-10A-11的分析得来的小鼠SOCS6的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示，而推测的3′非翻译区以小写字母表示。小鼠cDNA序列与人EST重叠群的关系在图22中表示。
图23B是表示从图23A中核苷酸序列得来的小鼠SOCS6蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图24是表示从对cDNA克隆5-94-2和表6.2中列出的EST的分析得来的人SOCS6 cDNA重叠群h6.1的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图22中表示。
图25是表示从对小鼠EST(表7.1)和人EST(表7.2)的分析得来的小鼠SOCS7 cDNA克隆(74-10A-11)与重叠群的关系的图示。小鼠SOCS7重叠群的核苷酸序列在图26中表示，人SOCS7重叠群(h7.1和h7.2)的序列在图27中表示。小鼠SOCS7的推测氨基酸序列在图26B中表示。蛋白的结构以图解表示，锚蛋白重复和SOCS元件盒以()表示。推测的5′和3′非翻译区在小鼠中用细实线表示，在h7.2中用波浪线表示。根据对至今分离的克隆和EST的分析，mSOCS7和hSOCS7的3’非翻译区表现极小的相似性。
图26A是表示从对cDNA克隆74-10A-11的分析得来的小鼠SOCS7的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示，而推测的3′非翻译区以小写字母表示。小鼠cDNA序列与人EST重叠群的关系在图25中表示。
图26B是表示从图26A中核苷酸序列得来的小鼠SOCS7蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图27是表示从对表7.2中列出的EST的分析得来的人SOCS7cDNA重叠群h7.1和h7.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图25中表示。
图28是表示从对小鼠SOCS8EST(表8.1和图29A)的分析得来的序列与小鼠SOCS8的推测蛋白结构的关系的图示。小鼠SOCS5的推测的部分氨基酸序列在图29B中表示。蛋白的结构以图解表示，SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图29A是表示从对EST的分析得来的小鼠SOCS8的部分核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示，而推测的3′非翻译区以小写字母表示。
图29B是表示从图29A中核苷酸序列得来的小鼠SOCS8蛋白的部分推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图30是表示小鼠EST(表9.1)和人SOCS9 EST(表9.2)的关系的图示。鼠SOCS9重叠群(m9.1)的核苷酸序列在图31中表示，人SOCS9重叠群(h9.1)的序列在图32中表示。人SOCS9的推测氨基酸序列以图解表示，SH2结构域和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图31是表示从对表9.1中列出的EST的分析得来的小鼠SOCS9cDNA(重叠群m9.1)的部分核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图30中表示。
图32是表示从对表9.2中列出EST的分析得来的人SOCS9cDNA(重叠群h9.1)的部分核苷酸序列的图示。尽管重叠群h9.1编码具有SH2结构域和SOCS元件盒的蛋白这一点是清楚的，但是序列的质量不足够高以推测单一的清楚的开放阅读框架。这些重叠群与鼠cDNA序列的关系在图30中表示。
图33是表示小鼠SOCS10 cDNA克隆(10-9，10-12，10-23和10-24)与从对小鼠EST(表10.1)和人EST(表10.2)的分析得来的重叠群的关系的图示。小鼠SOCS10重叠群的核苷酸序列在图10.2中表示，人SOCS10重叠群(h10.1和h10.1)的序列在图35中表示。蛋白的结构以图解表示，锚蛋白重复和SOCS元件盒以()表示。推测的3′非翻译区在小鼠中用细实线表示，在h10.2中以波浪线表示。根据对至令分离的克隆和EST的分析，mSOCS10和hSOCS10的3′非翻译区表现极小的相似性。
图34是表示从对cDNA克隆10-9，10-12，10-23和10-24的分析得来的小鼠SOCS10的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示，而3′非编码区以小写字母表示。尽管重叠群m10.1编码具有一系列锚蛋白和SOCS元件盒的蛋白这一点是清楚的，但是序列的质量不足够高以推测单一的清楚的开放阅读框架。小鼠和人重叠群与小鼠cDNA序列的关系在图33中表示。
图35是表示从对表10.2中列出的EST的分析得来的人SOCS10cDNA重叠群h10.1和h10.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图33中表示。
图36A是表示从对表11.1中列出的EST的分析得来的人SOCS11cDNA的部分核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸以大写字母表示，而推测的5′和3′非翻译区以小写字母表示。从EST得来的部分cDNA序列与推测蛋白的关系在图37中表示。
图36B是表示从图36A中核苷酸序列得来的人SOCS11蛋白的推测的部分氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图37是表示从对人SOCS11 EST(表11.1和图36A)的分析得来的序列与人SOCS11的推测蛋白结构的关系的图示。人SOCS11的推测的部分氨基酸序列在图36B中表示。蛋白的结构以图解表示，SH2结构域和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图38是表示小鼠SOCS12 cDNA克隆(12-1)与从对小鼠EST(表12.1)和人EST(表12.2)的分析得来的重叠群的关系的图示。小鼠SOCS12重叠群的核苷酸序列在图12.2中表示，人SOCS12重叠群(h12.1和h12.2)的序列在图40中表示。鼠SOCS12的推测的部分氨基酸序列在图39中表示。蛋白的结构以图解表示，锚蛋白重复和SOCS元件盒以()表示。推测的3′翻译区在小鼠中用细实线表示，在h12.2中以波浪线表示。根据对至令分离的克隆和EST的分析，mSOCS12和hSOCS12的3′非翻译区表现极小的相似性。
图39是表示从对cDNA克隆12-1和表12.1列出的EST的分析得来的小鼠SOCS12的核苷酸序列的图示。编码部分推测编码区域的核苷酸包括终止密码子以大写字母表示，而推测的3′非翻译区以小写字母表示。通过与人SOCS12的同源性可以了解重叠群m12.1编码含有一系列锚蛋白重复和SOCS元件盒的蛋白，但是序列的质量不足够高以至不能推测出单一确定的开放阅读框架。小鼠cDNA序列与小鼠和人EST重叠群的关系在图38中表示。
图40是表示从对表12.2中列出的EST的分析得来的人SOCS12cDNA重叠群h12.1和h12.2的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图38中表示。
图41是表示从对小鼠EST(表13.1)和小鼠SOCS13 cDNA克隆(62-1，62-6-7，62-14))的分析得来的重叠群m13.1与从对人EST(表13.2)的分析得来的重叠群h13.1的关系的图示。小鼠SOCS13重叠群的核苷酸序列在图42中表示，人SOCS13重叠群(h13.1)的序列在图43中表示。小鼠SOCS13的推测氨基酸序列在图42B中表示。蛋白的结构以图解表示，WD-40重复和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图42A是表示从对cDNA克隆62-1，62-6-7和62-14的分析得来的小鼠SOCS13的核苷酸序列的图示。编码终止于终止密码子的推测的部分编码区域的核苷酸以大写字母表示，而推测的3′非翻译区以小写字母表示。小鼠cDNA序列与人和小鼠EST重叠群的关系在图41中表示。
图42B是表示从图42A中核苷酸序列得来的小鼠SOCS13蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图43是表示从对表13.2中列出的EST的分析得来的人SOCS13cDNA重叠群h13.1的核苷酸序列的图示。这些重叠群与小鼠cDNA序列的关系在图41中表示。
图44是表示小鼠SOCS14部分cDNA克隆(14-1)与从对小鼠EST(表14.1)的分析得来的重叠群的关系的图示。小鼠SOCS14重叠群的核苷酸序列在图45中表示。小鼠SOCS14的推测的部分氨基酸序列在图45B中表示。蛋白的结构以图解表示，SH2结构域和SOCS元件盒以()表示。推测的3′非翻译区用细实线表示。
图45A是表示从对基因组和cDNA克隆分析得来的小鼠SOCS14的核苷酸序列的图示。编码从推测的ATG“起始”密码子到终止密码子的成熟编码区域的核苷酸以大写字母表示，而推测的5′和3′非翻译区以小写字母表示。小鼠cDNA序列与小鼠和人EST重叠群的关系在图44中表示。
图45B是表示从对图45B中核苷酸序列得来的小鼠SOCS14蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图46是表示从对小鼠BAC和小鼠EST(表15.1)的分析得来的重叠群m15.1与从对人BAC和人EST(表15.2)的分析得来的重叠群m15.1的关系的图示。小鼠SOCS15重叠群的核苷酸序列在图47中表示，人SOCS15重叠群(h15.1)的序列在图47中表示。小鼠SOCS15的推测氨基酸序列在图47B中表示。蛋白的结构以图解表示，WD-40重复和SOCS元件盒以()表示。推测的5′和3′非翻译区用细实线表示。打断编码区域的内含子用∧表示图47A是表示从对表15.1中列出的小鼠BAC的分析得来的覆盖小鼠SOCS15基因的核苷酸序列的图示。编码起始于ATG并终止于终止密码子的推测编码区域的核苷酸以大写字母表示，而那些编码推测的5′非编码区、内含子和3′非翻译区的核苷酸以小写字母表示。小鼠BAC与小鼠和人EST重叠群的关系在图46中表示。
图47B是表示从图47A中核苷酸序列得来的小鼠SOCS15蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图48A是表示从对表15.2中列出的人BAC的分析得来的覆盖人SOCS15基因的核苷酸序列的图示。编码开始于ATG并终止于终止密码子的推测编码区域的核苷酸以大写字母表示，而那些编码推测的5′非翻译区、内含子和3′非翻译区的核苷酸以小写字母表示。小鼠BAC与小鼠和人EST重叠群的关系在图46中表示。
图48B是表示从图48A中核苷酸序列得来的人SOCS15蛋白的推测氨基酸序列的图示。在SOCS元件盒(也在图13中表示)下划线。
图49是表示抑制JAK2激酶活性的摄影图示。(A)上面板Cos M6细胞用Flag标记的mJAK2和mSOCS1 DNA(SOCS1)或只用Flag-mJAK2 DNA瞬间转染并裂解，JAK2蛋白用抗JAK2抗体免疫沉淀并用于体外激酶试验。下面板JAK2免疫沉淀部分用抗JAK2抗体进行Western印迹探测。(B)上面板Cos M6细胞用Flag-mJAK2和Flag-mSOCS1 DNA或只用Flag-mJAK2 DNA瞬间转染并裂解，JAK2蛋白用抗JAK2抗体(UBI)免疫沉淀并用SDS/PAGE胶分离。然后用抗磷酸酪氨酸的抗体通过Western印迹分析免疫沉淀。下面板JAK2表达。Cos细胞用SDS/PAGE胶分离并用抗Flag抗体(M2)通过Western印迹分析。
图50是表示JAK2和SOCS蛋白相互作用的摄影图示。(A)Cos M6细胞用Flag标记的mJAK2和Flag标记的各种SOCS DNA(SOCS1；S1，SOCCS2；S2，SOCS3；S3，CIS)或只用Flag-mJAK2瞬间转染并裂解，JAK2蛋白用抗JAK2抗体(UBI)免疫沉淀并通过SDS/PAGE分离。然后用抗FLAG的抗体(M2)通过Western印迹分析免疫沉淀。(B)(A)中所述的Cos细胞裂解物用SDS/PAGE胶分离并用抗Flag抗体(M2)通过Western印迹测定各种蛋白的表达水平。(C)JAK2酪氨酸磷酸化作用A中所述的COS细胞裂解裂用SDS/PAGE胶分离并用抗磷酸酪氨酸的抗体通过Western印迹分析蛋白。
图51是pBgalpAloxneo的图示。
图52是pBgalpAloxneoTK的图示。
图53是SOCS1失效构建体的图示。优选实施方案详述本发明提供新的信号传导调节剂家族。由于此家族的最初成员抑制细胞因子信号传导，此家族称为“细胞因子信号传导的抑制剂”家族“SOCS”。SOCS家族根据称为“SOCS元件盒”的C末端结构域的存在来定义。SOCS分子的不同种类根据参与蛋白分子相互作用如蛋白DNA或蛋白蛋白相互作用的一般但不仅位于SOCS元件盒的N端的基序来定义。特别优选的基序选自SH2结构域、WD-40重复和锚蛋白重复。
WD-40重复最初在G蛋白的β亚单位中识别。WD-40重复看来形成β-螺旋浆样结构并可能参与蛋白—蛋白相互作用。锚蛋白重复最初在细胞骨架蛋白锚蛋白中识别。
SOCS家族成员可以以各种方法鉴定。例如SOCS1-SOCS3是通过它们抑制细胞因子介导的信号传导的能力得到鉴定的，因此是基于活性得到鉴定的。SOCS4-SOCS15是作为在SOCS元件盒水平上表现相似性的核苷酸序列得到鉴定的。
SOCS元件盒是位于SOCS分子的C末端区域的保守基序，根据本发明，SOCS元件盒的氨基酸序列是X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；
X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；如上所述，根据本发明，基于位于SOCS元件盒的N端的蛋白分子相互作用区域例如但不限于SH2结构域、WD-40重复和锚蛋白重复的存在将SOCS蛋白分成几类，后三个结构域是蛋白蛋白相互作用结构域。
含SH2的SOCS蛋白的例子包括SOCS1、SOCS2、SOCS3、SOCS5、SOCS9、SOCS11和SOCS14。含WD-40重复的SOCS的例子包括SOCS4、SOCS6和SOCS15。含锚蛋白重复的例子包括SOCS7、SOCS10和SOCS12。
本发明特别提供编码SOCS蛋白的核酸分子、纯化的天然存在的SOS蛋白和重组形式的SOCS蛋白以及通过SOCS蛋白的调节活性或SOCS基因的表达来调节信号传导的方法。优选地，信号传导由细胞因子介导，细胞因子的例子包括EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF。特别优选的细胞因子包括IL-6、LIF、OSM、IFNγ和/或促血小板生成素。
因此，本发明的一方面提供包含编码含有在其C末端区域的SOCS元件盒和选择性地SOCS元件盒N端的蛋白分子相互作用结构域的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下能与其杂交的核酸分子。
优选地，蛋白分子相互作用结构域是蛋白DNA或蛋白蛋白相互作用结构域。最优选地，蛋白分子相互作用结构域是SH2结构域、WD-40重复和/或锚蛋白重复之一。
如上所述，优选地，该SOCS调节细胞因子介导的信号传导。然而，本发明可推延至调节其它效应物如其它内源或外源分子、抗原、微生物群体和微生物产物、病毒或其成分、离子、激素和寄生物介导的信号传导的SOCS分子。本文中内源分子是携带SOCS分子的细胞内产生的分子。外源分子是由其它细胞产生或导入体内的分子。
优选地，核酸分子或SOCS蛋白是以分离或纯化的形式。术语“分离的”和“纯化的”是指已经历至少一步从其它物质分离的纯化步骤的分子。
优选地，核酸分子是以分离的形式，是DNA如cDNA或基因组DNA。DNA可以编码与天然存在的SOCS相同的氨基酸序列或者SOCS可以含有一个或多个氨基酸替换、缺失和/或添加。核苷酸序列可以对应于基因组编码序列(包括外显子和内含子)或对应于来自从基因组基因转录的mRNA的cDNA中的核苷酸序列，或者它可在带有在其上的一个或多个核苷酸替换，缺失和/或添加。
在优选的实施方案中，核酸分子包含编码SOCS蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列，其中所述SOCS蛋白的氨基酸序列选自SEQ ID NO4(mSOCS1)，SEQ D NO6(mSOCS2)，SEQ ID NO8(mSOCS3)，SEQ IDNO10(hSOCS1)，SEQ ID NO12(rSOCS1)，SEQ ID NO14(mSOCS4)，SEQ ID NO18(mSOCS5)，SEQ ID NO21(mSOCS6)，SEQ ID NO25(mSOCS27)，SEQ ID NO29(mSOCS8)，SEQ ID NO36(hSOCS11)，SEQ ID NO41(mSOCS13)，SEQ ID NO44(mSOCS14)，SEQ ID NO46(mSOCS15)和SEQ ID NO48(mSOCS15)，或编码在所列序列上有单一或多个氨基酸替换、缺失和/或添加的氨基酸序列或是能在42℃低严格条件下与所述核酸分子杂交核苷酸序列。
在甚至更优选的实施方案中，本发明提供包含编码SOCS蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子，其中核苷酸序列选自主要在SEQ ID NO3(mSOCS1)，SEQ ID NO5(mSOCS2)，SEQ ID NO7(mSOCS3)，SEQ ID NO9(mSOCS11)，SEQ ID NO11(rSOCS1)，SEQIDNO13(mSOCS4)，SEQ ID NO15和SEQ ID NO16(mSOCS1)，SEQ ID NO5(mSOCS2)，SEQ ID NO7(mSOCS3)，SEQ ID NO9(hSOCS11)，SEQ ID NO11(rSOCS1)，SEQ ID NO13(mSOCS4)，SEQ ID NO15和SEQ ID NO16(hSOCS4)，SEQ ID NO17(mSOCS5)，SEQ ID NO19(hSOCS5)，SEQ ID NO20(mSOCS6)，SEQ ID NO22和SEQ ID NO23(hSOCS6)，SEQ ID NO24(mSOCS7)，SEQ ID NO26和SEQ ID NO27(hSOCS7)，SEQ ID NO28(mSOCS8)，SEQ ID NO30(mSOCS9)，SEQ IDNO31(hSOCS9)，SEQ ID NO32(mSOCS10)，SEQ ID NO33和SEQ ID NO34(hSOCS10)，SEQ ID NO35(hSOCS11)，SEQ ID NO37(mSOCS12)，SEQ ID NO38和SEQ ID NO39(hSOCS12)，SEQ ID NO40(mSOCS13)，SEQ ID NO42(hSOCS13)，SEQID NO43(mSOCS14)，SEQ ID NO45(mSOCS15)和SEQ ID NO47(hSOCS15)中列出的核苷酸，或是与任一列出的序列的所有或部分区域有至少约15％相似性的核苷酸序列；或能与任一列出的序列在42℃低严格条件下杂交的核酸分子。
此处提及的在42℃低严格条件包括并包含至少约1％(体积/体积)到至少约15％(体积/体积)的甲酰胺及至少约1M到至少约2M盐的杂交条件和至少约1M到至少约2M盐的洗涤条件。如果需要，可以应用其它杂交条件，如中等严格条件，包括并包含至少约16％(体积/体积)到至少约30％(体积/体积)的甲酰胺及至少约0.5M到至少约0.9M盐的杂交条件和至少约0.5M到至少约0.9M盐的洗涤条件；或高度严格条件，包括并包含至少约30％(体积/体积)到至少约50％(体积/体积)甲酰胺及至少约0.01M到至少约0.15M盐的杂交条件和至少约0.01M到至少约0.15M盐的洗涤条件。
在另一实施方案中，本发明针对SOCS蛋白或其衍生物、同系物、类似物或模拟物，其中所述SOCS蛋白鉴定为如下人SOCS4鉴定为EST81149，EST180909，EST182619，ya99H09，ye70co4，yh53c09，yh77g11，yh87h05，yi45h07，yj04e06，yq12h06，yq56a06，yq60e02，yq92g03，yq97h06，yr90f01，yt69c03，yv30a08，yv55ff07，yv57h09，yv87h02，yv98e11，yw68d10，yw82a03，yx08a07，yx72h06，yx76b09，yy37h08，yy66b02，za81f08，zb18f07，zc06e08，zd14g06，zd51h12，zd52b09，ze25g11，ze69f02，zf54f03，zh96e07，zv66h12，zs83a08和zs83g08；小鼠SOCS-4鉴定为mc65f04，mf42e06，mp10c10，mr81g09和mt19h12；人SOCS-5鉴定为EST15B103，EST15B105，EST27530和zf50f01；小鼠SOCS-5鉴定为mc55a01，mh98f09，my26h12和ve24e06；人SOCS-6鉴定为yf61e08，yf93a09，yg05f12，yg41f04，yg45c02，yh11f10，yh13b05，zc35a12，ze02h08，zl09a03，zl69e10，zn39d08和zo39e06；小鼠SOCS-6鉴定为mc04c05，md48a03，mf31d03，mh26b07，mh78e11，mh88h09，mh94h07，mi27h04和mj29c05，mp66g04，mw75g03，va53b05，vb34h02，vc55d07，vc59e05，vc67d03，vc68d10，vc97h01，vc99c08，vd07h03，vd08c01，vd09b12，vd19b02，vd29a04和vd46d06；人SOCS-7鉴定为STS WI30171，EST00939，EST12913，yc29b05，yp49f10，zt10f03和zx73g04；
小鼠SOCS-7鉴定为mj39a01和vi52h07；小鼠SOCS-8鉴定为mj6e09和vj27a029；人SOCS-9鉴定为CSRL-82f2-u，EST114054，yy06b07，yy06g06，zr40c09，zr72h01，yx92c08，yx93b08和hfe0662；小鼠SOCS-9鉴定为me65d05；人SOCS-10鉴定为aa48h10，zp35h01，zp97h12，zq08h01，zr34g05，EST73000和HSDHEI005；小鼠SOCS-10鉴定为mb14d12，mb40f06，mg89b11，mq89e12，mp03g12和vh53c11；人SOCS-11鉴定为zt24h06和zr43b02；人SOCS-13鉴定为EST59161；小鼠SOCS-13鉴定为ma39a09，me60c05，mi78g05，mk10c11，mo48g12，mp94a01，vb57c07和vh07c11；并且人SOCS-14鉴定为mi75e03，vd29h11和vd53g07；或者上述EST的衍生物或同系物鉴定为能与任一列出的EST在42℃低严格条件下杂交的核酸分子。
在另一实施方案中，核酸分子编码如下氨基酸序列X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；
X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；
上述序列比较优选地是针对完整分子，但也可以是其部分。优选地，针对至少约21个核苷酸或至少约5个氨基酸的连续系列进行比较。更优选地，针对至少约21个连续的核苷酸或至少7个连续的氨基酸进行比较。比较也可以仅针对SOCS元件盒区域或包含蛋白分子相互作用区域如SH2结构域、WD-40重复和/或锚蛋重复的区域进行。
本发明的另一实施方案包括在其C末端区域包含SOCS元件盒的分离的多肽或其衍生物、同系物或模拟物。
优选地，多肽进一步包含蛋白分子相互作用结构域如蛋白DNA或蛋白蛋白相互作用结构域。优选地，此结构域位于SOCS元件盒的N端。特别优选的蛋白分子相互作用结构域是至少一个SH2结构域、WD-4重复和/或锚蛋白重复。
优选地，信号传导由选自EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF的细胞因子介导。优选的细胞因子是IL-6、LIF、OSM、IFFNγ或促血小板生成素。
更优选地，蛋白包含具如下氨基酸序列的SOCS元件盒X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；
X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；另一个实施方案提供含有主要如SEQ ID NO4(mSOCS1)，SEQ ID NO6(mSOCS2)，SEQ ID NO8(mSOCS3)，SEQ ID NO10(hSOCS1)，SEQ ID NO12(rSOCS1)，SEQ ID NO14(mSOCS4)，SEQ ID NO18(mSOCS5)，SEQ ID NO21(mSOCS6)，SEQ ID NO25(mSOCS7)，SEQ ID NO29(mSOCS8)，SEQ IDNO36(hSOCS11)，SEQ ID NO41(mSOCS13)，SEQ ID NO44(mSOCS14)，SEQ ID NO46(mSOCS15)和SEQ ID NO48(hSOCS15)中列出的氨基酸序列或与任一列出的氨基酸序列有至少15％相似性的氨基酸序列的分离的多肽或其衍生物、同系物、类似物或模拟物。
优选的核苷酸相似性百分比包括至少约20％，至少约40％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％或更高如93％、95％、98％、99％。
优选的氨基酸相似性包括至少约20％，至少约30％，至少约40％，至少约50％，至少约60％，至少约70％，至少约80％，至少约90％，至少约95％，至少约97％或约98％或更高。
如上所述，相似性可以针对完整的分子或包含至少21个核苷酸或至少7个氨基酸的区域测定。优选地，测定在保守区域如SH2结构域、WD-40重复、锚蛋白重复或其它蛋白质分子相互作用结构域或SOCS元件盒中的相似性。
术语“相似性”包括序列间的精确相同性，或者，即使序列不同，不同的氨基酸之间在结构、功能、生化或构象水平上相关。
这种核酸分子可以从任何动物如人、灵长类动物、家畜动物(如马、牛、羊、驴、猪)、实验室测试动物(如小鼠、大鼠、兔、仓鼠、豚鼠)、陪伴动物(如狗、猫)或捕获的野生动物(如鹿、狐狸、袋鼠)中分离。
术语“衍生物”不论对于核酸分子还是蛋白质都包括部分、突变体、片段和类似物以及杂交或融合分子和糖基化变异体。特别有用的衍生物包括对SOCS氨基酸序列的单个或多个氨基酸替换，删除或添加。
优选地，衍生物具有功能活性或选择性地作用为拮抗剂或激动剂。本发明进一步扩展到SOCS的同系化合物，包括来自不同种动物的功能上或结构上相关的分子。本发明也包括类似物和模拟物。模拟物包括一般但不必然具有非氨基酸结构的一类分子，并且它能以与其所模拟的蛋白(在此即SOCS)类似的方式作用。模拟物可以包括糖类、芳香环、脂类或其它复杂化学结构或者在组成上也可以是蛋白质。在此考虑的模拟物以及激动剂和拮抗剂可方便地通过环境如瑚瑚、海洋和淡水河床、植物群体和微生物的系统搜索找到。此处有时称为天然产物筛选。另外，可筛选合成的化合物库以得到潜在的有用分子。
如上述，本发明考虑SOCS的激动剂和拮抗剂。拮抗剂的一个实施例是反义寡核苷酸序列。有用的寡核苷酸是那些具有能与核苷酸序列的蛋白编码或“正义”序列的至少部分互补的那些寡核苷酸。这些反义核苷酸可用于引起基因表达的特异抑制。反义方法可通过反义构建体与目标mRNA之间的互补配对形成可能导致翻译杂交阻遏的反平行双螺旋，从而引起显著的基因表达抑制。也可应用RNA酶和协同抑制分子。反义和其它核苷酸分子可能首先需要经过化学修饰以允许细胞透过膜和/或增加它们的血清半衰期或用其他方法使其在体内施用时更加稳定。尽管在诊断应用和SOCS蛋白纯化中更有用，抗体也可作用为拮抗剂或激动剂。拮抗剂和激动剂也可在天然产物筛选或化学化合物库筛选后得到鉴定，或者可以是SOCS的衍生物或类似物。
相应地，本发明扩展到本发明的SOCS蛋白的类似物。类似物可用于例如治疗或预防细胞因子介导的功能失调如自身免疫、免疫抑制或免疫机能亢进或在包括但不限于造血系统、内分泌、肝脏及神经系统中的其它情况。其它信号传导因子如激素或内源或外源分子、抗原、微生物群体和微生物产物、病毒及其成分、离子、激素和寄生虫介导的功能失调也在本发明中予以考虑。
在此考虑的蛋白和类似物包括但不限于对侧链的修饰，在肽、多肽或蛋白质合成时掺入非天然氨基酸和/或其衍生物以及使用交联剂和其它方法在蛋白分子或其类似物上强加构象限制。
本发时考虑的侧链修饰的例子包括氨基修饰如通过与醛反应还原性烷基化后用NaBH4还原；用甲基乙酰亚胺酰胺化；用乙酸酐乙酰化；用氰酸盐使氨基甲氨酰化；用2，4，6-三硝基苯磺酸(TNBS)使氨基三硝基苯化；用琥珀酸酐和四氢邻苯二甲酸酐使氨基乙酰化；以及用吡哆醛-5-磷酸盐使赖氨酸吡哆醛化后用NaBH4还原。
精氨酸残基的胍基可通过与试剂如2，3-丁二酮、苯甲酰甲醛和乙二醛形成杂环缩合产物来修饰。
羧基可通过碳二亚胺活化，即通过O-酰基异脲的形成及随后的衍生作用如形成相应的酰胺来修饰。
Sulphydryl基通过例如如下方法修饰用碘乙酸或碘乙酰胺羧甲基化；过甲酸氧化成磺基丙氨酸；与其它硫醇化合物形成混合的二硫化物；与马来酰亚胺、马来酐或其它取代的马来酰亚胺反应；应用4-对氯汞苯甲酸、4-氯汞基苯磺酸、氯化苯汞、2-氯汞基-4-硝基苯酚和其它汞化合物形成汞衍生物；用氰酸盐在碱性PH下的甲氨酰化。
色氨酸残基修饰可通过例如用N-溴代丁二酰亚胺氧化或用2-羟基-5硝基苄基溴化物或Sulphenyl卤化物使吲哚环烷化来修饰。
另一方面，酪氨酸残基可通过用四硝基甲烷形成3-硝基酪氨酸衍生物来改变。
组氨酸残基咪唑环的修饰可通过用碘乙酸衍生物烷化或用二乙基焦碳酸酯乙酯化来完成。
在合成肽时掺入非天然氨基酸和衍生物的实例包括但不限于应用正亮氨酸，4-氨基丁酸，4-氨基-3-羟基-5-苯基戊酸，6-氨基己酸，叔丁基甘氨酸，正缬氨酸，苯甘氨酸，鸟氨酸，肌氨酸，4-氨基-3-羟基-6-甲基庚酸，2-噻嗯基丙氨酸和/或氨基酸的D-异构体。表3所列的是在此所考虑的非天然氨基酸目录。表3非常规氨基酸代码非常规氨基酸代码α-氨基丁酸 AbuL-N-甲基丙氨酸 Nmalaα-氨基-α-甲基丁酸盐Mgabu L-N-甲基精氨酸 Nmarg氨基环丙烷-羧酸盐(酯)Cpro L-N-甲基天冬酰胺NmasnL-N-甲基天冬氨酸Nmasp氨基异丁酸 AibL-N-甲基半胱氨酸Nmcys氨基正冰片基羧酸盐(酯) Norb L-N-甲基谷氨酰胺NmglnL-N-甲基谷氨酸 Nmglu环己基丙氨酸 Chexa L-N-甲基组氨酸 Nmhis环戊基丙氨酸 Cpen L-N-甲基异亮氨酸NmileD-丙氨酸 DalL-N-甲基亮氨酸 NmleuD-精氨酸 Darg L-N-甲基赖氨酸 NmlysD-天冬氨酸 Dasp L-N-甲基蛋氨酸 NmmetD-半胱氨酸 Dcys L-N-甲基正亮氨酸NmnleD-谷氨酰胺 Dgln L-N-甲基正缬氨酸NmnvaD-谷氨酸 Dglu L-N-甲基鸟氨酸 NmornD-组氨酸 Dhis L-N-甲基苯丙氨酸NmpbeD-异亮氨酸 Dile L-N-甲基脯氨酸 NmproD-亮氨酸 Dleu L-N-甲基丝氨酸 NmserD-赖氨酸 Dlys L-N-甲基苏氨酸 NmthrD-蛋氨酸 Dmet L-N-甲基色氨酸 NmtrpD-鸟氨酸 Dorn L-N-甲基酪氨酸 NmtyrD-苯丙氨酸 Dphe L-N-甲基缬氨酸 NmvalD-脯氨酸 Dpro L-N-甲基乙基甘氨酸 NmetgD-丝氨酸 Dser L-N-甲基叔丁基甘氨酸NmtbugD-苏氨酸 Dthr L-正亮氨酸 NleD-色氨酸 Dtrp L-正缬氨酸 NvaD-酪氨酸 Dtyr α-甲基-氨基异丁酸盐MaibD-缬氨酸 Dval α-甲基-γ-氨基丁酸盐 MgabuD-α-甲基丙氨酸 Dmala α-甲基环己基丙氨酸MchexaD-α-甲基精氨酸 Dmarg α-甲基环戊基丙氨酸McpenD-α-甲基天冬酰胺 Dmasn α-甲基-α-萘基丙氨酸 ManapD-α-甲基天冬氨酸盐 Dmasp α-甲基青霉胺 MpenD-α-甲基半胱氨酸 Dmcys N-(4-氨基丁基)甘氨酸 NgluD-α-甲基谷氨酰胺 Dmgln N-(2-氨基乙基)甘氨酸 NaegD-α-甲基组氨酸 Dmhis N-(3-氨基丙基)甘氨酸 NornD-α-甲基异亮氨酸 Dmile N-氨基-α-甲基丁酸 NmaabuD-α-甲基亮氨酸 Dmleu α-萘基丙氨酸 AnapD-α-甲基赖氨酸 Dmlys N-苯甲基甘氨酸 NpheD-α-甲基蛋氨酸 Dmmet N-(2-氨甲酰基乙基)甘氨酸 NglnD-α-甲基鸟氨酸 Dmorn N-(氨甲酰基甲基)甘氨酸 NasnD-α-甲基苯丙氨酸 Dmphe N-(2-羧乙基)甘氨酸 NgluD-α-甲基脯氨酸 Dmpro N-(羧甲基)甘氨酸 NaspD-α-甲基丝氨酸 Dmser N-环丁基甘氨酸 NcbutD-α-甲基苏氨酸 Dmthr N-环庚基甘氨酸 NchepD-α-甲基色氨酸 Dmtrp N-环己基甘氨酸 NchexD-α-甲基酪氨酸 Dmty N-环癸基甘氨酸 NcdecD-α-甲基缬氨酸 Dmval N-环十二烷基甘氨酸 NcdodD-α-甲基丙氨酸 DnmalaN-环辛基甘氨酸 NcoctD-N-甲基精氨酸DnmargN-环丙基甘氨酸 NcproD-N-甲基天冬酰胺 DnmasnN-环十一烷基甘氨酸 NcundD-N-甲基天冬氨酸盐DnmaspN-(2，2-二苯乙基)甘氨酸NbhmD-N-甲基半胱氨酸 DnmcysN-(3，3-二苯丙基)甘氨酸NbheD-N-甲基谷氨酰胺 DnmglnN-(3-胍基丙基)甘氨酸 NargD-N-甲基谷氨酸盐 DnmgluN-(1-羟乙基)甘氨酸 NthrD-N-甲基组氨酸DnmhisN-(羟乙基)甘氨酸 NserD-N-甲基异亮氨酸 DnmileN-(咪唑基乙基)甘氨酸 NhisD-N-甲基亮氨酸 DnmleuN-(3-吲哚乙基)甘氨酸 NhtrpD-N-甲基赖氨酸 DnmlysN-甲基-γ-氨基丁酸盐 NmgabuN-甲基环己基丙氨酸 Nmchexa D-N-甲基蛋氨酸 DnmmetD-N-甲基鸟氨酸 DnmornN-甲基环戊基丙氨酸 NmcpenN-甲基甘氨酸 Nala D-N-甲基苯丙氨酸 DnmpheN-甲基氨基异丁酸盐 Nmaib D-N-甲基脯氨酸 DnmproN-(1-甲基丙基)甘氨酸 Nile D-N-甲基丝氨酸 DnmserN-(2-甲基丙基)甘氨酸 Nleu D-N-甲基苏氨酸 DnmthrD-N-甲基色氨酸 DnmtrpN-(1-甲基乙基)甘氨酸 NvalD-N-甲基酪氨酸 DnmtyrN-甲基-萘基丙氨酸 NmanapD-N-甲基缬氨酸 DnmvalN-甲基青霉胺 Nmpenγ-氨基丁酸 Gabu N-(p-羟苯基)甘氨酸 NhtyrL-叔丁基甘氨酸 Tbug N-(硫乙基)甘氨酸 NcysL-乙基甘氨酸 Etg 青霉胺 PenL-高苯丙氨酸 Hphe L-α-甲基丙氨酸MalaL-α-甲基精氨酸 Marg L-α-甲基天冬酰胺 MasnL-α-甲基天冬氨酸Masp L-α-甲基叔丁基甘氨酸 MtbugL-α-甲基半胱氨酸Mcys L-甲基乙基甘氨酸 MetgL-α-甲基谷氨酰胺Mgln L-α-甲基谷氨酸盐 MgluL-α-甲基组氨酸 Mhis L-α-甲基高苯丙氨酸MhpheL-α-甲基异亮氨酸Mile N-(2-甲基硫乙基)甘氨酸 NmetL-α-甲基亮氨酸 Mleu L-α-甲基赖氨酸MlysL-α-甲基蛋氨酸 Mmet L-α-甲基正亮氨酸 MnleL-α-甲基正缬氨酸Mnva L-α-甲基鸟氨酸MornL-α-甲基苯丙氨酸Mphe L-α-甲基脯氨酸MproL-α-甲基丝氨酸 Mser L-α-甲基苏氨酸MthrL-α-甲基色氨酸 Mtrp L-α-甲基酪氨酸MtyrL-α-甲基缬氨酸 Mval L-N-甲基高苯丙氨酸 NmhpheN-(N-(2，2-二苯乙基)氨甲Nnbhm N-(N-(3，3-二苯丙基氨甲酰Nnbhe酰甲基)甘氨酸甲基)甘氨酸1-羧基-1-(2，2-二苯乙基氨Nmbc基)环丙烷交联剂可用于例如稳定3D构象，可使用同型双功能交联剂如n＝1到n＝6具有(CH2)n间隔基团的双功能酰亚胺酯、戊二醛和N-羟琥珀酰亚胺酯以及异型双功能试剂，这些试剂通常含有氨基酸反应性组分如N-羟琥珀酰亚胺和其它基团特异性反应性组分如马来酰亚胺或联硫基组分(SH)或碳二亚胺(COOH)。另外，肽可受到构象限制，例如通过掺入Cα和Nα-甲基氨基酸，在氨基酸Cα和Cβ原子间引入双键和通过引入共价键如在N和C端之间、两侧链间或侧链与N或C端之间形成酰胺键而形成环状肽或类似物。
如果施用给个体或用作诊断试剂，这些修饰类型对于稳定细胞因子可能是重要的。
本发明所考虑的其它衍生物包括从完整的非糖基化分子到修饰的糖基化分子的一系列糖基化变体。改变的糖基化模式可能源于不同的宿主细胞中重组分子的表达。
本发明的另一实施方案涉及调节哺乳动物中SOCS蛋白表达的方法，该方法使编码SOCS或参与控制SOCS基因表达的因子/因素的基因与有效量的SOCS表达调节剂在足以上调或下调或其它调节SOCS表达的条件下接触一定时间。调节剂的一个例子是细胞因子如IL-6或其它SOCS表达的转录调节剂。表达包括转录或翻译或两者兼有。
本发明的另一方面包括调节人中SOCS活性的方法，该方法包括在足以升高或降低SOCS活性的条件下给所述哺乳动物施用调节有效量的分子一定时间。这种分子可以是蛋白或化学本质，也可以是SOCS的衍生物或SOCS的化学类似物或截断突变体。
本发明的另一方面提供诱导SOCS合成或SOCS转录/翻译的方法，包括使含SOCS基因的细胞与有效量的能诱导所述SOCS的细胞因子在足以使所述SOCS产生的条件下接触一定时间。例如，SOCS1可由IL-6诱导。
本发明的另一方面包括调节细胞中SOCS蛋白水平的方法，包括使含有SOCS基因与有效量的SOCS基因表达或SOCS蛋白活性的调节剂在足以调节所述SOCS蛋白水平的条件下接触一定时间。
本发明的另一方面包括调节含SOCS基因的细胞中信号传导的方法，包括使所述细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
本发明的另一方面包括影响其中至少一种细胞携带SOCS基因的细胞间相互作用的方法，该方法包括使带有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
如上所述，本发明考虑能作为SOCS拮抗剂或激动剂的一系列模拟物或小分子。这些分子可从天然产物筛选如从珊瑚、土壤、植物或海洋或南极环境获得，或者可方便地对肽、多肽或蛋白库或化学物质库进行筛选。例如，表达SOCS的M1细胞在IL-6存在时不经历分化。此系统可用于筛选在IL-6和SOCS存在时能分化的分子。可制备一系列检测细胞以筛选一系列细胞因子的拮抗剂和激动剂。这些分子优选地是小分子并可以是氨基酸来源或化学来源。SOCS分子与信号蛋白(如JAKS)的相互作用可提供分子筛选以检测干扰或促进这种相互作用的分子。一种这样的筛选方法包括天然产物筛选。
因此，本发明包括含有SOCS或其衍生物或SOCS表达或SOCS活性的调节剂和一种或多种药学上可接受的载体和/或稀释剂的药物组合物。这些组成成分称为“活性成分”。本发明的这些或其它方面适用于任何SOCS分子，例如但不限于SOCS1至SOCS15。
这些药物形式含有适于注射用的活性成分，包括用于即时制备无菌注射无菌水溶液的(在水中可溶的)无菌粉末。这些成分必须在制造和贮存条件下稳定并且必须能抗微生物如细菌和真菌的污染而得到保存。载体可以是溶剂或分散介质，包括例如水、乙醇、多元醇(如甘油、丙二醇和液体聚乙二醇等)及其适当混合物和植物油。合适的流动性可例如通过应用诸如licithin的包被剂、或通过在分散剂参与下维持要求的颗粒大小和通过应用表面活性剂来保持。微生物作用的防止可用各种抗细菌和抗真菌剂如对羟基苯甲酸酯类，氯丁醇、苯酚、山梨酸，thirmerosal等来实施。在许多情况下，优选地包含等渗试剂如糖或氯化钠。可注射成分的延缓吸收可通过在组合物中应用延迟吸收剂如用单硬脂酸铵和白明胶来达到。无菌注射液可通过将所需数量的活性化合物掺入含有以上所列的各种其它成分的合适溶剂中并且随后如所要求的过滤除菌而得到制备。对于制备无菌注射液的无菌粉末，优选的制备方法是真空干燥和冷冻干燥，产生活性成分及其先前灭菌过滤溶液中任何其它所需成分的粉末。
活性成分得到适当保护时，它们可口服给药。例如用隋性稀释剂或可食用可消化吸收的载体，或它可装入硬或软的壳明胶胶囊中，或它可压缩成片剂。对于口服治疗给药，活性成分可与赋形剂结合并以可消化的片剂、颊含片、药片、胶囊、酏剂、悬浮液、糖浆，薄片等形式使用。这些组合物和制品应包含占重量比至少1％的活性成分。当然，这样的组合物和制品的百分比可以变化，并可方便地占单位重量的约5～约80％。在这样的治疗有效的组合物中活性成分的量使得能得到适当的剂量。制备根据本发明所述的优选的组合物或制品以使口服剂量单位包含约0.1μg到约2000mg之间的活性成分。
药片、片剂、丸剂、胶囊等也可含有以下所列的成分粘合剂如树胶、阿拉伯树胶、玉米淀粉或明胶，赋形剂如磷酸氢二钙，分散剂如玉米淀粉、土豆淀粉、藻酸等，润滑剂如硬脂酸镁，可以加入的甜味剂如蔗糖、乳糖或糖精或调味剂如胡椒薄荷、冬青油或樱桃香精。除了以上形式的物质，如果剂量单位形式是胶囊，还可含有液体载体。其它多种材料可作为包被剂存在或修饰剂量单位的物理形式。例如，片剂、丸剂或胶囊可用紫胶，糖或二者包被。糖浆或酏剂可含有活性化合物、作为甜味剂的蔗糖、作为防腐剂的甲基和丙基对羟基苯甲酸酯类、染色剂和香精如樱桃或桔子香精。当然，用于制备剂量单位形式的任何物质应是药学纯的并且所用量基本上无毒。另外，活性化合物可掺入缓释制剂和配方。
本发明也扩展到适于体表给药形式如乳膏、洗液和凝胶。
制药上可接受的载体和/或稀释剂包括任何或所有溶剂，分散介质，包被剂，抗细菌和抗真菌剂、等渗和延缓吸收的药剂等。已在本领域内熟知对制药活性物质应用这些介质和药剂。除非在此范围内，任何传统的介质或试剂与活性成分不相容，应考虑应用其药物组合物。补充的活性成分也可掺入组合物。
配制剂量单位形式的非肠道组合物具有特别的优点，可使给药容易和剂量均一。在此所应用的剂量单位形式指的是适于给所治疗的哺乳动物个体以单位剂量的物质分散单位，每单位含有事先决定的活性物质的量。这一量是根据与所要求的制药载体相一致的，应产生所要达到的疗效而计算出的。本发明的新的剂量单位形式说明书是根据并直接依据(a)活性物质的特性和应达到的特殊疗效(b)在此详细公开的本领域的活性物质化合物治疗健康受损的病态情况下生命体的疾病的固有的局限。
在此之前公开了主要的活性物质的合成。活性物质与合适的药学可接受载体结合成一剂量单位形式以方便、有效地以有效量给药。一单位剂量可以，例如，含有主要活性化合物，其量是从0.5μg至约2000mg。用比例表达是活性化合物一般占载体的从大约0.5μg到大约2000mg/ml组合物包括补充活性成分，剂量根据有用剂量和所说的成分的给药方式来决定。有效量也可方便地以每kg体重的量的方式来表示。例如，可以服用约0.01ng到约10,000mg/kg体重。
药物组合物还包括基因分子如可转染目的细胞的载体。载体上携带一核苷酸分子。这一分子可调节SOCS表达或SOCS活性。载体可以，例如，是病毒载体。在此，本发明考虑的一类基因治疗包括分离某种细胞，基因操作，和重新返回这些细胞到同一实验对象或基因相关或相似的实验对象。
本发明的另一方面涉及SOCS及其衍生物的抗体。这样的抗体可以是单克隆或多克隆的并可选自天然存在的针对SOCS的抗体或可以特异地针对SOCS或其衍生物产生。对于后者，SOCS或其衍生物首先需要与载体分子结合。本发明的抗体和/或重组SOCS或其衍生物作为治疗或诊断试剂特别有用。
例如，SOCS及其衍生物可用于筛选天然产生的针对SOCS的抗体。这些抗体可能例如在某些自身免疫病中产生。另外，特异的抗体可用于筛选SOCS。这样的分析测定技术在本领域内已熟知并且包括例如三明治测定法和ELISA。SOCS水平的了解可能对诊断某些癌症或癌症倾向或监测细胞因子介导的细胞反应性或监测某些治疗措施有意义。
本发明的SOCS抗体可以是单克隆抗体或多克隆抗体，另外，可应用抗体的片段如Fab片段。另外，本发明扩展到重组和合抗抗体以及杂种抗体。在此考虑的“合成抗体”包括抗体的片段和杂化物。本发明的这一方面的抗体，对于免疫治疗特别有用处，并也可作为诊断工具以检测细胞凋亡或监测某些治疗方法的程序。
例如，特异性抗体可用于筛选SOCS蛋白。后者很重要。例如，作为筛选细胞提取液或其它生物体液中SOCS水平或从培养上清液中纯化重组的SOCS的方法。
本发明范围内包括任何二抗(单克隆，多克隆或抗体或合成抗体的片段)。这些二抗直接与上面首先讨论的抗体相关，这些一抗、二抗可用于检测分析或可应用商业性可获得的抗免疫球蛋白抗体作为一抗。在此考虑的抗体包括对SOCS的任一区段有特异性的抗体。
多克隆和单克隆抗体可用酶或蛋白免疫获得。并且两种类型都可用于免疫测定。自血清中获得两种抗体的方法在此领域内已熟知，多克隆血清较少优选，但相对容易制备，制备通过给适当的实验动物注射有效量的SOCS或其抗原性部分，从动物身上收集血清，应用所知的免疫吸附技术收集特异性血清。尽管用这种方法产生的抗体可应用于几乎所有类型的免疫测定，但由于产品潜在不均一性，他们一般较少优选。
单克隆抗体由于能大量生产及产品具有均一性，所以特别优选用于免疫测定。可通过融合不死细胞系和被免疫原性制备剂致敏的淋本发明细胞产生用于生产多克隆抗体的杂交瘤细胞系。这些技术已被本领域的技术人员所熟知并可应用。
本发明的另一方面包括用于检测来自受测试者的生物样品中的SOCS的方法，该方法包括使所述生物样品与对SOCS或其衍生物或同系化合物特异的抗体在足以形成抗体-SOCS复合物的条件下接触一定时间，然后检测该复合物。
SOCS的存在可用大量方法检测到，如Western印迹杂交和ELISA法。多种免疫测定技术可以参考美国专利号4,016,043，4,424,279和4,018,653。这些当然包括非竞争类型的单位点和双位点或“三明治”测定，以及传统的竞争结合测定。这些测定技术还包括标记的抗体与目标的直接结合。
三明治测定技术是最有用的和最普遍使用的测定方法，并且在此发明中优选地应用。本发明包括大量变化了的和所有的三明治测定技术。简要地，一个典型的系列测定中，未标记抗体被固定在一固体支持物上，样品可与固定的分子接触而被检测。经过适当的孵育时间，这段时间经足够允许抗原抗原复合物形成，之后，加入标记有报告分子能产生可检测信号的抗原特异性二抗，并孵育一段时间，以形成另外一个标记的抗体—抗原抗体复合物。洗脱掉其它未反应物。抗原的存在就可通过观察报告分子产生的信号来测定。结果既可通过仅仅观察可见信号定性，又可通过与含有一定数量半抗原的对照样品对比业定量。这种系列测定法的变化包括一种同时测定，即样品和标记的抗体同时加到固定抗体上、本领域的技术人员熟知这些技术，包括可能会很明显的任何小的变化。根据本发明，可能含有SOCS的样品包括细胞提取液、组织活检或可能的血清，唾液，粘膜分泌物，淋本发明、组织液和呼吸液。因此，样品一般是生物样品，包括生物体液，而且还扩展到发酵液或培养细胞的上清液。
典型的系列三明治检测技术中，有SOCS或其抗原部分特异性的一抗既可共价地，又可被动地与固体表面结合。固体表面典型的是玻璃或高分子，最常用的高分子是纤维素，聚丙烯酰胺，信号传导龙，聚苯二烯，聚氯乙烯或聚丙烯。固定支持物形状可是管型，珠状，微孔板或其它适于进行免疫测定的表面。本领域众所周知其结合过程，并且一般是由交联共价结合或物理吸附，在制备测试样品时冲洗高分子一抗体复合物。然后把被测的可整除的样品加到固相复合物上，在合适的条件下(如室温到37℃)孵育足够的时间(例如2-40分钟或如更方便地过液)以保证抗体中任何亚单位固定、孵育之后，冲洗抗体亚单位固相并干燥后再和半抗原的部分特异性二抗孵育，二抗连接有报告分子，报告分子用于显示二抗与半抗原的结合。
另外一种方法涉及固定生物样品中的目标分子，然后暴露固定的目标于特异性抗体中，此特异性抗体可标有或未标有报告分子。依据目标分子的数量及报告分子信号的强度，可通过直接标记抗体来检测固定的目标分子。或者，与一抗特异性结合的标记二抗暴露于目标—一抗复合物中以形成目标—一抗—二抗三级复合物。通过报告分子发出的信号来检测该复合物。
本说明书中所用的“报告分子”是指其化学性质提供可分析鉴定的信号使得可以检测抗原结合的抗体的一类分子。检测可以是定性或定量的。这种测定中最常用的报告分子是酶、荧光基团或含有放射性核素(即放射性同位素)的分子和化学发光分子。
在酶免疫测定时，酶与二抗结合，结合一般通过戊二醛或过碘酸(盐)。尽管容易识别，但存在多种不同的结合技术。这些技术易被本领域的技术人员所应用。常用的酶包括辣根过氧化物酶，葡糖氧化醛，β-半乳糖苷酶和碱性磷酸酶及其它。根据底物与特异的酶作用后的产物，该产物经过相应酶水解后产生可检测的颜色变化来选择所用的底物。合适的酶的实例包括碱性磷酸酶和过氧化物酶。也可用荧光底物，这样产生的是荧光产物而不是上面所提到的产色底物。所有情况中，把酶标抗体加到一抗—抗原复合物上，使其发生结合，然后洗掉过多的试剂，然后把含有合适的底物的溶液加到抗体—抗原—抗体复合物上。底物将与酶标二抗反庆，产生定性的可见信号。这些信号可被进一步定量，通常采用分光光度法，得到样品中半抗原量的指示。“报告分子”也可扩展到应用细胞凝集或凝集抑制。如红细胞在乳胶珠上凝集抑制等。
或者，荧光化合物如荧光素和罗丹明可以在不改变其结合能力的情况下与抗体结合。当被一定波长的光所激发后荧光标记的抗体以收光强，诱导分子进入可激发态，随后发出可用光学显微镜检测到的特征性颜色的光。在EIA中，荧光素标记抗体可与一抗—半抗原复合物结合。洗脱掉未结合的试剂后，剩下的三级复合物就暴露于适当的波长的光下，即可观察到显示感兴趣的半抗原和存在。免疫荧光和EIA技术在本领域中都易于建立，且特别优选用于本方法。然而，也可应用其它报告分子，如放射同位素，化学发光物或生物发光物分子。
本发明还包括基因测定如采用PCR分析来检测SOCS基因或其衍生物。替代的方法或联合应用的方法包括直接核苷酸测序或突变扫描如单链构象多态性分析(SSCP)、特异寡核苷酸杂交和诸如直接蛋白截断测定的方法。
由于细胞因子参与某些SOCS分子的转录，SOCS的检测给细胞因子或细胞因子活性提供了替代标记。这可以在评估患有诸如那些自身免疫疾病，如风湿性关节炎、糖尿病和stiff man综合征等的一系列疾病的对象时有用。
本发明的核酸分子可以是DNA或RNA。当核酸分子以DNA形式时，它可以是基因组DNA或cDNA。本发明的核酸分子的RNA形式一般是mRNA。
尽管本发明的核酸分子一般以分离的形式，但是它们可整合入或连接入或融合或结合于其它遗传分子如载体分子上或特定表达载体分子中。载体和表达载体一般能复制并且，如果可行，在原核细胞或真核细胞中表达。优选地，原核细胞包括大肠杆菌、杆菌属种类和假单孢菌属种类。优选的真核细胞包括酵母菌、真菌、哺乳动物和昆虫细胞。
因此，本发明的另一方面包括包含载体部分、哺乳动物或更具体地人SOCS基因部分的基因构建体，SOCS基因部分能编码SOCS多肽或其功能上或免疫学上相互作用性的衍生物。
优选地，基因构建体的SOCS基因部分可调控地与载体上的启动子相连，使得启动子能指导所述SOCS基因部分在适当细胞中表达。
另外，基因构建体的SOCS基因部分可包含与另一遗传序列如编码谷胱甘肽-S-转移酶或其部分的核苷酸序列融合的所有或部分基因。
本发明扩展到这样的基因构建体及含有相同的基因构建体的原核和真核细胞。
本发明还扩展到SOCS的任何或所有衍生物，包括突变体、部分、片段、组分、同系物、类似物或它们的编码基因序列，包括对天然存在的核苷酸或氨基酸序列的一个或多个核苷酸或氨基酸替换、添加和/或缺失。本发明还扩展到SOCS的模拟物和激动剂及拮抗剂。
本发明的SOCS及其基因序列将在制备一系列治疗和诊断试剂有用并尤其将在检测参与特定细胞反应的细胞因子或此细胞因子的受体中有用。例如，表达SOCS基因的细胞如表达SOCS1基因的M1细胞，将不再对某特定细胞因子，即对于SOCS1的IL-6应答。清楚地，本发明进一步包括诸如表达任何SOCS基因如SOCS1到SOCS15的M1细胞的细胞，更进一步，本发明提供调节或加强治疗性细胞因子能力的分子的用途。例如，阻断一些SOCS活性的分子可能对治疗性细胞因子的潜在活性作用(如G-CSF)。
在治疗涉及细胞因子介导的细胞反应性的疾病、损伤或异常如超免疫反应、免疫抑制、变态反应、高血压等时特别有用的可溶性SOCS多肽也包括在本发明内。
本发明的另一方面包括应用SOCS及其功能性衍生物在制备用于治疗与细胞因子介导的细胞反应性有关的疾病的药物中的用途。
本发明进一步包括表达SOCS基因的转基因哺乳动物细胞。这些细胞是用于测定细胞因子功能抑制的有用的指示细胞系。一个实例是表达SOCS基因的M1细胞。这样的细胞系可用于筛选细胞因子或筛选能作用为细胞因子拮抗剂或激动剂的分子如来自植物、珊瑚、微生物或生物有机活性土壤或水的天然存在的分子。
本发明进一步包括来自相同或不同动物种的不同SOCS间的杂合体。例如，杂合体可在小鼠SOCS1和人SOCS1的所有或功能部分间形成。或者，杂合体可在小鼠SOCS1与小鼠SOCS2的所有或功能部分间形成。在此包括所有这样的杂合体并在开发多效性分子时特别有用。
本发明进一步包括一系列筛选带缺陷型SOCS基因个体的以基因为基础的诊断分析法。这些突变可产生不对特定细胞因子应答的细胞类型或导致引起病情的过量表达。SOCS基因序列可容易地通过用各种PCR或其它测定基因中是否有突变的技术来证实。然后合适的基因治疗或其它干涉治疗可被采用。
本发明用以下非限制性的实施例进一步描述。
实施例1-16涉及根据活性鉴定的SOCS1，SOCS2和SOCS3。实施例17-24涉及最初根据序列相似性克隆的SOCS4至SOCS15的各个方面。实施例25-26分别涉及SOCS4至SOCS15的具体方面。实施例1细胞培养和细胞因子M1细胞系源自SL小鼠中自发产生的白血病[Ichikawa，1969]。本研究中所用的亲本M1细胞已在澳大利亚维多利亚墨尔本的Walter和Eliza Hall医学研究所中传代约10年。通过每周在含10％(体积/体积)胎牛血清(FCS)的Dulbecco改良的Eagle培养基(DME)中传代来维持M1细胞。重组细胞因子通常可从商业来源获得或通过已公开的方法制备。如前所述，重组的鼠LIF在大肠杆菌中合成[Gearing，1989]。从PeproTech Inc(Rocky Hill，NJ，USA)购得纯化的人oncostain M，从Genzyme Diagnostics(Cambridge，MA，USA)获得纯化的小鼠IFN-γ。重组的鼠促血小板生成素在CHO细胞中作为FLAGTM标记的融合蛋白合成并随后得到纯化。实施例2 琼脂集落分析在装有补加20％(体积/体积)胎牛血清(FCS)，0.3％(重量/体积)琼脂和0.1毫升IL-6、LIF、OSM、IFN-γ、tpo或地塞米松(Sigma ChemicalCompany，St Louis，MI)的连续稀释液的1毫升DME的35毫米培养皿中培养300个细胞以检测对细胞因子反应的M1细胞的分化。在37℃含10％(体积/体积)CO2的完全湿润的空气中培养7日后，对M1细胞集落计数，并且如果细胞由分散的细胞组成或在紧密包裹的中心周围有分散细胞冠，就将其归类为分化。实施例3 逆转录病毒文库的产生基本如所述的[Rayner，1994]从因子依赖型造血细胞系FDC-P1构建cDNA表达文库。简要地说，将cDNA克隆入逆转录病毒载体pRUFneo，然后转染进双嗜性包装细胞系(PA317)。转染后48小时从细胞上清收集瞬间产生的病毒并用于转染Y2亲嗜性包装细胞以得到产生高滴度病毒的细胞系。实施例4 M1细胞的逆转录病毒侵染对106个侵染的ψ2细胞群进行辐射(3000rad)并与106个M1细胞在添加10％(体积/体积)FCS和4微克/毫升Polybrene的DME中于37℃共培养2天。为筛选IL-6非反性性克隆，用DME洗一次逆转录病毒侵染的M1细胞并在1毫升含400微克/毫升遗传霉素(GibcoBRL，Grand Island，NY)和100纳克/毫升IL-6的琼脂培养基中按约2×104细胞/毫升培养。如通过在仅存在geneticin时侵染细胞的琼脂铺板估算的，M1细胞的侵染效率是1-2％。实施例5 PCR用SacI消化逆转录病毒侵染的M1细胞的基因组DNA，然后通过聚合酶链反应(PCR)扩增1微克酚/氯仿抽提的DNA。用于扩增整合逆转录病毒的cDNA插入的引物是对应于多克隆位点5’的约30bp的载体gag序列GAG3(5’CACGCCGCCCACGTGAAG GC 3’[SEQ IDNO1])，和对应于多克隆位点3’的约200bp的pMCLneo序列的HSVTK(5’TTCGCCAATGACAAGACGCT3’[SEQ ID No2])。PCR需要94℃起始变性5分钟，35个循环的94℃变性1分钟、56℃退火2分钟和72℃延伸3分钟，然后是最后的10分钟延伸。凝胶纯化PCR产物并将其连接入pGEM-T质粒(Promega，Madison，WI)，并用ABIPRISM Dye终止循环测序试剂盒和373型DNA自动测序仪(AppliedBiosystems Inc，Foster City，CA)进行测序。实施例6 cDNA克隆基本上如所述(Hilton等，1994)从鼠胸腺cDNA文库分离编码小鼠SOCS1的独立cDNA克隆。用BLASTN和TFASTA算法(Pearson和Lipman，1988；Pearson，1990；Altsch等，1990)将小鼠SOCS1 cDNA的核苷酸和推测的氨基酸序列与数据库比较。从编码人SOCS1及小鼠SOCS1和SOCS3的EST设计寡核苷酸并用于探测商业购买的小鼠胸腺和脾cDNA文库。用ABI自动测序仪根据生产商的说明进行测序。实施例7 DNA和RNA印迹及RT-PCR用随机十核甘酸标记试剂盒(Bresatec，Adelaide，South Australia)从来自质粒pPGKneo的编码新霉素磷酸转移酶的600bp PstI片段、通过用Xho I消化1.4kbp PCR产物所得的SOCS1基因的1070bp片段、SOCS2、SOCS3、CIS和小鸡甘油醛3-磷酸脱氢酶基因的1.2kbp片段产生32P标记的探针[Dugaiczyk，1983]。
基本上如所述的用蛋白酶K-十二烷基硫酸钠方法从细胞分离基因组DNA。基本上如所述的[Sambrook，1989]，用BamH I或Sac I消化15微克DNA，在0.8％(重量/体积)琼脂糖凝胶上分级分离，转移至GeneScreenPlus膜(Du Pont NEN，Boston MA)上，预杂交，与随机引物32P标记的DNA片段杂交并冲洗。
如生产商(GibcoBRL，GRand Island，NY)所推荐的用Trizol试剂从细胞和组织分离总RNA。基本上如所述的[Alexander，1995]纯化所需的多聚腺苷酸化mRNA。如所述的[Alexander，1995]对蛋白印迹预杂交，用随机引物32P标记的DNA片段杂交并冲洗。
向小鼠C57BL6静脉注射5微克IL-6，然后在注射后指定时间点收集肝脏以评估IL-6对SOCS基因的诱导。M1细胞在存在20纳克/毫升IL-6的情况下培养并在指定时间收集。对于RT-PCR分析，如所述的(Metacalf等，1995)收集骨髓细胞并用100纳克/毫升的一系列细胞因子在37℃刺激1小时。如所述的对总RNA进行RT-PCR(Metcalf等，1995)。在琼脂糖凝胶上分辨PCR产物并用每个SOCS家族成员特异的探针与DNA印迹杂交。检测β-肌动蛋白的表达以确保扩增的一致性。实施例8 DNA构建和转染通过将完整SOCS1编码区亚克隆入已加工编码起始蛋氨酸下游的框架内FLAG抗原决定基的pEF-BOS表达载体[Mizushima，1990]产生编码表位标记的SOCS1的cDNA(pF-SOCS1)。用前述的电穿孔[Hilton，1994]，将20微克Aat II消化的pF-SOCS1表达质粒和2微克Sca I消化的其中编码嘌呤霉素N-乙酰转移酶的cDNA的转录由小鼠磷酸甘油激酶启动子(pPGkPuropA)驱动的质粒转染入表达促血小板生成素受体(M1.mp1)的M1细胞。在培养48小时后，用20微克/毫升嘌呤霉素(Sigma Chemical Company，St Louis MO)筛选转染的细胞，并用M2抗FLAG的单克隆抗体根据生产商说明书(Eastman Kodak，Rochester NY)通过蛋白印迹分析筛选SOCS1的表达。在其它实验中，仅用pF-SOCS1质粒或对照转染M1细胞并根据其在存在100纳克/毫升IL-6时在琼脂中的生长能力来筛选。实施例9免疫沉淀和蛋白印迹分析在免疫沉淀或蛋白印迹分析(Western blotting)前，将107M1细胞或其衍生物洗两次，重新悬浮于1毫升DME中，并在37℃培养30分钟。然后用盐水或100纳克/毫升IL-6在37℃刺激细胞4分钟，然后加入钒化钠(Sigma Chemical Co.，St Louis，MI)至1mM浓度。将细胞置于冰上，用含1mM钒化钠盐水洗一次，然后用含完全蛋白酶抑制剂(Boehringer Mannheim，Mannheim，Germany)和1mM钒化钠的300微升的1％(体积/体积)Triton X-100，150mM NaCl，2mM EDTA，50mMTris-HCl pH7.4在冰上溶解5分钟。通过离心使裂解物澄清并用考马斯蛋白分析试剂(Pierce，Rockford IL)进行定量。
对于免疫沉淀，用4微克抗gp130的抗体(M20；Santa CruzBiotechnology Inc.，Santa Cruz，CA)或4微克抗磷酸酪氨酸的抗体(4G10；Upstate Biotechnology Inc.，Lake Placid NY)和15微升包装体积的蛋白G Sepharose(Pharmacia，Uppsala，Sweden)与相同浓度的蛋白提取物(1-2毫克)于4℃培养1小时或过夜[Hilton等，1996]。用含完全蛋白酶抑制剂(Boehringer Mannheim，Mannheim，Germany)和1mM钒化钠的1％(体积/体积)NP40，105mM NaCl，50mM Tris-HCl pH8.0洗免疫沉淀两次。样品在SDS样品缓冲液(625mM Tris-HCl pH6.8，0.05％(重量/体积)SDS，0.1％(体积/体积)甘油，溴酚蓝，0.125％(V/V)2-疏基乙醇)中于95℃加热5分钟，通过SDS-PAGE分级分离并如上述免疫印迹。
对于蛋白印迹分析，将来自免疫沉淀反应的10微克细胞提取物或物质蛋白上样到4-15％预备胶(Bio-Rad Laboratories，Hercules CA)上并通过十二烷基硫酸钠聚丙酰胺凝胶电泳(SDS-PAGE)分辨。在100V下1小时将蛋白转移至PVDF膜(Micron Separations Inc.，WestboroughMA)上。用下列一抗探测膜抗酪氨酸磷酸化的STAT3(1∶1000稀释；New England Biolabs，Beverly，MA)；抗-STAT3(C-20；1∶100稀释；Santa Cruz Biotechnology Inc.，Santa Cruz CA)；抗gp130(M20，1∶100稀释；Santa Cruz Biotechnology Inc.Santa Cruz CA)；抗磷酸酪氨酸(辣根过氧化酶偶联的RC20，1∶5000稀释；Transduction Laboratories，Lexington KY)；抗酪氨酸磷酸化的MAP激酶和抗MAP激酶(1∶1000稀释；New England Biolabs，Beverly，MA)的抗体。根据生产商说明书(Pierce，Rockford IL)用过氧化物偶联的二抗和增强的化学发光(ECL)试剂观察印迹。实施例10 电泳迁移率变化分析如所述的[Novak，1995]，用高亲和性SIF(c-sis诱导因子)结合位点m67进行分析[wakao，1994]。从在10毫升含盐水、100ng/ml IL-6或100ng/ml IFN-γ的无血清DME中37℃培养4-10分钟的M1细胞中制备蛋白提取物。结合反应包含4-6微克蛋白(在给定实验中恒定)、5纳克32P标记的m67寡核苷酸和800纳克超声处理的鲑鱼精子DNA。对于某些实验，如所述的[Novak，1995]，蛋白样品与过量的未标记m67寡核苷酸或对STAT1(Transduction Laboratories，Lexington，KY)或STAT3(Santa Cruz Biotechnology Inc.，Santa Cruz CA)特异的抗体一起预培养。
如所述的[Nicola等，1996]用抗酪氨酸磷酸化的STAT3或抗STAT3(New England Biolabs，Beverly，MA)或抗gp 130(Santa CruzBiotechnology Inc.)的抗体进行蛋白印迹分析。如所述的(Novak等，1995)用m67寡核苷酸探针进行EMSA。实施例11细胞因子信号传导新抑制剂的表达克隆采取表达克隆方法鉴定能抑制细胞因子信号传导的cDNA。此策略针对可对细胞因子IL-6，LIF，OSM和IFN-γ及类固醇地塞米松应答分化成成熟巨噬细胞并停止增殖的单核白血病细胞系M1细胞。用其中已克隆入因子依赖型造血细胞系FDC-P1的cDNA的RUFneo逆转录病毒侵染亲本M1细胞。在此逆转录病毒中，新霉素抗性基因和克隆的cDNA的转录由逆转录病毒LTR中存在的强组成型启动子驱动(图1)。亲本M1细胞在半固体琼脂中培养时形成大的紧密包裹的集落。用IL-6刺激时，M1细胞经历快速分化，导致在琼脂中仅形成单一巨噬细胞或小的分散细胞群。在半固体琼脂培养基中根据在IL-6和遗传霉素存在形成大的紧密包裹的集落的能力来挑选对IL-6非反应性的逆转录病毒侵染的M1细胞。在检查104个侵染的细胞后获得单一稳定的IL-6未反应性克隆。
新霉素磷酸转移酶(neo)基因片段用于探测克隆4A2的基因组DNA的DNA印迹并且表明细胞系已由含大约1.4kbp的cDNA的单一逆转录病毒感染(图2)。用来自逆转录病毒载体位于cDNA克隆位点两侧的引物进行PCR扩增保证了我们已命名为细胞因子信号传导抑制剂1或SOCS1的1.4kbp cDNA插入的回收。将此PCR产物用于探测相似的4A2基因组DNA的DNA印迹并与两个片段杂交，一个片段对应于内源SOCS1基因，另一个片段符合用neo探针时所见到的条带大小、对应克隆入整合逆转录病毒的SOCS1 cDNA(图2)。用含不相关cDNA的逆转录病毒侵染的M1细胞中没有观察到后者。相似地，RNA印迹分析表明SOCS1 mRNA在细胞系4A2中丰富，但不存在于对照侵染的M1细胞克隆中(图2)。实施例12 SOCS1、SOCS2、SOCS3和CIS定义含SH2的蛋白新家族SOCS1 PCR产物用作探针从小鼠胸腺cDNA文库中分离同源cDNA。cDNA序列被证明与PCR产物相同，表明SOCS1蛋白的组成型或过量表达而不是突变足以产生IL-6-非反应性表型。将SOCS1cDNA序列与核苷酸序列数据库比较发现它存在于小鼠和大鼠包含小鼠染色体16中发现的鱼精蛋白基因群的基因组DNA克隆。进一步检测表明1.4kb SOCS1序列不与任何鱼精蛋白基因同源，但确实代表位于这些克隆的远3′端的先前未鉴定的开放阅读框架(图3)。在SOCS1cDNA和基因座序列间没有不连续区，表明SOCS1由单一外显子编码。除含鱼精蛋白基因的基因组克隆，一系列鼠和人表达序列标记(EST)也揭示出与小鼠SOCS1相同的大块核苷酸序列。人EST提供的序列信息确保了编码人SOCS1的cDNA的快速克隆。
小鼠和大鼠SOCS1基因编码212个氨基酸的蛋白，而人SOCS1基因编码211个氨基酸的蛋白。小鼠、大鼠和人SOCS1蛋白具有95-99％的氨基酸相同性(图9)。用推测的SOCS氨基酸序列搜索翻译的核酸数据库表明它与最近克隆的细胞因子诱导的立即早期基因产物CIS和两类EST最相关。两类EST的全长cDNA得到分离并发现编码具有与SOCS1和CIS相似长度和总体结构的蛋白。这些克隆命名为SOCS2和SOCS3。四种蛋白中的每一种都包含中央SH2结构域和定义为SOCS基序的C末端区。SOCS1蛋白在不同种中表现极高水平的氨基酸序列相似性(95-99％相同性)。但是，清楚定义含SH2的蛋白新家族的来自相同动物的SOCS1、SOCS2、SOCS3和CIS表现更低的氨基酸相同性。SOCS2和CIS表现约38％氨基酸相同，而家族的其余成员表现25％氨基酸相同性(图9)。SOCS1和SOC3基因编码区看来不含内含子，而SOCS2和CIS基因的编码区分别包含1个和2个内含子。
此处提及的序列的Genbank保藏号是小鼠SOCS1cDNA(U88325)，人SOCS1 cDNA(U88326)，小鼠SOCS2cDNA(U88327)，小鼠SOCS3 cDNA(U88328)。实施例13 抑制一系列细胞因子作用的SOCS1组成型表达为正式确定4A2细胞系的表型与SOCS1表达直接相关，并与这些细胞中独立发生的非相关遗传变化无关，将EF1α启动子调控下的编码SOCS1的表位标记模式的cDNA转染入亲本M1细胞和表达促血小板生成素受体的M1细胞c-mpl(M1.mpl)。两种细胞系中SOCS1表达载体的转染导致IL-6非反应性M1细胞的频率增加。
如蛋白印迹所检测到的，表达SOCS1的M1细胞的多个独立克隆表示不能与4A2区分的细胞因子非反应性表型。此外，如果不在嘌呤霉素中保存转染子，一定时间后SOCS1表达丢失并且细胞重新获得细胞因子反应性。在无细胞因子时，来自4A2和其它表达SOCS1的克隆的集落特征性地长得比由对照M1细胞形成的集落更小(图10)。
用4A2细胞系和表达SOCS1的M1.mpl细胞(M1.mpl.SOCS1)的克隆研究组成型SOCS1表达在M1细胞对一系列细胞因子应答中的影响。不像亲本M1细胞和M1.mpl细胞，表达SOCS1的两种细胞系继续增殖并且不能对IL-6、LIF、OSM、IFN-γ或促血小板生成素(对于M1.mplSOCS1细胞系)反应形成分化集落(图4)。但是对于两种细胞系，观察到对地塞米松的正常反应，表明SOCS1特异影响细胞因子信号传导而不是分化。与这些数据一致，亲本M1细胞和M1.mpl细胞并对IL-6应答变大并形成空泡，4A2和Ml.mpl.SOCS1细胞也没有表现对IL-6或其它细胞因子反应形态分化的证明(图5)。实施例14 SOCS1抑制一系列IL-6信号传导过程，包括STAT3磷酸化和活化细胞表面受体成分gp130的磷酸化作用、胞质酪氨酸激酶JAK1和转录因子STAT3被认为在IL-6信号传导中起重要作用。在亲本M1和M1.mpl细胞系及其表达SOCS1的对应细胞系中比较这些事件。如所期望的，在两种亲本系中gp130对IL-6应答快速磷酸化，但是在表达SOCS1的细胞系中减少5到10倍(图6)。同样地，在表达SOCS1的细胞系中对IL-6应答STAT3磷酸化也减至约10倍(图6)。与STAT3磷酸化作用减少一致，如通过电泳迁移率转变检测所测定的，特异STAT DNA结合复合物的活化也减少。引人注意的是，在用IL-6刺激的M1细胞中诱导的三种STAT复合物SIF-A(含STAT3)、SIF-B(STAT1/STAT3异源二聚体)和SIF-C(含STAT1)的形成减少(图7)。相似地，SOCS1的组成型表达也抑制IFN-γ激活的p91同二聚体的形成(图7)。STAT磷酸化和活化不是唯一受SOCS1表达影响的胞质过程，因为包括shc和MAP激酶的其它蛋白的磷酸化作用也减至相似程度(图7)。实施例15体外和体内IL-6刺激SOCS1基因的转录尽管SOCS1在M1细胞中组成型表达可以抑制细胞因子信号传导，但是这一点并不必然表明SOCS1通常作用为负调节IL-6反应。
为了研究此种可能性，本发明人测定了M1细胞是否对IL-6反应而调节SOCS1基因的转录，因为IL-6在调节对损伤和感染的急性阶段反应中起关键作用，所以也测定了肝对5mg IL-6静脉注射的反应。在无IL-6时，在M1细胞和肝中都检测不到SOCS1 mRNA。然而，对于两种细胞类型，用IL-6在20-40分钟内诱导1.4kb SOCS1转录物(图8)。对于M1细胞，如果IL-6在整个实验中存在，SOCS1 mRNA的水平一直升高(图6)。相反，用单次静脉注射体内施用IL-6并迅速从循环中清除导致IL-6对肝的间断刺激。与此一致，可在肝中检测到SOCS1 mRNA的瞬间表达，注射后约40分钟达到高峰并在4小时内降至基线水平(图8)。实施例16 SOCS基因的调节既然CIS作为细胞因子诱导的立即早期基因得到克隆，本发明人测定了SOCS1、SOCS2和SOC3是否受到相似调节。四个SOCS基因表达的基本模式通过对来自雌性和雄性C5781/6小鼠组织的mRNA进行Northern印迹分析来测定(图11A)。在胸腺中观察到SOCS1的组成型表达，在脾和肺水平更低。SOCS2表达基本限制在睾丸和某些动物的肝或肺中；对于SOCS1，在肺、脾和胸腺中观察到低水平表达，而CIS表达更广泛，包括睾丸、心脏、肺、肾和某些动物的肝。
本发明人设法测定四个SOCS基因的表达是否由IL-6调节。从未处理的和注射IL-6的小鼠或未刺激的和IL-6刺激的M1细胞制备的mRNA的Northern印迹用标记的SOCS1、SOCS2、SOCS3和CIS cDNA片段杂交(图11B)。IL-6注射后，所有四个SOCS基因在肝中的表达都增加，然而诱导动力学看来不同。SOCS1和SOCS在肝中的表达是瞬间的，在IL-6注射20分钟后有可检测到的mRNA，对于SOCS1在4小时内降至基础水平，对于SOCS3在8小时内降至基础水平。SOCS2和CIS mRNA在肝中的诱导遵循与SOCS1相似的起始动力学，但在升高的水平上保持至少24小时。SOCS基因mRNA的相似诱导也在其它器官，明显地在肺和脾中发现。相反，在M1细胞中，SOCS1和CISmRNA受IL-6诱导，而没有观察SOCS2或SOCS3表达的诱导。此结果表明在SOCS家族成员基因对相同细胞因子应答的表达中的细胞类型特异性的不同。
为了测定能诱导各种SOCS基因家族成员转录的细胞因子的范围，用一系列细胞因子刺激骨髓细胞，然后提取mRNA并合成cDNA。然后使用PCR评估SOCS1、SOCS2、SOCS3和CIS的表达(图11C)。在不刺激时，通过PCR在骨髓中检测到极少的任一SOCS基因的表达或检测不到任何SOCS基因的表达。用广泛的细胞因子刺激骨髓细胞看来能正调节一个或多个SOCS家族成员的mRNA。例如，IFNγ诱导所有四个SOCS基因的表达，而促红细胞生成素、粒细胞集落刺激因子、颗细胞--巨噬细胞集落刺激因子和白细胞介素-3诱导SOCS2、SOCS3和CIS的表达。有趣地是，通过不属于I型细胞因子受体类型的受体作用的肿瘤坏死因子、巨噬细胞集落刺激因子和白细胞介素-1也表现出能诱导SOCS3和CIS的表达，证明SOCS蛋白可以在调节信号传导中起更广泛的作用。
由于SOCS1的组成型表达抑制M1细胞对一系列细胞因子的反应，本发明人测定了被认为在IL-6信号传导中起关键作用的细胞表面受体成分gp130和转录因子STAT3的磷酸化是否受到影响。在亲本M1和M1.mpl细胞和它们表达SOCS1的对应物中比较这些事件。如所预测的，在两种亲本细胞系中，gp130迅速对IL-6反应而磷酸化，然而在表达SOCS1的细胞系中磷酸化作用降低(图12A)。同样，STAT3对IL-6反应的磷酸化作用也在表达SOCS1的那些细胞系中降低(图12A)。与STAT3磷酸化作用降低一致，通过电泳泳动率变化实验测定的特异STAT/DNA结合复合物的活化也降低。明显地，用IL-6在M1细胞中诱导的主要STAT复合物SIF-A(含有STAT3)和SIF-B(STAT1/STAT3异源二聚体)没有形成。相似地，SOCS1的组成型表达也抑制IFNγ刺激的SIF-C(STAT1同源二聚体)的形成(图12B)。这些实验与SOCS1有效地在激酶水平上抑制受体上游的信号传导和STAT磷酸化作用的假设一致。
SOCS1抑制信号传导并最终抑制对细胞因子的生物反应的能力表明，如同含有SH2的磷酸酶SHP-1[Ihle等，1994；Yi等，1993]，SOCS蛋白通过抑制信号传导过程在控制细胞对各种细胞外刺激反应的强度和/或时间中起关键作用。此处提供的证据表明对于细胞因子信号传导，SOCS家族以典型的负反馈环作用。如同其它基因如OSM，编码SOCS蛋白的基因的表达由细胞因子经STAT的活化诱导。一旦表达，认为SOCS蛋白抑制JAK的活性并因此减少受体和STAT的磷酸化作用，由此抑制信号传导和任何随后的生物学反应。重要的是，在长时间范围内，STAT活化的抑制将导致SOCS基因表达的减少，使细胞重新得到对细胞因子的反应性。实施例17 数据搜索用TFASTA和MOTIF/PATTERN算法(Pearson，1990；Cockwell和Giles，1989)搜索包含表达序列标鉴(EST)的主要数据和人表达序列标鉴的TIGR数据的NCBI遗传序列数据(Genbank)以寻找与保守的SOCS元件盒基序更具相似性的序列。使用软件包SRS(Etzold等，1996)，寻找与SOCS元件盒有相似性的EST(和从cDNA的另一端测序得来它们的伴侣)并使用Autoassembler(Applied Biosystems，FosterCity，CA)将它们排列成重叠群。然后用BLA STN[Altschul等，1990]，使用来自重叠的EST的保守核苷酸序列搜索不同的数据。又得到阳性EST并加到重叠群中。重复此过程直到不再能找到另外的EST。然后同Sequence Navigator(Applied Biosystems，Foster City，CA)翻译保守的核苷酸序列。编码新SOCS蛋白的EST如下人SOCS4(EST81149，EST180909，EST182619，ya99H09，ye70co4，yh53c09，yh77g11，yh87h05，yi45h07，yj04e06，yq12h06，yq56a06，yq60e02，yq92g03，yq97h06，yr90f01，yt69c03，yv30a08，yv55f07，yv57h09，yv87h02，yv98e11，yw68d10，yw82a03，yx08a07，yx72h06，yx76b09，yy37h08，yy66b02，za81f08，zb18f07，zc06e08，zd14g06，zd51h12，zd52b09，ze25g11，ze69f02，zf54f03，zh96e07，zv66h12，zs83a08和zs83g08)，小鼠SOCS-4(mc65f04，mf42e06，mp10c10，mr81g09，和mt19h12)，人SOCS-5(EST15B103，EST15B105，EST27530和zf50f01)，小鼠SOCS-5(mc55a01，mh98f09，my26h12和ve24e06)，人SOCS-6(yf61e08，yf93a09，yg05f12，yg41f04，yg45c02，yh11f10，yh13b05，zc35a12，ze02h08，zl09a03，zl69e10，zn39d08和zo39e06)，小鼠SOCS-6(mc04c05，md48a03，mf31d03，mh26b07，mh78e11，mh88h09，mh94h07，mi27h04和mj29c05，mp66g04，mw75g03，va53b05，vb34h02，vc55d07，vc59e05，vc67d03，vc68d10，vc97h01，vc99c08，vd07h03，vd08c01，vd09b12，vd19b02，vd29a04和vd46d06)，人SOCS-7(STS WI30171，EST00939，EST12913，yc29b05，yp49f10，zt10f03和zx73g04)，小鼠SOCS-7(mj39a01和vi52h07)，小鼠SOCS-8(mj6e09和vj27a029)，人SOCS-9(CSRL-82f2-u，EST114054，yy06b07，yy06g06，zr40c09，zr72h01，yx92c08，yx93b08和hfe0662)，小鼠SOCS-9(me65d05)，人SOCS-10(aa48h10，zp35h01，zp97h12，zq08h01，zr34g05，EST73000和HSDHEI005)，小鼠SOCS-10(mb14d12，mb40f06，mg89b11，mq89e12，mp03g12和vh53c11)，人SOCS-11(zt24h06和zr43b02)，人SOCS-13(EST59161)，小鼠SOCS-13(ma39a09，me60c05，mi78g05，mk10c11，mo48g12，mp94a01，vb57c07和vh07c11)，人SOCS-14(mi75e03，vd29h11和vd53g07)。实施例18 cDNA克隆根据从重叠EST得来的保守序列设计对不同SOCS家族成员特异的寡核苷酸。按上述标记寡核苷酸并将其用于筛选商业购买的用入噬菌体克隆的基因组和cDNA文库。覆盖鼠SOCS4、鼠SOCS5和鼠SOCS6的完整编码区域的基因组和/或cDNA克隆得到分离。完整SOCS15基因在人12p13BAC(Genbank登记号HSU47924)和鼠6号染色体BAC上(Genbank登记号AC002393)。鼠SOCS7、SOCS9、SOCS10、SOCS11、SOCS12、SOCS13和SOCS14的部分cDNA也得到分离。实施例19 Northern印迹和vt PCRNorthern印迹按上述进行。杂交探针来源如下(i)鼠SOCS1 cDNA的完整编码区域，(ii)来自SH2结构域上游SOCS编码区域的1059bpPCR产物，(iii)鼠SOCS6 cDNA的完整编码区域，(iv)来自部分SOCS7cDNA的编码区域的790bp PCR产物和(v)鸡甘油醛-3-磷酸脱氢酶(GAPDH)cDNA的1200bp PstI片段。实施例20 SOCS家族的其它成员SOCS1、SOCS2和SOCS3是在实施例1-16中鉴定的SOCS蛋白家族的成员。它们各含有中央的SH2结构域和称为SOCS元件盒的C末端保守基序。为了分离此蛋白家族的其它成员，用对应于SOCS元件盒保守残基的氨基酸序列搜索各种DNA数据。这种搜索表明存在编码12个SOCS蛋白家族其它成员的人和小鼠EST(图13)。用此序列信息分离编码SOCS4、SOCS5、SOCS6、SOCS7、SOCS9、SOCS10、SOCS11、SOCS12、SOCS13、SOCS14和SOCS15的cDNA。来自EST的重叠群和cDNA的进一步分析表明可以根据SOCS蛋白SOCS元件盒N端的推测结构将它们分成三类。这三类是带有(i)SH2结构域、(ii)WD-40重复和(iii)锚蛋白重复的SOCS蛋白。实施例21 带有SH2结构域的SOCS蛋白带有SH2结构域的8个SOCS蛋白得到鉴定。它们包括SOCS1、SOCS2、SOCS3、SOCS5、SOCS9、SOCS11和SOCS14(图13)。小鼠SOCS5和SOCS14的全长cDNA及编码小鼠SOCS9和SOCS14的部分克隆得到分离。一级氨基酸序列和基因结构的分析表明这些蛋白对(SOCS1和SOCS3，SOCS2和CIS，SOCS5和SOCS14及SOCS9和SOCS11)是亲缘关系最近的(图13)。的确，SOCS5和SOCS14的SH2结构域是最相同的(图13B)，并且与CIS、SOCS1、SOCS2和SOCS3不同，SOCS5和SOCS14在它们的SH2结构域前有延伸的、尽管保守性更低的N端区域(图13A)。实施例22带有WD-40重复的4个SOCS蛋白得到鉴定。与带有SH2结构域的SOCS蛋白相同，这些蛋白的两两之间亲缘关系很近。小鼠SOCS4和SOCS6的全长cDNA得到分离并表明编码蛋白在SOCS元件盒的N端含有8个WD-40重复并与SOCS4和SOCS6有65％的氨基酸相似性。基于对来自人染色体12p13和小鼠6号染色体合成区域的BAC测序，SOCS15识别为开放阅读框架[Ansari-Lari等，1997]。在人、黑猩猩和小鼠中，SOC15由位于丙糖磷酸异构酶(TPI)基因3’末端几百碱基对内的二个编码外显子编码，但在IPI的相反链上编码。除了(末端)SOCS元件盒，SOCS15蛋白还含有四个WD-40重复。有趣地是，在EST数据库中，存在与SOCS15有亲缘关系的线虫、昆虫和鱼序列。实施例23鉴定了带有锚蛋白重复的三个SOCS蛋白。小鼠SOCS7、SOCS10和SOCS12的部分cDNA分析证明了多个锚蛋白重复的存在。实施例24 SOCS蛋白的表达模式对每种SOCS蛋白的代表性成员-来自SH2结构域类的SOCS1和SOCS，来自WD-40重复类的SOCS6和来自锚蛋白重复类的SOCS7的mRNA的表达进行检测。
既然SOCS1基因的转录受细胞因子诱导，本发明人设法测定细胞因子刺激后SOCS5、SOCS6和SOCS7的mRNA水平是否增加。在用IL-6注射的小鼠肝中，SOCS1 mRNA可在20分钟后检测到并在2小时内降至背景水平。相反，SOCS5 mRNA表达的动力学十分不同，在IL-6注射12-24小时后可检测到。SOCS6 mRNA看来是组成型表达的，而SOCS7 mRNA在IL-6注射前或注射后的任何时候都检测不到。
这些基因的表达也在细胞因子刺激经加工而表达bcl-W的因子依赖型细胞系FDCP-1后检测到。同样，SOCS6 mRNA是组成型表达的。实施例25 SOCS4通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS4(图13)。那些来自人和小鼠SOCS4 cDNA的EST在下面列表(表4.1和4.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选克隆入λ噬菌体的小鼠胸腺cDNA文库。编码小鼠SOCS4的cDNA得到分离并完全测序(图15)，并表明与数据库中鉴定的小鼠EST重叠(表4.1和图17)。这些cDNA包括5′非翻译区、完整小鼠SOCS编码区域和3′非翻译区(图17)。序列分析确认了SOCS4 cDNA编码C末端的SOCS元件盒和SOCS元件盒前的8个WD-40重复(图17和16)。人SOCS4的两个序列重叠群(h4.1和h4.2)与实验测定的小鼠SOCS cDNA序列的关系在图17中表示。两个人重叠群的核苷酸序列在图18中列出。
SEQ ID NO13和14代表鼠SOCS4的核苷酸序列和相应的氨基酸序列。SEQ ID NO15和16分别是SOCS4 cDNA人重叠群h4.1和h4.2。实施例26 SOCS5通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS5(图13)。那些来自人和小鼠SOCS5 cDNA的EST在下面列表(表5.1和5.2)。使用来自小鼠和人EST的序列信息设计几个寡核苷酸并用于以传统方式筛选克隆入入噬菌体的小鼠胸腺cDNA文库、小鼠基因组cDNA文库和人胸腺cDNA文库。编码小鼠SOCS5的单一基因组DNA克隆(57-2)和(5-3-2)cDNA克隆得到分离并完全测序，并表明与数据库中鉴定的小鼠EST重叠(图19和20A)。小鼠SOCS5的完整编码区域和5′和3′非翻译区看来在单一外显子上编码(图19)。序列分析(图20)确认了SOCS5基因组和cDNA克隆编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图19和20B)。从对cDNA克隆5-94-2和人SOCS EST(表5.2)的分析得来的人SOCS5重叠群(h5.1和图21)与小鼠SOCS5 cDNA序列的关系在图19中表示。鼠SOCS5的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO17和18中表示。人SOCS5的核苷酸序列在SEQ ID NO19中表示。实施例27 SOCS6通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS6(图13)。那些来自人和小鼠SOCS6 cDNA的EST在下面列表(表6.1和6.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。8个编码小鼠SOCS6的cDNA克隆(6-1A，6-2A，6-5B，6-4N，6-18，6-29，6-3N，6-5N)得到分离并完全测序(图15)，并表明与数据库中鉴定的小鼠EST(和图22和23A)重叠。序列分析(图23)确认了小鼠SOCS cDNA克隆编码含有在其C末端的SOCS元件盒和8个WD-40重复的蛋白(图22和23B)。从对人SOCS6 EST(表6.2)的分析得来的人SOCS6重叠群(h6.1和h6.2，图24)与小鼠SOCS cDNA序列的关系在图22中表示。鼠SOCS6的核苷酸序列和相应的氨基酸序列分别在SEQ IDNO20和21中表示。人SOCS6重叠群h6.1和h6.2分别在SEQ ID NO22和23中表示。实施例28 SOCS7通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS7(图13)。那些来自人和小鼠SOCS7 cDNA的EST在下面列表(表7.1和7.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。编码小鼠SOCS7的一个cDNA克隆(74-10A-11)得到分离并完全测序，并表明与数据库中鉴定的小鼠EST(图25和图26A)重叠。序列分析(图26)证明小鼠SOCS7编码含有在其C末端的SOCS元件盒和几个锚蛋白重复的蛋白(图25和26B)。从对人SOCS7 EST(表7.2)的分析得来的人SOCS7重叠群(h7.1和h7.2，图27)与小鼠SOCS7 DNA序列的关系在图25中表示。鼠SOCS7的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO24和25中表示。人SOCS7重叠群h7.1和h7.2的核苷酸序列分别在SEQ IDNO26和27中表示。实施例29 SOCS8来自小鼠SOCS8 cDNA的EST在下表列表(表8.1)。如上对SOCS家族其它成员所述，有可能使用来自小鼠EST的序列信息分离小鼠SOCS8的cDNA。EST与推测的SOCS8编码区域的关系在图28中表示。从EST得到的核苷酸序列在图29A中表示，SOCS8的部分氨基酸序列在图29B中表示。鼠SOCS8的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO 28和29中表示。实施例30 SOCS9通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS9(图13)。那些来自人和小鼠SOCS9 cDNA的EST在下面列表(表9.1和9.2)。从对小鼠SOCS9 EST(表9.1)的分析得来的小鼠SOCS9重叠群(m9.1，表9.2)与人SOCS9 DNA重叠群的关系在图31中表示。序列分析(图32)表明人SOCS9编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图30)。鼠SOCS9 cDNA的核苷酸序列在SEQID NO30中表示。人SOCS cDNA的核苷酸序列在SEQ ID NO31中表示。实施例31 SOCS10通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS10(图13)。那些来自人和小鼠SOCS10 cDNA的EST在下面列表(表10.1和10.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。编码小鼠SOCS10的四个cDNA克隆(10-9，10-12，10-23和10-24)得到分离并完全测序，并表明与数据库中鉴定的小鼠和人EST重叠(图33和图34)。序列分析(图34)表明小鼠SOCS10 cDNA不是全长但它的确编码含有在其C末端的SOCS元件盒和几个锚蛋白重复的蛋白(图33)。从对人SOCS10 EST的分析得来的人SOCS10重叠群(h10.1和h10.2，图35)与小鼠SOCS10 DNA序列的关系在图33中表示。小鼠cDNA克隆和EST与人EST的比较表明，小鼠和人SOCS10的3’非翻译区明显不同。鼠SOCS10的核苷酸序列在SEQ ID NO32中表示。人SOCS10重叠群h10.1和h10.2的核苷酸序列分别在SEQ ID NO33和34中表示。实施例32 SOCS11通过用SOCS元件盒保守序列搜索EST数据库识别出人SOCS11(图13)。那些来自人SOCS11 cDNA的EST在下面列表(表11.1和11.2)。从对EST(表11.2)的分析得来的人SOCS11重叠群(h11.1，图36A，B)与推测编码蛋白的关系在图37中表示。序列分析(图36B)表明人SOCS11 cDNA编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图37和36B)。人SOCS11的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO35和36中表示。实施例33 SOCS12通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS12(图13)。那些来自人和小鼠SOCS12 cDNA的EST在下面列表(表12.1和12.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺cDNA文库。编码小鼠SOCS12的四个cDNA克隆(10-9，10-12，10-23和10-24)得到分离并完全测序，并表明与数据库中鉴定的小鼠和人EST重叠(图33和图34)。序列分析(图39和40)表明小鼠SOCS12 cDNA克隆编码含有在其C末端的SOCS元件盒和几个锚蛋白重复的蛋白(图38)。从对人SOCS12EST的分析得来的人SOCS12重叠群(h12.1和h12.2，图40)与小鼠SOCS12 DNA序列的关系在图38中表示。小鼠cDNA克隆和EST与人EST的比较表明小鼠和人SOCS12的3’非翻译区明显不同。SOCS12的核苷酸序列在SEQ ID NO37中表示。人SOCS12重叠群h12.1和h12.2分别在SEQ ID NO38和39中表示。实施例34 SOCS13通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS13(图13)。那些来自人和小鼠SOCS13 cDNA的EST在下面列表(表13.1和13.2)。使用来自小鼠EST的序列信息设计几个寡核苷酸并用于以传统方式筛选小鼠胸腺和小鼠胚cDNA文库。编码小鼠SOCS13的三个cDNA克隆(62-1，62-6-7和62-14)得到分离并完全测序，并表明与数据库中鉴定的小鼠EST(图41和图42A)重叠。序列分析(图42)表明小鼠SOCS13编码含有在其C末端的SOCS元件盒和可能的WD-40重复的蛋白(图41和42B)。从对人SOCS13 EST(表13.2)的分析得来的人SOCS13重叠群(h13.1和h13.2，图43)与小鼠SOCS13 DNA序列的关系在图41中表示。鼠SOCS13的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO40和41中表示。人SOCS13重叠群h13.1的核苷酸序列在SEQ ID NO42中表示。实施例35 SOCS14通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS14(图13)。那些来自人和小鼠SOCS14 cDNA的EST在下面列表(表14.1和14.2)。使用来自小鼠和人EST的序列信息设计几个寡核苷酸并用于以传统方式筛选克隆入λ噬菌体的小鼠胸腺cDNA文库、小鼠基因组DNA文库和人胸腺DNA文库。编码小鼠SOCS14的一个基因组DNA克隆(57-2)和cDNA克隆(5-3-2)得到分离并完全测序，并表明与数据库中鉴定的小鼠EST(图44和图45A)重叠。小鼠SOCS14的完整编码序列及5’和3’非翻译区看来在单一外显子上编码(图44)。序列分析(图45)确认了小鼠SOCS14基因组和cDNA克隆编码含有在其C末端的SOCS元件盒和SH2结构域的蛋白(图44和45B)。从对cDNA克隆5-94-2和人SOCS14 EST(表14.2)的分析得来的人SOCS14重叠群(h14.1，表14.3)与小鼠SOCS14 DNA序列的关系在图44中表示。鼠SOCS14的核苷酸序列和相应的氨基酸序列分别在SEQID NO43和44中表示。实施例36 SOCS15通过用SOCS元件盒保守序列搜索EST数据库识别出人和小鼠SOCS15(图13)。那些来自人和小鼠SOCS15 cDNA的EST在下面列表(表15.1和15.2)，也列出了含有完整小鼠和人SOCS15基因的小鼠和人BAC。使用来自EST和BAC的序列信息有可能推测SOCS15的完整氨基酸，并且如对其它SOCS基因所述的，设计特异的寡核苷酸探针以分离cDNA是可行。BAC与EST的关系在图46中表示，并且来自小鼠和人BAC的SOCS15的核苷酸序列和推测的氨基酸序列在图47和48中表示。鼠SOCS15的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO46和47中表示。人SOCS15的核苷酸序列和相应的氨基酸序列分别在SEQ ID NO48和49中表示。实施例37 SOCS与JAK2激酶的相互作用这些实施例表明SOCS和JAK2激酶之间的相互作用。相互作用由SOCS1，2，3和CIS的SH2结构域介导(图49)。JAK和SOCS1，2，3及CIS之间的基本相互作用在图50中表示。
使用以下方法免疫沉淀通过电穿孔瞬间转染COS6细胞并培养48小时。然后在冰上在加有完全蛋白酶抑制剂(Boehringer Mannheim)的裂解缓冲液[50mM Tris/HCl(pH7.5)，150mM NaCl，1％(体积/体积)TritonX-100，1mM EDTA，1mM Naf，1mM Na3VO4]中裂解，于4℃离心并保留上清以用5μl抗JAK2抗体(UBI)进行免疫沉淀。抗原-抗体复合物用蛋白A-Sepharose(30μl 50％浆液)回收。
Westerrn印迹免疫沉淀用十二烷基硫酸钠(SDS)-聚丙烯酰胺凝胶电泳在还原条件下分析。然后将蛋白电泳转移到硝酸纤维素膜上，在10％(重量/体积)脱脂牛奶中封闭过夜并在PBS/0.1％(体积/体积)Tween-20(Sigma)洗脱缓冲液中洗涤，然后与稀释于洗涤缓冲液/1％(重量/体积)BSA的抗磷酸铬氨酸的抗体(4G 10)(1∶5000，UBI)、抗FLAG的抗体(1.6μg/ml)或抗JAK2的抗体(1∶2000，UBI)一起温育2小时。洗涤硝酸纤维素膜印迹并用稀释于洗涤缓冲液/1％(重量/体积)BSA中的过氧化物酶偶联的羊抗兔免疫球蛋白(1∶5000，Silenus)或过氧化物酶偶联的羊抗鼠免疫球蛋白(1∶5000，Silenus)检测一抗。洗涤印迹并用加强的Chemiluminescenle(ECL)系统(Ainersham，UK)根据厂商说明使抗体结合可见。
体外激酶分析进行体外激酶分析以评估JAK2激酶催化活性。如上述对JAK2蛋白进行免疫沉淀，在激酶分析缓冲液(50mM NaCl，5mM MgCl2，5mM MnCl2，1mM NaF，1mM Na3VO4，10mM HEPES，pH7.4)中洗两次并悬浮于含0.25μCi/ml(γ-32p)-ATP的等体积激酶缓冲液中(30分钟，室温)。除去过量的(γ-32p)-ATP并用SDS/PAGE在还原条件下分析免疫沉淀。通过用1M KOH(55℃，2小时)处理对胶进行温和碱水解以除去磷酸丝氨酸和磷酸铬氨酸。用IMAGEQOANT软件在phosphorImage系统(Molecular Dynamics，Sunnyvale，CA，USA)上观察放射性条带。实施例38 制备失效构建体在图51-53中表示质粒构建体和失效构建体的图解。用限制性酶BamHI和EcoRI消化基因组SOCS-1克隆95-11-10以得到编码区域(SOCS1外显子)3’的3.6kb DNA片段用作SOCS1失效载体中的3’臂。然后将此片段的末端补平并将此片段连接入下列载体pBgalpAloxNeo和pBgalpAloxNeoTK它们已在单一XhoI位点处切开并补平。此连接导致下列载体的形成3’SOCS1臂在pBgalpAloxNeo中和3’SOCS-1臂在pBgalpAloxNeoTK通过用PCR从SOCS-1基因组克隆95-11-10得到SOCS1编码区域(SOCS1外显子)的正好5’端的2.5kb PCR产物。用于制备此产物的寡核苷酸是5’寡核苷酸(有义)(2465)AGCT AGA TCT GGA CCC TAC AAT GGC AGC[SEQ ID NO49]3’寡核苷酸(反义)(2466)AGCT AG ATC TGC CAT CCT ACT CGA GGG GCC AGC TGG[SEQ ID NO50]
用限制性酶Bgl II消化PCR产物以得到PCR产物的Bgl II末端。然后如下连接带有Bgl II末端的此5’SOCS1 PCR产物已用单一限制性酶BamHI切开的3’SOCS-1臂在pBgalpAloxNeo中和3’SOCS1臂在pBgalpAloxNeoTK中。这导致下列载体的形成5’&3’SOCS1臂在pBgalpAloxNeo中和5’&3’SOCS1臂在pBgalpAloxNeoTK中由此得到SOCS1失效构建体。两个这样的构建体缺少全部SOCS1编码区域(SOCS1外显子)，用Bgal的部分、B球蛋白多聚腺苷酸、PGK启动子、新霉素和PGK多聚腺苷酸序列代替。5’&3’SOCS1臂在pBgalpAloxNeoTK载体中在新霉素和PGK多聚腺苷酸化序列之间也包含tymidine激酶基因。
载体5’&3’SOCS1臂在pBgalpAloxNeo和5’&3’SOCS1臂在pBgalpAloxNeoTK中，用单一限制性酶NotI切开，然后通过电穿孔转染入胚干细胞。选择对新霉素有抗性的克隆并通过Southern印迹分析以确定它们是否正确地包含了整合的SOCS1目的序列。为了确定正确整合是否已经出现，用限制性酶EcoRI消化新霉素抗性克隆中的基因组DNA。然后将消化的DNA印迹到尼龙膜上并用失效构建体所用的5’臂序列的5’端的1.5kb EcoRI/Hind III DNA片段探测。正确整合的预期大小是野生型SOCS-1等位基因的5.4kb5’&3’SOCS1臂在pBgalpAloxNeo中的SOCS-1失效等位基因的8.2kb或5&3’SOCS1臂在pBgalpAloxNeoTK中转化的细胞中的11kb。
本领域技术人员将理解此处所述的本发明容易在已具体描述的基础上变化和改进。应当理解本发明包括所有这样的变化和改进。本发明也分别或全体地包括此说明书中提及或表示的步骤、特征、组合物和化合物以及任意二个或多个所述步骤或特征的所有结合。表4.1来自小鼠SOCS-4cDNA的EST的总结SOCS物种 EST名称末端EST号文库来源重叠群SOCS-4 小鼠 mc65f045′ EST0549700 d13.5-14.5 m4.1小鼠胚mf42e065′ EST0593477 d13.5-14.5 m4.1小鼠胚mp10c105′ EST0747905 d8.5小鼠胚 m4.1mr81g095′ EST0783081 d13胚m4.1mt19h125′ EST0816531 脾 m4.1表4.2来自小鼠SOCS-4cDNA的EST的总结SOCS物种 EST名称末端EST号文库来源重叠群SOCS-4 人27b5 5′ EST0534081 视网膜 h4.230d2 5′ EST0534315 视网膜 h4.2J0159F 5′ EST0461188 胎儿心脏 h4.2J3802F 5′ EST0461428 胎儿心脏 h4.2EST19523 5′ EST0958884 视网膜 h4.2EST81149 5′ EST1011015 胎盘 h4.2EST180909 5′ EST0951375 Jurkat T h4.2淋巴细胞EST182619 5′ EST0953220 Jurkat T h4.1淋巴细胞ya99h093′ EST0103262 胎盘 h4.2ye70c045′ EST0172673 胎儿肝/脾h4.2yh53c095′ EST0197390 胎盘 h4.23′ EST0197391h4.2yh77g115′EST0203418 胎盘 h4.23′EST0203419 h4.1yh87h055′EST0204888 胎盘 h4.13′EST0204773 h4.1yi45h075′EST0246604 胎盘 h4.2yj04e065′EST0258541 胎盘 h4.13′EST0258285 h4.1yq12h065′EST0309968 胎儿肝/脾h4.2yq56a063′EST0346924 胎儿肝/脾h4.2yq60e025′EST0347259 胎儿肝/脾h4.23′EST0347209 h4.2yq92g035′EST0355932 胎儿肝/脾h4.23′EST0355884 h4.2yq97h065′EST0357618 胎儿肝/脾h4.23′EST0357416 h4.2yr90f015′EST0372402 胎儿肝/脾h4.2yt69c035′EST0338395 胎儿肝/脾h4.23′EST0338303 h4.2yv30a083′EST0458506 胎儿肝/脾h4.2yv55f075′EST0465391 胎儿肝/脾h4.23′EST0463331 h4.2yv57h095′EST0464336 胎儿肝/脾h4.23′EST0458765 h4.2yv87h025′EST0388085 黑素细胞 h4.2yv98e115′EST0400679 黑素细胞 h4.23′EST0400680 h4.2yw68d105′EST0441370 胎盘(8-9wk) h4.2yw82a035′EST0463005 胎盘(8-9wk) h4.2
3′EST0433678h4.1yx08a073′EST0407016黑素细胞h4.1yx72h065′EST0435158黑素细胞h4.23′EST0422871黑素细胞h4.1yx76b095′EST0434011黑素细胞h4.2yy37h085′EST0451704黑素细胞h4.2yy66b025′EST0505446多发性硬化损伤 h4.2za81f085′EST0511777胎儿肺 h4.2zb18f073′EST0485315胎儿肺 h4.1zc06e085′EST0540473甲状旁腺癌 h4.13′EST0540354h4.1zd14g063′EST0564666胎儿心脏h4.1zd51h123′EST0578099胎儿心脏h4.1zd52b095′EST0582012胎儿心脏h4.13′EST0581958h4.1ze25g113′EST0679543胎儿心脏h4.1ze69f025′EST0635563视网膜 h4.23′EST0635472h4.1zf54f035′EST0680111视网膜 h4.2zh96e075′EST0616241胎儿肝/脾 h4.23′EST0615745h4.2zv66h125′EST10432658-9w胎儿h4.2zs83a085′EST0920072生发中心B h4.1细胞3′EST0920016h4.1zs83g085′EST0920121生发中心B h4.1细胞3′EST0920122h4.1表5.1来自小鼠SOCS-5cDNA的EST的总结SOCS物种 EST名称末端 EST号文库来源重叠群SOCS-5 小鼠 mc55a015′ EST0541556 d13.5-14.5 m5.1小鼠胚mh98f095′ EST0638237 胎盘 m5.1my26h125′ EST0859939 混合的器官 m5.1ve24e065′ EST0819106 心 m5.1表5.2来自小鼠SOCS-5 cDNA的EST的总结SOCS物种 EST名称末端 EST号文库来源重叠群SOCS-5 人 EST15B103 ？EST0258029 脂肪组织 h5.1EST15B105 ？EST0258028 脂肪组织 h5.1EST27530 5′ EST0965892 小脑 h5.1zf50f015′ EST0679820 视网膜h5.1表6.1来自小鼠SOCS-6 cDNA的EST的总结SOCS物种 EST名称末端 EST号文库来源重叠群SOCS-6 小鼠 mco4c055′ EST0525832 d19.5胚 m6.1md48a035′ EST0566730 d13.5-14.5胚 m6.1mf31d035′ EST0675970 d13.5-14.5胚 m6.1mh26b075′ EST0628752 d13.5-14.5胎盘m6.1mh78e115′ EST0637608 d13.5-14.5胎盘m6.1mh88h095′ EST0644383 d13.5-14.5胎盘m6.1mh94h075′ EST0638078d13.5-14.5胎盘m6.1mi27h045′ EST0644252d13.5-14.5胚 m6.1mj29c055′ EST0664093d13.5-14.5胚 m6.1mp66g045′ EST0757905胸腺 m6.1mw75g035′ EST0847938肝m6.1va53b055′ EST0901540d12.5胚 m6.1vb34h025′ EST0930132淋巴节m6.1vc55d073′ EST10577352细胞胚 m6.1vc59e053′ EST10582012细胞胚 m6.1vc67d033′ EST10578492细胞胚 m6.1vc68d103′ EST10586632细胞胚 m6.1vc97h013′ EST10593432细胞胚 m6.1vc99c083′ EST10594102细胞胚 m6.1vd07h033′ EST10581732细胞胚 m6.1vd08c013′ EST10582752细胞胚 m6.1vd09b123′ EST10586322细胞胚 m6.1vd19b023′ EST10597232细胞胚 m6.1vd29a043′ ？未发现m6.1vd46d063′ ？未发现m6.1表6.2来自人SOCS-5cDNA的EST的总结SOCS物种 EST名称末端EST号文库来源 ContigSOCS-6 Humanyf61e08 5′EST0184387 d73 婴儿脑 h6.1yf93a09 5′EST0186084 d73 婴儿脑 h6.1yg05f12 5′EST0191486 d73 infant bra h6.1yg41f04 5′EST0195017 d73 婴儿脑 h6.1yg45c02 5 EST0185308 d73 婴儿脑 h6.1yh11f10 5′EST0236705 d73 婴儿脑 h6.1yh13b05 5′EST0237191 d73 婴儿脑 h6.13′EST0236958 h6.2zc35a12 5′EST0555518 衰老成纤维细胞 h6.1ze02h08 5′EST0603826 胎儿心脏 h6.13′EST0603718 h6.2zl09a03 5′EST0773936 怀孕子宫 h6.13′EST0773892 h6.1zl69e10 5′EST0683363 结肠 h6.1zn39d08 5′EST0718885 内皮细胞 h6.1zo39e06 5′EST0785947 内皮细胞 h6.1表7.1来自小鼠SOCS-7cDNA的EST的总结SOCS物种 EST名称末端 EST号文库来源重叠群SOCS-7 小鼠 mj39a01 5′EST0665627 d13.5/14.5胚 m7.1vi52h07 5′EST1267404 d7.5胚 m7.1表7.2来自人SOCS-5cDNA的EST的总结SOCS物种 EST名称末端EST号文库来源重叠群SOCS-7 人 STS WI-30171 (G21563) 染色体 h7.2EST00939 5′ EST0000906 海马h7.1EST12913 3′ EST0944382 子宫h7.2yc29b053′ EST0128727 肝 h7.2yp49f103′ EST0301914 视网膜 h7.2zt10f035′ EST0922932 生发中心B h7.2细胞3′ EST0921231 h7.1zx73g043′ EST1102975 卵巢癌 h7.1表8.1来自小鼠SOCS-8cDNA的EST的总结SOCS物种 EST名称末端EST号文库来源重叠群SOCS-8 小鼠 mj16e09r1 EST0666240 d13.5/14.5胚m8.1vj27a029 r1 EST1155973 心脏m8.1表9.1来自小鼠 SOCS-9cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群小鼠 me65d05 5′EST0585211 d13.5/14.5胚m9.1表9.2来自人 SOCS-5cDNA的EST的总结SOCS物种 EST名称末端 EST号文库来源重叠群SOCS-9 人CSRL-83f2-u (B06659) 染色体11 h9.1EST114054 5′ EST0939759胎盘 h9.1
yy06b073′ EST0434504黑素细胞 h9.1yy06g065′ EST0443783黑素细胞 h9.1zr40c095′ EST0832461黑素细胞，h9.1心脏，子宫zr72h015′ EST0892025黑素细胞，h9.1心脏，子宫3′ EST0892026 h9.1yx92c085′ EST0441160黑素细胞 h9.1yx93b085′ EST0441260黑素细胞 h9.1hfe06625′ EST0889611胎儿心脏 h9.1表10.1来自小鼠SOCS-10cDNA的EST的总结SOCS 物种 EST名称末端EST号文库来源重叠群小鼠 mb14d125′ EST0549887d19.5胚 m10.1mb40f065′ EST0515064d19.5胚 m10.1mg89b115′ EST0630631d13.5-14.5胚 m10.1mq89e125′ EST0776015心m10.1mp03g125′ EST0741991心m10.1vh53c115′ EST1154634乳腺 m10.1表10.2来自人SOCS-5cDNA的EST的总结SOCS 物种 EST名称末端EST号文库来源重叠群SOCS-10 人 aa48h103′ EST1135220生发中心B细胞 h10.2zp35h013′ EST0819137肌肉 h10.2zp97h125′ EST0835442肌肉 h10.2
3′ EST0831211 h10.2zq08h015′ EST0835907 肌肉 h10.1zr34g055′ EST0834251 黑素细胞， h10.2心脏，子宫3′ EST0834440 h10.2EST73000 5′ EST1004491 卵巢 h10.2HSDHEI005 ？EST0013906 心脏 h10.2表11.1来自人SOCS-5cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-11 人 zt24h06 r1 EST0925023 卵巢癌 11.1zr43b02 r1 EST0873006 黑素细胞， 11.1s1 EST0872954 心脏，子宫 11.1表12.1来自小鼠SOCS-12cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-12 小鼠 EST03803 5′EST1054173 第7.5天， m12.1胚绒膜锥mt18f025′EST0817652 3NbMS 脾 m12.1mz60g105′EST0890872 淋巴节 m12.1va05c115′EST0909449 淋巴节 m12.1表12.2来自人SOCS-5cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-12 人STS-SHGC-13867染色体h12.2EST177695 5′ EST0948071 细胞 h12.1EST645505′ EST0997367 细胞 h12.1EST768685′ EST1007291 松果体 h12.2PMY2369 5′ EST1115998 KG-1 h12.1yb38f04 5′ EST0108807 胎儿脾 h12.13′ h12.2yg74e12 5′ EST0224407 d73脑h12.1yh13g04 5′ EST0237226 d73脑h12.13′ EST0236992 h12.2yh48b06 5′ yh48b06 胎盘 h12.2yh53a05 5′ EST0197282 胎盘 h12.23′ EST0197486 h12.2yn48h09 5′ EST0278258 脑 h12.23′ EST0278259 h12.2yn90a09 3′ EST0302557 脑 h12.2yo08f03 5′ EST0301790 脑 h12.23′ EST0302059 h12.2yo11e01 3′ 未发现 h12.2yo63b12 5′ EST0303606 乳房 h12.23′ EST0304085 h12.2yq56g02 3′ EST0346935 胎儿肝/脾h12.1zh57c04 3′ EST0594201 胎儿肝/脾h12.2zh79h01 3′ EST0598945 胎儿肝/脾h12.2zh99a11 3′ EST0618570 胎儿肝/脾h12.2zo92h12 5′ EST0803392 卵巢癌 h12.13′ EST0803393 h12.2zs48c01 5′ EST0925714 生发中心 h12.1B-细胞3′ EST0925530 h12.2zs45h023′ EST0932296生发中心h12.2B细胞表3.1来自小鼠 SOCS-13cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-13 小鼠 ma39c09 5′ EST0517875 第19.5天，胚 m13.1me60c05 5′ EST0584950 第13.5/14.5天，胚 m13.1mi78g05 5′ EST0653834 第19.5天，胚 m13.1mk10c11 5′ EST0735158 第9.5天，胚m13.1mo48g12 5′ EST0745111 第10.5天，胚 m13.1mp94a01 5′ EST0762827 胸腺 m13.1vb57c07 5′ EST1028976 第11.5天，胚 m13.1vh07c11 5′ EST1117269 乳腺 m13.1表13.2来自人SOCS-13cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-13 人EST59161 5′ EST0992726 婴儿脑 h13.1表14.1来自小鼠SOCS-14cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-14 小鼠 mi75e035′EST0651892 d19.5胚m14.1vd29h115′EST1067080 2细胞胚m14.1v d53g075′ EST1119627 2细胞胚m14.1表15.1来自小鼠 SOCS-15cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-15 小鼠 mh29b05 5′ EST0628834 胎盘 m15.1mh98h09 5′ EST0638243 胎盘 m15.1ml45a02 5′ EST0687171 睾丸 m15.1mu43a10 5′ EST851588 胸腺 m15.1my38c09 5′ EST878461 合并的器官 m15.1vj37h07 5′ EST1174791 隔膜 m15.1AC002393染色体6m15.1BAC表15.2来自人SOCS-15cDNA的EST的总结SOCS 物种 EST名称末端 EST号文库来源重叠群SOCS-15 人EST98889 5′ EST1026568 甲状腺h15.1ne48bo5 3′ EST1138057 结肠癌h15.1yb12h12 5′ EST0098885 胎盘 h15.13′ EST0098886h15.1HSU47924染色体12 h15.1BAC参考文献Alexander WS，Metcalf D和Dunn AR(1995).Embo Journal 14，5569-78.Altschul，S.F.Gish，W.Miller，W.Myers，E.W.& Lipman，D.J.(1990)分子生物学杂志，215，403-10.Ansari-Lari，M.A.，Shen，Y.，Munzy，D.M.，Lee，W.和Gibbs，R.A.(1997)基因组研究，7，268-280.Bazan JF(1990).[Review].Immunology Today 11，350-4.Bork，P.(1993)ProteinsStruct.Funct.Genet.17，363-374.Cockwell，L.Y.和Giles，I.G.(1989)Comp.Appl.Biosci.5，227-232.Cutler RL，Liu L，Damen JE和Krystal G(1993).生物化学杂志，268，21463-5.Darnell J Jr.，Kerr IM和Stark GR(1994).科学，264，1415-21.David M，Petricoin E3，Benjamin C，Pine R，Weber MJ和Larner AC(1995)，科学，269，1721-3.David M，Wong L，Flavell R，Thompson SA，Wells A，Larner AC和Johnson GR(1996).生物化学杂志，271，9185-8.Dugaiczyk A，Haron JA，Stone EM，Dennison OE，Rothblum KN和Schwartz RJ(1983).生物化学，22，1605-13.Durbin JE，Hackenmiller R.Simon MC和Levy DE(1996).细胞，84，443-50.Etzold，T.，Ulyanov，A.和Argos，P.(1996)酶学方法，266，114-28.Gearing DP，Nicola NA，Metcalf D，Foote S，Willson TA，Gough NM和Williams L(1989).生物技术，1157-1161.Gupta S，Yan H，Wong LH，Ralph S，Krolewski J和Schindler C(1996).Embo Journal 15，1075-84.Hilton DJ(1994).细胞因子受体介绍，《细胞因子及其受体指南》第8-16页，N.A.Nicola(编辑)，Oxford大学出版社，Oxford.Hilton DJ，Hilton AA，Raicevic A，Rakar S，Harrison-Smith M，Gough NM，Begley CG，Metcalf D，Nicola NA和Willson TA(1994).Embo Journal 13，4765-75.Hilton DJ，Watowich SS，Katz L和Lodish HF(1996).生物化学杂志271，4699-4708.Ichikawa Y(1969).细胞生理学杂志，74，223-34.Ihle JN(1995).自然，377，591-4.Ihle JN，Witthuhn BA，Quelle FW，Yamamoto K和Silvennoinen O(1995).免疫学年鉴，13，369-98.Kaplan MH，Schindler U，Smiley ST和Grusby MJ(1996a).Immunity 4，313-9.Kaplan MH，Sun YL，Hoey T和Grusby MJ(1996b).自然，382，174-179.Levy DE和Stark GR(1996).Molecular & Cellular Biology 16，369-75.Metcalf D，Wilson TA，Hilton DJ，DiRago L和Mifsud S.(1995)Leukaemia 9，1556-1564.Meraz MA，White JM，Sheehan KC，Bach EA，Rodig SJ，Dighe AS，Kaplan DH，Riley JK，Greenlund AC，Campbell D，Carver-Moore K，DuBois RN，Clark R，Aguet M和SchreiberRD(1996)细胞84，431-42.Mizushima S和Nagata S(1990).核酸研究，18，5322.Murakami M，Narazaki M，Hibi M，Yawata H，Yasukawa K，Hamaguchi M，Taga T和Kishimoto T(1991)美国国家科学院院报.88，11349-11353.Neer，E.J.，Schmidt，C.J.，Nambudripad，R.和Smith，T.F.(1994)自然，371，297-300.Nicola NA((1994).细胞因子及其受体指南，Oxford大学出版社Oxford.Nicola，NV，Viney E，Hilton DJ，Roberts B和Wilson T.(1996)生长因子，13，141-149.Novak U，Harpur AG，Paradiso L，Kanagasundaram V，Jaworowski A，Wilks AF和Hamilton JA(1995).血液，86，2948-56.Pearson WR和Lipman DJ.(1988)美国国家科学院院报85，2444-8.Pearson WR.(1990)酶学方法，183，63-98.Rayner JR和Gonda TJ(1994).Molecular & Cellular Biology 14，880-7.Sambrook J，Fritsch EF和Maniatis T(1989).分子克隆实验手册，冷泉港实验室出版社，冷泉港，美国。Sato N，Sakamaki K，Terada N，Arai K和Miyajima A(1993).Embo Journal 12，4181-9.Shimoda K，van Deursen J，Sangster MY，Sarawar SR，Carson RT，Tripp RA，Chu C，QuelleFW，Nosaka T，Vignali DA，Doherty PC，Grosveld G，Paul WE和Ihle JN(1996).自然，380，630-3.Shual K，Ziemiecki A，Wilks AF，Harpur AG，Sadowski HB，Gilman MZ和Darnell JE(1993).自然，366，580-3.Sprang SR和Bazan JF(1993).Curr.Opin.Structural Biol.3，815-827.Takeda K，Tanaka T，Shi W，Matsumoto M，Minami M，Kashiwamura S，Nakanishi K，Yoshida N，Kishimoto T和Akira S(1996).自然，380，627-30.Thierfelder WE，Vandeursen JM，Yamamoto K，Tripp RA，Sarawar SR，Carson RT，SangsterMY，Vignali DDA，Doherty PC，Grosveld GC和Ihle JN(1996).自然，382，171-174.Wakao H，Gouilleux F和Groner B(1994).Embo Journal 13，2182-91.Wen Z，Zhong Z和Darnell J Jr.(1995)细胞82，241-50.Yi T，Mui AL，Krystal G和Ihle JN(1993).分子细胞生物学，13，7577-86.Yoshimura A，Ohkubo T，Kiguchi T，Jenkins NA，Gilbert DJ，Copeland NG，Hara T和Miyajima A(1995).Embo Journal 14，2816-26.
序列表(1)基本信息(i)申请人(美国以外的地区)THE WALTER AND ELIZAHALL INSTITUTE OF MEDICAL RESEARCH(ii)发明名称治疗和诊断试剂(iii)序列数50(iv)联系地址(A)名称Davis collison Cave(B)街道1 Little Collins street(C)城市Melbourne(D)州名Victoria(E)国家澳大利亚(F)邮政编号300(v)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release #1.0，版本#1.25(vi)目前申请资料(A)申请号PCT国际申请(B)递交日1997年10月31日(vii)在先申请资料(A)申请号PO5117(B)递交日1997年2月14日(vii)在先申请资料(A)申请号PO3384(B)递交日1996年11月1日(viii)律师/代理人信息(A)名称Hughes DR，E John L(C)参考/著录号ELH/EK(ix)电信信息(A)电话+61 3 9254 2777(B)传真+61 3 9254 2770(2)关于SEQ ID NO1的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO1CACGCCGCCC ACGTGAAGGC 20(2)关于SEQ ID NO2的信息(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO2TTCGCCAATG ACAAGACGCT20(2)关于SEQ ID NO3的信息(i)序列特征(A)长度1236个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置1..636(xi)序列描述 SEQ ID NO3CGAGGCTCAA GCTCCGGGCG GATTCTGCGT GCCGCTCTCG CTCCTTGGGG TCTGTTGGCC -101GGCCTGTGCC ACCCGGACGC CCGGCTCACT GCCTCTGTCT CCCCCATCAG CGCAGCCCCG -41GACGCTATGG CCCACCCCTC CAGCTGGCCC CTCGAGTAGG -1ATG GTA GCA CGC AAC CAG GTG GCA GCC GAC AAT GCG ATC TCC CCG GCA 48Met Val Ala Arg Asn Gln Val Ala Ala Asp Asn Ala Ile Ser Pro Ala1 5 10 15GCA GAG CCC CGA CGG CGG TCA GAG CCC TCC TCG TCC TCG TCT TCG TCC 96Ala Glu Pro Arg Arg Arg Ser Glu Pro Ser Ser Ser Ser Ser Ser Ser20 25 30TCG CCA GCG GCC CCC GTG CGT CCC CGG CCC TGC CCG GCG GTC CCA GCC 144Ser Pro Ala Ala Pro Val Arg Pro Arg Pro Cys Pro Ala Val Pro Ala35 40 45CCA GCC CCT GGC GAC ACT CAC TTC CGC ACC TTC CGC TCC CAC TCC GAT 192Pro Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ser Asp50 55 60TAC CGG CGC ATC ACG CGG ACC AGC GCG CTC CTG GAC GCC TGC GGC TTC 240Tyr Arg Arg Ile Thr Arg Thr Ser Ala Leu Leu Asp Ala Cys Gly Phe65 70 75 80TAT TGG GGA CCC CTG AGC GTG CAC GGG GCG CAC GAG CGG CTG CGT GCC 288Tyr Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ala85 90 95GAG CCC GTG GGC ACC TTC TTG GTG CGC GAC AGT CGT CAA CGG AAC TGC 336Glu Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys100 105 110TTC TTC GCG CTC AGC GTG AAG ATG GCT TCG GGC CCC ACG AGC ATC CGC 384Phe Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg115 120 125GTG CAC TTC CAG GCC GGC CGC TTC CAC TTG GAC GGC AGC CGC GAG ACC 432Val His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Ser Arg Glu Thr130 135 140TTC GAC TGC CTT TTC GAG CTG CTG GAG CAC TAC GTG GCG GCG CCG CGC 480Phe Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg145 150 155 160CGC ATG TTG GGG GCC CCG CTG CGC CAG CGC CGC GTG CGG CCG CTG CAG 528Arg Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln165 170 175GAG CTG TGT CGC CAG CGC ATC GTG GCC GCC GTG GGT CGC GAG AAC CTG 576Glu Leu Cys Arg Gln Arg Ile Val Ala Ala Val Gly Arg Glu Asn Leu180 185 190GCG CGC ATC CCT CTT AAC CCG GTA CTC CGT GAC TAC CTG AGT TCC TTC 624Ala Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe195 200 205CCC TTC CAG ATC TGA CCGGCTG CCGCTGTGCC GCAGCATTAA GTGGGGGCGC676Pro Phe Gln Ile *210CTTATTATTT CTTATTATTA ATTATTATTA TTTTTCTGGA ACCACGTGGG AGCCCTCCCC 736GCCTGGGTCG GAGGGAGTGG TTGTGGAGGG TGAGATGCCT CCCACTTCTG GCTGGAGACC 796TCATCCCACC TCTCAGGGGT GGGGGTGCTC CCCTCCTGGT GCTCCCTCCG GGTCCCCCCT 856GGTTGTAGCA GCTTGTGTCT GGGGCCAGGA CCTGAATTCC ACTCCTACCT CTCCATGTTT 916ACATATTCCC AGTATCTTTG CACAAACCAG GGGTCGGGGA GGGTCTCTGG CTTCATTTTT 976CTGCTGTGCA GAATATCCTA TTTTATATTT TTACAGCCAG TTTAGGTAAT AAACTTTATT 1036ATGAAAGTTT TTTTTTAAAA GAAAAAAAAA AAAAAAAAA 1075(2)关于SEQ ID NO4的信息(i)序列特征(A)长度212个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Val Ala Arg Asn Gln Val Ala Ala Asp Asn Ala Ile Ser Pro Ala1 5 10 15Ala Glu Pro Arg Arg Arg Ser Glu Pro Ser Ser Ser Ser Ser Ser Ser20 25 30Ser Pro Ala Ala Pro Val Arg Pro Arg Pro Cys Pro Ala Val Pro Ala35 40 45Pro Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ser Asp50 55 60Tyr Arg Arg Ile Thr Arg Thr Ser Ala Leu Leu Asp Ala Cys Gly Phe65 70 75 80Tyr Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ala85 90 95Glu Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys100 105 110Phe Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg115 120 125Val His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Ser Arg Glu Thr130 135 140Phe Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg145 150 155 160Arg Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln165 170 175Glu Leu Cys Arg Gln Arg Ile Val Ala Ala Val Gly Arg Glu Asn Leu180 185 190Ala Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe195 200 205Pro Phe Gln Ile210(2)关于SEQ ID NO5的信息(i)序列特征(A)长度1121个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置223..819(xi)序列描述SEQ ID NO5GCGATCTGTG GGTGACAGTG TCTGCGAGAG ACTTTGCCAC ACCATTCTGC CGGAATTTGG60AGAAAAAGAA CCAGCCGCTT CCAGTCCCCT CCCCCTCCGC CACCATTTCG GACACCCTGC 120ACACTCTCGT TTTGGGGTAC CCTGTGACTT CCAGGCAGCA CGCGAGGTCC ACTGGCCCCA 180GCTCGGGCGA CCAGCTGTCT GGGACGTGTT GACTCATCTC CC ATG ACC CTG CGG 234Met Thr Leu Arg1TGC CTG GAG CCC TCC GGG AAT GGA GCG GAC AGG ACG CGG AGC CAG TGG 282Cys Leu Glu Pro Ser Gly Asn Gly Ala Asp Arg Thr Arg Ser Gln Trp5 10 15 20GGG ACC GCG GGG TTG CCG GAG GAA CAG TCC CCC GAG GCG GCG CGT CTG 330Gly Thr Ala Gly Leu Pro Glu Glu Gln Ser Pro Glu Ala Ala Arg Leu25 30 35GCG AAA GCC CTG CGC GAG CTC AGT CAA ACA GGA TGG TAC TGG GGA AGT 378Ala Lys Ala Leu Arg Glu Leu Ser Gln Thr Gly Trp Tyr Trp Gly Ser40 45 50ATG ACT GTT AAT GAA GCC AAA GAG AAA TTA AAA GAG GCT CCA GAA GGA 426Met Thr Val Asn Glu Ala Lys Glu Lys Leu Lys Glu Ala Pro Glu Gly55 60 65ACT TTC TTG ATT AGA GAT AGT TCG CAT TCA GAC TAC CTA CTA ACT ATA 474Thr Phe Leu Ile Arg Asp Ser Ser His Ser Asp Tyr Leu Leu Thr Ile70 75 80TCC GTT AAG ACG TCA GCT GGA CCG ACT AAC CTG CGG ATT GAG TAC CAA 522Ser Val Lys Thr Ser Ala Gly Pro Thr Asn Leu Arg Ile Glu Tyr Gln85 90 95 100GAT GGG AAA TTC AGA TTG GAT TCT ATC ATA TGT GTC AAG TCC AAG CTT 570Asp Gly Lys Phe Arg Leu Asp Ser Ile Ile Cys Val Lys Ser Lys Leu105 110 115AAA CAG TTT GAC AGT GTG GTT CAT CTG ATT GAC TAC TAT GTC CAG ATG 618Lys Gln Phe Asp Ser Val Val His Leu Ile Asp Tyr Tyr Val Gln Met120 125 130TGC AAG GAT AAA CGG ACA GGC CCA GAA GCC CCA CGG AAT GGG ACT GTT 666Cys Lys Asp Lys Arg Thr Gly Pro Glu Ala Pro Arg Asn Gly Thr Val135 140 145CAC CTG TAC CTG ACC AAA CCT CTG TAT ACA TCA GCA CCC ACT CTG CAG 714His Leu Tyr Leu Thr Lys Pro Leu Tyr Thr Ser Ala Pro Thr Leu Gln150 155 160CAT TTC TGT CGA CTC GCC ATT AAC AAA TGT ACC GGT ACG ATC TGG GGA 762His Phe Cys Arg Leu Ala Ile Asn Lys Cys Thr Gly Thr Ile Trp Gly165 170 175 180CTG CCT TTA CCA ACA AGA CTA AAA GAT TAC TTG GAA GAA TAT AAA TTC 810Leu Pro Leu Pro Thr Arg Leu Lys Asp Tyr Leu Glu Glu Tyr Lys Phe185 190 195CAG GTA TAAGTATTTC TCTCTCTTTT TCGTTTTTTT TTAAAAAAAA AAAAACACAT 866Gln ValGCCTCATATA GACTATCTCC GAATGCAGCT ATGTGAAAGA GAACCCAGAG GCCCTCCTCT926GGATAACTGC GCAGAATTCT CTCTTAAGGA CAGTTGGGCT CAGTCTAACT TAAAGGTGTG986AAGATGTAGC TAGGTATTTT AAAGTTCCCC TTAGGTAGTT TTAGCTGAAT GATGCTTTCT 1046TTCCTATGGC TGCTCAAGAT CAAATGGCCC TTTTAAATGA AACAAAACAA AACAAAACAA 1106AAAAAAAAAA AAAAA1121(2)关于SEQ ID NO6的信息(A)长度198个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO6Met Thr Leu Arg Cys Leu Glu Pro Ser Gly Asn Gly Ala Asp Arg Thr1 5 10 15Arg Ser Gln Trp Gly Thr Ala Gly Leu Pro Glu Glu Gln Ser Pro Glu20 25 30Ala Ala Arg Leu Ala Lys Ala Leu Arg Glu Leu Ser Gln Thr Gly Trp35 40 45Tyr Trp Gly Ser Met Thr Val Asn Glu Ala Lys Glu Lys Leu Lys Glu50 55 60Ala Pro Glu Gly Thr Phe Leu Ile Arg Asp Ser Ser His Ser Asp Tyr65 70 75 80Leu Leu Thr Ile Ser Val Lys Thr Ser Ala Gly Pro Thr Asn Leu Arg85 90 95Ile Glu Tyr Gln Asp Gly Lys Phe Arg Leu Asp Ser Ile Ile Cys Val100 105 110Lys Ser Lys Leu Lys Gln Phe Asp Ser Val Val His Leu Ile Asp Tyr115 120 125Tyr Val Gln Met Cys Lys Asp Lys Arg Thr Gly Pro Glu Ala Pro Arg130 135 140Asn Gly Thr Val His Leu Tyr Leu Thr Lys Pro Leu Tyr Thr Ser Ala145 150 155 160Pro Thr Leu Gln His Phe Cys Arg Leu Ala Ile Asn Lys Cys Thr Gly165 170 175Thr Ile Trp Gly Leu Pro Leu Pro Thr Arg Leu Lys Asp Tyr Leu Glu180 185 190Glu Tyr Lys Phe Gln Val195(2)关于SEQ ID NO7的信息(i)序列特征(A)长度2187个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置18..695(xi)序列描述SEQ ID NO7CGCTGGCTCC GTGCGCC ATG GTC ACC CAC AGC AAG TTT CCC GCC GCC GGG 50Met Val Thr His Ser Lys Phe Pro Ala Ala Gly1 5 10ATG AGC CGC CCC CTG GAC ACC AGC CTG CGC CTC AAG ACC TTC AGC TCC98Met Ser Arg Pro Leu Asp Thr Ser Leu Arg Leu Lys Thr Phe Ser Ser15 20 25AAA AGC GAG TAC CAG CTG GTG GTG AAC GCC GTG CGC AAG CTG CAG GAG 146Lys Ser Glu Tyr Gln Leu Val Val Asn Ala Val Arg Lys Leu Gln Glu30 35 40AGC GGA TTC TAC TGG AGC GCC GTG ACC GGC GGC GAG GCG AAC CTG CTG 194Ser Gly Phe Tyr Trp Ser Ala Val Thr Gly Gly Glu Ala Asn Leu Leu45 50 55CTC AGC GCC GAG CCC GCG GGC ACC TTT CTT ATC CGC GAC AGC TCG GAC 242Leu Ser Ala Glu Pro Ala Gly Thr Phe Leu Ile Arg Asp Ser Ser Asp60 65 70 75CAG CGC CAC TTC TTC ACG TTG AGC GTC AAG ACC CAG TCG GGG ACC AAG 290Gln Arg His Phe Phe Thr Leu Ser Val Lys Thr Gln Ser Gly Thr Lys80 85 90AAC CTA CGC ATC CAG TGT GAG GGG GGC AGC TTT TCG CTG CAG AGT GAC 338Asn Leu Arg Ile Gln Cys Glu Gly Gly Ser Phe Ser Leu Gln Ser Asp95 100 105CCC CGA AGC ACG CAG CCA GTT CCC CGC TTC GAC TGT GTA CTC AAG CTG 386Pro Arg Ser Thr Gln Pro Val Pro Arg Phe Asp Cys Val Leu Lys Leu110 115 120GTG CAC CAC TAC ATG CCG CCT CCA GGG ACC CCC TCC TTT TCT TTG CCA 434Val His His Tyr Met Pro Pro Pro Gly Thr Pro Ser Phe Ser Leu Pro125 130 135CCC ACG GAA CCC TCG TCC GAA GTT CCG GAG CAG CCA CCT GCC CAG GCA 482Pro Thr Glu Pro Ser Ser Glu Val Pro Glu Gln Pro Pro Ala Gln Ala140 145 150 155CTC CCC GGG AGT ACC CCC AAG AGA GCT TAC TAC ATC TAT TCT GGG GGC 530Leu Pro Gly Ser Thr Pro Lys Arg Ala Tyr Tyr Ile Tyr Ser Gly Gly160 165 170GAG AAG ATT CCG CTG GTA CTG AGC CGA CCT CTC TCC TCC AAC GTG GCC 578Glu Lys Ile Pro Leu Val Leu Ser Arg Pro Leu Ser Ser Asn Val Ala175 180 185ACC CTC CAG CAT CTT TGT CGG AAG ACT GTC AAC GGC CAC CTG GAC TCC 626Thr Leu Gln His Leu Cys Arg Lys Thr Val Asn Gly His Leu Asp Ser190 195 200TAT GAG AAA GTG ACC CAG CTG CCT GGA CCC ATT CGG GAG TTC CTG GAT 674Tyr Glu Lys Val Thr Gln Leu Pro Gly Pro Ile Arg Glu Phe Leu Asp205 210 215CAG TAT GAT GCT CCA CTT TAAGGAGCAA AAGGGTCAGA GGGGGGCCTG722Gln Tyr Asp Ala Pro Leu220 225GGTCGGTCGG TCGCCTCTCC TCCGAGGCAC ATGGCACAAG CACAAAAATC CAGCCCCAAC 782GGTCGGTAGC TCCCAGTGAG CCAGGGGCAG ATTGGCTTCT TCCTCAGGCC CTCCACTCCC 842GCAGAGTAGA GCTGGCAGGA CCTGGAATTC GTCTGAGGGG AGGGGGAGCT GCCACCTGCT 902TTCCCCCCTC CCCCAGCTCC AGCTTCTTTC AAGTGGAGCC AGCCGGCCTG GCCTGGTGGG 962ACAATACCTT TGACAAGCGG ACTCTCCCCT CCCCTTCCTC CACACCCCCT CTGCTTCCCA 1022AGGGAGGTGG GGACACCTCC AAGTGTTGAA CTTAGAACTG CAAGGGGAAT CTTCAAACTT 1082TCCCGCTGGA ACTTGTTTGC GCTTTGATTT GGTTTGATCA AGAGCAGGCA CCTGGGGGAA 1142GGATGGAAGA GAAAAGGGTG TGTGAAGGGT TTTTATGCTG GCCAAAGAAA TAACCACTCC 1202CACTGCCCAA CCTAGGTGAG GAGTGGTGGC TCCTGGCTCT GGGGAGAGTG GCAAGGGGTG 1262ACCTGAAGAG AGCTATACTG GTGCCAGGCT CCTCTCCATG GGGCAGCTAA TGAAACCTCG 1322CAGATCCCTT GCACCCCAGA ACCCTCCCCG TTGTGAAGAG GCAGTAGCAT TTAGAAGGGA 1382GACAGATGAG GCTGGTGAGC TGGCCGCCTT TTCCAACACC GAAGGGAGGC AGATCAACAG 1442ATGAGCCATC TTGGAGCCCA GGTTTCCCCT GGAGCAGATG GAGGGTTCTG CTTTGTCTCT 1502CCTATGTGGG GCTAGGAGAC TCGCCTTAAA TGCCCTCTGT CCCAGGGATG GGGATTGGCA 1562CACAAGGAGC CAAACACAGC CAATAGGCAG AGAGTTGAGG GATTCACCCA GGTGGCTACA 1622GGCCAGGGGA AGTGGCTGCA GGGGAGAGAC CCAGTCACTC CAGGAGACTC CTGAGTTAAC 1682ACTGGGAAGA CATTGGCCAG TCCTAGTCAT CTCTCGGTCA GTAGGTCCGA GAGCTTCCAG 1742GCCCTGCACA GCCCTCCTTT CTCACCTGGG GGGAGGCAGG AGGTGATGGA GAAGCCTTCC 1802CATGCCGCTC ACAGGGGCCT CACGGGAATG CAGCAGCCAT GCAATTACCT GGAACTGGTC 1862CTGTGTTGGG GAGAAACAAG TTTTCTGAAG TCAGGTATGG GGCTGGGTGG GGCAGCTGTG 1922TGTTGGGGTG GCTTTTTTCT CTCTGTTTTG AATAATGTTT ACAATTTGCC TCAATCACTT 1982TTATAAAAAT CCACCTCCAG CCCGCCCCTC TCCCCACTCA GGCCTTCGAG GCTGTCTGAA 2042GATGCTTGAA AAACTCAACC AAATCCCAGT TCAACTCAGA CTTTGCACAT ATATTTATAT 2102TTATACTCAG AAAAGAAACA TTTCAGTAAT TTATAATAAA AGAGCACTAT TTTTTAATGA 2162AAAAAAAAAA AAAAAAAAAA AAAAA2187(2)关于SEQ ID NO8的信息(i)序列特征(A)长度225个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO8Met Val Thr His Ser Lys Phe Pro Ala Ala Gly Met Ser Arg Pro Leu1 5 10 15Asp Thr Ser Leu Arg Leu Lys Thr Phe Ser Ser Lys Ser Glu Tyr Gln20 25 30Leu Val Val Asn Ala Val Arg Lys Leu Gln Glu Ser Gly Phe Tyr Trp35 40 45Ser Ala Val Thr Gly Gly Glu Ala Asn Leu Leu Leu Ser Ala Glu Pro50 55 60Ala Gly Thr Phe Leu Ile Arg Asp Ser Ser Asp Gln Arg His Phe Phe65 70 75 80Thr Leu Ser Val Lys Thr Gln Ser Gly Thr Lys Asn Leu Arg Ile Gln85 90 95Cys Glu Gly Gly Ser Phe Ser Leu Gln Ser Asp Pro Arg Ser Thr Gln100 105 110Pro Val Pro Arg Phe Asp Cys Val Leu Lys Leu Val His His Tyr Met115 120 125Pro Pro Pro Gly Thr Pro Ser Phe Ser Leu Pro Pro Thr Glu Pro Ser130 135 140Ser Glu Val Pro Glu Gln Pro Pro Ala Gln Ala Leu Pro Gly Ser Thr145 150 155 160Pro Lys Arg Ala Tyr Tyr Ile Tyr Ser Gly Gly Glu Lys Ile Pro Leu165 170 175Val Leu Ser Arg Pro Leu Ser Ser Asn Val Ala Thr Leu Gln His Leu180 185 190Cys Arg Lys Thr Val Asn Gly His Leu Asp Ser Tyr Glu Lys Val Thr195 200 205Gln Leu Pro Gly Pro Ile Arg Glu Phe Leu Asp Gln Tyr Asp Ala Pro210 215 220Leu225(2)关于SEQ ID NO9的信息(i)序列特征(A)长度1094个碱基对(B)类型核酸(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO9CTCCGGCTGG CCCCTTCTGT AGGATGGTAG CACACAACCA GGTGGCAGCC GACAATGCAG 60TCTCCACAGC AGCAGAGCCC CGACGGCGGC CAGAACCTTC CTCCTCTTCC TCCTCCTCGC 120CCGCGGCCCC CGCGCGCCCG CGGCCGTGCC CCGCGGTCCC GGCCCCGGCC CCCGGCGACA 180CGCACTTCCG CACATTCCGT TCGCACGCCG ATTACCGGCG CATCACGCGC GCCAGCGCGC 240TCCTGGACGC CTGCGGATTC TACTGGGGGC CCCTGAGCGT GCACGGGGCG CACGAGCGGC 300TGCGCGCCGA GCCCGTGGGC ACCTTCCTGG TGCGCGACAG CCGCCAGCGG AACTGCTTTT 360TCGCCCTTAG CGTGAAGATG GCCTCGGGAC CCACGAGCAT CCGCGTGCAC TTTCAGGCCG 420GCCGCTTTCA CCTGGATGGC AGCCGCGAGA GCTTCGACTG CCTCTTCGAG CTGCTGGAGC 480ACTACGTGGC GGCGCCGCGC CGCATGCTGG GGGCCCCGCT GCGCCAGCGC CGCGTGCGGC 540CGCTGCAGGA GCTGTGCCGC CAGCGCATCG TGGCCACCGT GGGCCGCGAG AACCTGGCTC 600GCATCCCCCT CAACCCCGTC CTCCGCGACT ACCTGAGCTC CTTCCCCTTC CAGATTTGAC 660CGGCAGCGCC CGCCGTGCAC GCAGCATTAA CTGGGATGCC GTGTTATTTT GTTATTACTT 720GCCTGGAACC ATGTGGGTAC CCTCCCCGGC CTGGGTTGGA GGGAGCGGAT GGGTGTAGGG 780GCGAGGCGCC TCCCGCCCTC GGCTGGAGAC GAGGCCGCAG ACCCCTTCTC ACCTCTTGAG 840GGGGTCCTCC CCCTCCTGGT GCTCCCTCTG GGTCCCCCTG GTTGTTGTAG CAGCTTAACT 900GTATCTGGAG CCAGGACCTG AACTCGCACC TCCTACCTCT TCATGTTTAC ATATACCCAG 960TATCTTTGCA CAAACCAGGG GTTGGGGGAG GGTCTCTGGC TTTATTTTTC TGCTGTGCAG1020AATCCTATTT TATATTTTTT AAAGTCAGTT TAGGTAATAA ACTTTATTAT GAAAGTTTTT1080TTTTTTAAAA AAAA 1094(2)关于SEQ ID NO10的信息(i)序列特征(A)长度211个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO10Met Val Ala His Asn Gln Val Ala Ala Asp Asn Ala Val Ser Thr Ala1 5 10 15Ala Glu Pro Arg Arg Arg Pro Glu Pro Ser Ser Ser Ser Ser Ser Ser20 25 30Pro Ala Ala Pro Ala Arg Pro Arg Pro Cys Pro Ala Val Pro Ala Pro35 40 45Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ala Asp Tyr50 55 60Arg Arg Ile Thr Arg Ala Ser Ala Leu Leu Asp Ala Cys Gly Phe Tyr65 70 75 80Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ala Glu85 90 95Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys Phe100 105 110Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg Val115 120 125His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Ser Arg Glu Ser Phe130 135 140Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg Arg145 150 155 160Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln Glu165 170 175Leu Cys Arg Gln Arg Ile Val Ala Thr Val Gly Arg Glu Asn Leu Ala180 185 190Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe Pro195 200 205Phe Gln Ile210(2)关于SEQ ID NO11的信息(i)序列特征(A)长度2807个碱基对(B)类型核酸(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO11GGAAACCGAG GCGGGGAGAC CAGGAGGCCT TGGCCTCAGA GCTTCAGAGT CGCGTGGCAG60CAAACAGAGA AACCTGTAGA GGGCAGTGTG CGTCACTTAG CTCAGGGAAG CTGCACGCGA 120AACTCACCCG CCTTCATTCA TAAACATCGT CAGCTAGGCA CCTACTCCTG GGCTTTCAGG 180ACAAACTGAA TCACGAAACC ACAGTGTCCT TAAAATAGGT CTGACCGCCT GAATCCCTGG 240CCAAGGTGTG TACGGGGCAT GGGAGCCCTT GTGCAGAGAT GCTTGCAGGA GCCTTGAGGG 300GCTCTGTAAG ACAGAGGCTA GGAAGACAAA GTTGGGGGCT ACAGCTTCTT GTCCTGCCCG 360GGGCCTCAGT TTCTTCGGTT GCCCACGTAG GAGTGCAGAG AGTCCAGCCC CTGGGGACCC 420AACCCAACCC CGCCCAGTTT CCGAGGAACT CGTCCGGGAG CGGGGGCGCC CCTCCCGCAC 480CGCCTTAGGC TTCCTTTGAA GCCTCTGCGG TCAGGCCACC CCTTCCTGGG AAGCCCAAGC 540CAAGGCCAGG CCGAGTGGCC AACGGGAGGG GCCCGCGCGC GATTCTGGAG GAGGGCGGCG 600GCCCCACAGG TCTCCAGGGC TGGCTAGCCG GGCTCCTAGA GCGGAGACTG CCAAGGCCTT 660CGGGTCCTGG GGAGGAAGGA TCCTGGCAGG GAGGAGTTGC TTGGGGGGTG GGGGGGAAAG 720GCTCCAGGCG CGGTGGAGCT CTGACCAGGA GAATGCACAC ACTCGGAGGG GAGGAGGCGT 780GTCAGCCCCA AGCTAGCATC CCACCCGGGG AGCAGCGATG TGGGGCGAAG GTAGCCAGAG 840CAAAAGAGCA GGCACCAGGT GACACGAAAC AGAAGATTCC GGGTAGAGCC AGAACCCCAG 900AAGTCCCATT CAGGGAAGGT GCGAGGCGAG AACGAGTTAG GTGGACCCTC TCCAGGGGCA 960GCCAAAGAAA TCTAAAGAGA ACCCGAAGGA CTTGCCGGAA AGAGAAACCG AAAGCGGCGG 1020TGGGCGGGAT CGGTGGGCGG GGCCTCCCTG GTTTAAGAGC TTGATGCAGG GGCGGGCAGC 1080AGCAGAGAGA ACTGCGGCCG TGGCAGCGGC ACGGCTCCCG GCCCCGGAGC ATGCGCGACA 1140GCAGCCCCGG AACCCCCAGC CGCGGCGCCC CGCGTCCCGC CGCCAGGTGA GCCGAGGCAG 1200CTGCGAAGGA GCAGGCGGGA GGGGATGGGA GGAAGGGGAG CAGAGCCTGG CAGGACTATC 1260CTCGCAGACT GCATGGCGGG GTCGTGGATG CTATGCCTCT GGCGCCCGCC CCACCGGCTG 1320GCCCAGGCGG CCCCTCGCGC GCGCGGGGCG CCGTCAGCCC CTCCTCTCCG GCCCTGAGCC 1380CGGATCGTCC GCCCGGGTTC CAGTTCCCGG CGTGGCCAGT AGGCGGCAAC CGCGAGGCGG 1440CAAGCCACCC AGCGGGGACG GCCTGGAGTC GGGCCCCTCT CCACGCCCCC TTCTCCACGC 1500GCGCGGGGAG GCAGGGCTCC ACCGCCAGTC TGGAAGGGTT CCACATACAG GAACGGCCTA 1560CTTCGCAGAT GAGCCCACCG AGGCTCAGGC TCCGGGCGGA TTCTGCGTGT CACCCTCGCT 1620CCTTGGGGTC CGCTGGCCGG CCTGTGCCAC CCGGACGCCC GGTTCACTGC CTCTGTCTCC 1680CCCATCAGCG CAGCCCCGGA CGCTATGGCC CACCCCTCCA GCTGGCCCCT CGAGTAGGAT 1740GGTAGCACGT AACCAGGTGG AAGCCGACAA TGCGATCTCC CCGGCATCAG AGCCCCGACG 1800GCGGCCAGAG CCATCCTCGT CCTCGTCTTC GTCCTCGCCG GCGGCCCCGG CGCGTCCCCG 1860GCCCTGCCCG GTGGTCCCGG CCCCGGCTCC GGGCGACACT CACTTCCGCA CCTTCCGCTC 1920CCACTCTGAT TACCGGCGCA TCACGCGGAC CAGCGCTCTC CTGGACGCCT GCGGCTTCTA 1980CTGGGGACCC CTGAGCGTGC ATGGGGCGCA CGAACGGCTG CGTTCCGAAC CCGTGGGCAC 2040CTTCTTGGTG CGCGACAGTC GCCAGCGGAA CTGCTTCTTC GCGCTCAGCG TGAAGATGGC 2100TTCGGGCCCC ACGAGCATTC GTGTGCACTT CCAGGCCGGC CGCTTCCACC TGGACGGCAA 2160CCGCGAGACC TTCGACTGCC TCTTCGAGCT GCTGGAGCAC TACGTGGCGG CGCCGCGCCG 2220CATGTTGGGG GCCCCACTGC GCCAGCGCCG CGTGCGGCCG CTGCAGGAGC TGTGTCGCCA 2280GCGCATCGTG GCCGCCGTGG GTCGCGAGAA CCTGGCACGC ATCCCTCTTA ACCCGGTACT 2340CCGTGACTAC CTGAGTTCCT TCCCCTTCCA GATCTGACCG GCTGCCGCCG TGCCCGCAGA 2400ATTAAGTGGG AGCGCCTTAT TATTTCTTAT TATTAATTAT TATTATTTTT CTGGAACCAC 2460GTGGGAGCCC TCCCCGCCTA GGTCGGAGGG AGTGGGTGTG GAGGGTGAGA TCCCTCCCAC 2520TTCTGGCTGG AGACCTTATC CCGCCTCTCG GGGGGCCTCC CCTCCTGGTG CTCCCTCCCG 2580GTCCCCCTGG TTGTAGCAGC TTGTGTCTGG GGCCAGGACC TGAACTCCAC GCCTACCTCT 2640CCATGTTTAC ATGTTCCCAG TATCTTTGCA CAAACCAGGG GTGGGGGAGG GTCTCTGGCT 2700TCATTTTTCT GCTGTGCAGA ATATTCTATT TTATATTTTT ACATCCAGTT TAGATAATAA 2760ACTTTATTAT GAAAGTTTTT TTTTTTAAAG AAACAAAGAT TTCTAGA 2807(2)关于SEQ ID NO12的信息(i)序列特征(A)长度212个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO12Met Val Ala Arg Asn Gln Val Glu Ala Asp Asn Ala Ile Ser Pro Ala1 5 10 15Ser Glu Pro Arg Arg Arg Pro Glu Pro Ser Ser Ser Ser Ser Ser Ser20 25 30Ser Pro Ala Ala Pro Ala Arg Pro Arg Pro Cys Pro Val Val Pro Ala35 40 45Pro Ala Pro Gly Asp Thr His Phe Arg Thr Phe Arg Ser His Ser Asp50 55 60Tyr Arg Arg Ile Thr Arg Thr Ser Ala Leu Leu Asp Ala Cys Gly Phe65 70 75 80Tyr Trp Gly Pro Leu Ser Val His Gly Ala His Glu Arg Leu Arg Ser85 90 95Glu Pro Val Gly Thr Phe Leu Val Arg Asp Ser Arg Gln Arg Asn Cys100 105 110Phe Phe Ala Leu Ser Val Lys Met Ala Ser Gly Pro Thr Ser Ile Arg115 120 125Val His Phe Gln Ala Gly Arg Phe His Leu Asp Gly Asn Arg Glu Thr130 135 140Phe Asp Cys Leu Phe Glu Leu Leu Glu His Tyr Val Ala Ala Pro Arg145 150 155 160Arg Met Leu Gly Ala Pro Leu Arg Gln Arg Arg Val Arg Pro Leu Gln165 170 175Glu Leu Cys Arg Gln Arg Ile Val Ala Ala Val Gly Arg Glu Asn Leu180 185 190Ala Arg Ile Pro Leu Asn Pro Val Leu Arg Asp Tyr Leu Ser Ser Phe195 200 205Pro Phe Gln Ile210(2)关于SEQ ID NO13的信息(i)序列特征(A)长度1611个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置263..1529(xi)序列描述SEQ ID NO13CGAATTCCGG GCGGGCTGTG TGAGTCTGTG AGTGGAAGGC GCGCCGGCTC TTTTGTCTGA60GTGTGACCCG GTGGCTTTGT TCCAGGCATT CCGGTGATTT CCTCCGGGCA GTCCGCAGAA 120GCCGCAGCGG CCGCCCGCGC TCTCTCTGCA GTCTCCACAC CCGGGAGAGC CTGAGCCCGC 180GTCACGCCCC TCAGCCCCCG CTGAGTCCCT TCTCTGTTGT CGCGTCCGAA TCGAGTTCCC 240GGAATCAGAC GGTGCCCCAT AG ATG GCC AGC TTT CCC CCG AGG GTT AAC GAG292Met Ala Ser Phe Pro Pro Arg Val Asn Glu1 5 10AAA GAG ATC GTG AGA TCA CGT ACT ATA GGG GAA CTC TTG GCT CCA GCA 340Lys Glu Ile Val Arg Ser Arg Thr Ile Gly Glu Leu Leu Ala Pro Ala15 20 25GCT CCT TTT GAC AAG AAA TGT GGT GGT GAG AAC TGG ACG GTT GCT TTT 388Ala Pro Phe Asp Lys Lys Cys Gly Gly Glu Asn Trp Thr Val Ala Phe30 35 40GCT CCT GAT GGT TCC TAC TTT GCG TGG TCA CAA GGA TAT CGC ATA GTG 436Ala Pro Asp Gly Ser Tyr Phe Ala Trp Ser Gln Gly Tyr Arg Ile Val45 50 55AAG CTT GTC CCG TGG TCC CAG TGC CGT AAG AAC TTT CTT TTG CAT GGT 484Lys Leu Val Pro Trp Ser Gln Cys Arg Lys Asn Phe Leu Leu His Gly60 65 70TCC AAA AAT GTT ACC AAT TCA AGC TGT CTA AAA TTG GCA AGA CAA AAC 532Ser Lys Asn Val Thr Asn Ser Ser Cys Leu Lys Leu Ala Arg Gln Asn75 80 85 90AGT AAT GGT GGT CAG AAA AAC AAG CCT CCT GAG CAC GTT ATA GAC TGT 580Ser Asn Gly Gly Gln Lys Asn Lys Pro Pro Glu His Val Ile Asp Cys95 100 105GGA GAC ATA GTC TGG AGT CTT GCT TTT GGG TCT TCA GTT CCA GAA AAA 628Gly Asp Ile Val Trp Ser Leu Ala Phe Gly Ser Ser Val Pro Glu Lys110 115 120CAG AGT CGT TGC GTT AAT ATA GAA TGG CAT CGG TTC CGA TTT GGA CAG 676Gln Ser Arg Cys Val Asn Ile Glu Trp His Arg Phe Arg Phe Gly Gln125 130 135GAT CAG CTA CTC CTT GCC ACA GGA TTA AAC AAT GGT CGC ATC AAA ATC 724Asp Gln Leu Leu Leu Ala Thr Gly Leu Asn Asn Gly Arg Ile Lys Ile140 145 150TGG GAT GTA TAT ACA GGA AAA CTC CTC CTT AAT TTG GTA GAC CAC ATT 772Trp Asp Val Tyr Thr Gly Lys Leu Leu Leu Asn Leu Val Asp His Ile155 160 165 170GAA ATG GTT AGA GAT TTA ACT TTT GCT CCA GAT GGG AGC TTA CTC CTT 820Glu Met Val Arg Asp Leu Thr Phe Ala Pro Asp Gly Ser Leu Leu Leu175 180 185GTA TCA GCT TCA AGA GAC AAA ACT CTA AGA GTG TGG GAC CTG AAA GAT 868Val Ser Ala Ser Arg Asp Lys Thr Leu Arg Val Trp Asp Leu Lys Asp190 195 200GAT GGA AAC ATG GTG AAA GTA TTG CGG GCA CAT CAG AAT TGG GTG TAC 916Asp Gly Asn Met Val Lys Val Leu Arg Ala His Gln Asn Trp Val Tyr205 210 215AGT TGT GCA TTC TCT CCC GAC TGT TCT ATG CTG TGT TCA GTG GGC GCC 964Ser Cys Ala Phe Ser Pro Asp Cys Ser Met Leu Cys Ser Val Gly Ala220 225 230AGT AAA GCA GTT TTC CTT TGG AAT ATG GAT AAA TAC ACC ATG ATT AGG1012Ser Lys Ala Val Phe Leu Trp Asn Met Asp Lys Tyr Thr Met Ile Arg235 240 245 250AAG CTG GAA GGT CAT CAC CAT GAT GTT GTA GCT TGT GAC TTT TCT CCT1060Lys Leu Glu Gly His His His Asp Val Val Ala Cys Asp Phe Ser Pro255 260 265GAT GGA GCA TTG CTA GCT ACT GCA TCC TAT GAC ACT CGT GTG TAT GTC1108Asp Gly Ala Leu Leu Ala Thr Ala Ser Tyr Asp Thr Arg Val Tyr Val270 275 280TGG GAT CCA CAC AAT GGA GAC CTT CTG ATG GAG TTT GGG CAC CTG TTT1156Trp Asp Pro His Asn Gly Asp Leu Leu Met Glu Phe Gly His Leu Phe285 290 295CCC TCG CCC ACT CCA ATA TTT GCT GGA GGA GCA AAT GAC CGA TGG GTG1204Pro Ser Pro Thr Pro Ile Phe Ala Gly Gly Ala Asn Asp Arg Trp Val300 305 310AGA GCT GTG TCT TTC AGT CAT GAT GGA CTG CAT GTT GCC AGC CTT GCT1252Arg Ala Val Ser Phe Ser His Asp Gly Leu His Val Ala Ser Leu Ala315 320 325 330GAT GAT AAA ATG GTG AGG TTC TGG AGA ATC GAT GAG GAT TGT CCG GTA1300Asp Asp Lys Met Val Arg Phe Trp Arg Ile Asp Glu Asp Cys Pro Val335 340 345CAA GTT GCA CCT TTG AGC AAT GGT CTT TGC TGT GCC TTT TCT ACT GAT1348Gln Val Ala Pro Leu Ser Asn Gly Leu Cys Cys Ala Phe Ser Thr Asp350 355 360GGC AGT GTT TTA GCT GCT GGG ACA CAT GAT GGA AGT GTG TAT TTT TGG1396Gly Ser Val Leu Ala Ala Gly Thr His Asp Gly Ser Val Tyr Phe Trp365 370 375GCC ACT CCA AGG CAA GTC CCT AGC CTT CAA CAT ATA TGT CGC ATG TCA1444Ala Thr Pro Arg Gln Val Pro Ser Leu Gln His Ile Cys Arg Met Ser380 385 390ATC CGA AGA GTG ATG TCC ACC CAA GAA GTC CAA AAA CTG CCT GTT CCT1492Ile Arg Arg Val Met Ser Thr Gln Glu Val Gln Lys Leu Pro Val Pro395 400 405 410TCC AAA ATA TTG GCG TTT CTC TCC TAC CGC GGT TAG A CTGAAGACTG 1539Ser Lys Ile Leu Ala Phe Leu Ser Tyr Arg Gly *415 420CCTTTCCTGG TAGGCCTGCC AGACAGAGCG CCCTTTACAA GACACACCTC AAGCTTTACC 1599TCGTGCCGAA TT 1611(2)关于SEQ ID NO14的信息(i)序列特征(A)长度422个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO14Met Ala Ser Phe Pro Pro Arg Val Asn Glu Lys Glu Ile Val Arg Ser1 5 10 15Arg Thr Ile Gly Glu Leu Leu Ala Pro Ala Ala Pro Phe Asp Lys Lys20 25 30Cys Gly Gly Glu Asn Trp Thr Val Ala Phe Ala Pro Asp Gly Ser Tyr35 40 45Phe Ala Trp Ser Gln Gly Tyr Arg Ile Val Lys Leu Val Pro Trp Ser50 55 60Gln Cys Arg Lys Asn Phe Leu Leu His Gly Ser Lys Asn Val Thr Asn65 70 75 80Ser Ser Cys Leu Lys Leu Ala Arg Gln Asn Ser Asn Gly Gly Gln Lys85 90 95Asn Lys Pro Pro Glu His Val Ile Asp Cys Gly Asp Ile Val Trp Ser100 105 110Leu Ala Phe Gly Ser Ser Val Pro Glu Lys Gln Ser Arg Cys Val Asn115 120 125Ile Glu Trp His Arg Phe Arg Phe Gly Gln Asp Gln Leu Leu Leu Ala130 135 140Thr Gly Leu Asn Asn Gly Arg Ile Lys Ile Trp Asp Val Tyr Thr Gly145 150 155 160Lys Leu Leu Leu Asn Leu Val Asp His Ile Glu Met Val Arg Asp Leu165 170 175Thr Phe Ala Pro Asp Gly Ser Leu Leu Leu Val Ser Ala Ser Arg Asp180 185 190Lys Thr Leu Arg Val Trp Asp Leu Lys Asp Asp Gly Asn Met Val Lys195 200 205Val Leu Arg Ala His Gln Asn Trp Val Tyr Ser Cys Ala Phe Ser Pro210 215 220Asp Cys Ser Met Leu Cys Ser Val Gly Ala Ser Lys Ala Val Phe Leu225 230 235 240Trp Asn Met Asp Lys Tyr Thr Met Ile Arg Lys Leu Glu Gly His His245 250 255His Asp Val Val Ala Cys Asp Phe Ser Pro Asp Gly Ala Leu Leu Ala260 265 270Thr Ala Ser Tyr Asp Thr Arg Val Tyr Val Trp Asp Pro His Asn Gly275 280 285Asp Leu Leu Met Glu Phe Gly His Leu Phe Pro Ser Pro Thr Pro Ile290 295 300Phe Ala Gly Gly Ala Asn Asp Arg Trp Val Arg Ala Val Ser Phe Ser305 310 315 320His Asp Gly Leu His Val Ala Ser Leu Ala Asp Asp Lys Met Val Arg325 330 335Phe Trp Arg Ile Asp Glu Asp Cys Pro Val Gln Val Ala Pro Leu Ser340 345 350Asn Gly Leu Cys Cys Ala Phe Ser Thr Asp Gly Ser Val Leu Ala Ala355 360 365Gly Thr His Asp Gly Ser Val Tyr Phe Trp Ala Thr Pro Arg Gln Val370 375 380Pro Ser Leu Gln His Ile Cys Arg Met Ser Ile Arg Arg Val Met Ser385 390 395 400Thr Gln Glu Val Gln Lys Leu Pro Val Pro Ser Lys Ile Leu Ala Phe405 410 415Leu Ser Tyr Arg Gly *420(2)关于SEQ ID NO15的信息(i)序列特征(A)长度783个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(xi)序列描述SEQ ID NO15CTGTCTTCCT CCGCAGCGCG AGGCTGGGTA CAGGGTCTAT TGTCTGTGGT TGACTCCGTA60CTTTGGTCTG AGGCCTTCGG GAGCTTTCCC GAGGCAGTTA GCAGAAGCCG CAGCGACCGC 120CCCCGCCCGT CTCCTCTGTC CCTGGGCCCG GGAGACAAAC TTGGCGTCAC GCCCTCAGCG 180GTCGCCACTC TCTTCTCTGT TGTTGGGTCC GCATCGTATT CCCGGAATCA GACGGTGCCC 240CATAGATGGC CAGCTTTCCC CCGAGGGTCA ACGAGAAAGA GATCGTGAGA TCACGTACTA 300TAGGTGAACT TTTAGCTCCT GCAGCTCCTT TTGACAAGAA ATGTGGTCGT GAAAATTGGA 360CTGTTGCTTT TGCTCCAGAT GGTTCATACT TTGCTTGGTC ACAAGGACAT CGCACAGTAA 420AGCTTGTTCC GTGGTCCCAG TGCCTTCAGA ACTTTCTCTT GCATGGCACC AAGAATGTTA 480CCAATTCAAG CAGTTTAAGA TTGCCAAGAC AAAATAGTGA TGGTGGTCAG AAAAATAAGC 540CTCGTGACAT ATTATAGACT GTGGAGATAT AGTCTGGAGT CTTGCTTTTG GGTCATCAGT 600TCCAGAAAAA CAGAGTCGCT GTGTAAATAT AGAATGGCAT CGCTTCAGAT TTGGACAAGA 660TCAGCTACTT CTTGCTACAG GGTTGAACAA TGGGCGTATC AAAATATGGG ATGTATATCA 720GGAAACTCCT CCTTAACTTG GTAGATCATA CTGAAGTGGT CAGAGATTTA ACTTTTGCTC 780CAG 783(2)关于SEQ ID NO16的信息(i)序列特征(A)长度1122个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO16CTCTGTATGT CTGAATGAAG CTATAACATT TGCCTTTTTA TTGCAGGTTT TCCTTTGGAA60TATGGATAAA TACACCATGA TACGGAAACT AGAAGGACAT CACCATGATG TGGTAGCTTG 120TGACTTTTCT CCTGATGGAG CATTACTGGC TACTGCATCT TATGATACTC GAGTATATAT 180CTGGGATCCA CATAATGGAG ACATTCTGAT GGAATTTGGG CACCTGTTTC CCCCACCTAC 240TCCAATATTT GCTGGAGGAG CAAATGACCG GTGGGTACGA TCTGTATCTT TTAGCCATGA 300TGGACTGCAT GTTGCAAGCC TTGCTGATGA TAAAATGGTG AGGTTCTGGA GAATTGATGA 360GGATTATCCA GTGCAAGTTG CACCTTTGAG CAATGGTCTT TGCTGTGCCT TCTCTACTGA 420TGGCAGTGTT TTAGCTGCTG GGACACATGA CGGAAGTGTG TATTTTTGGG CCACTCCACG 480GCAGGTCCCT AGCCTGCAAC ATTTATGTCG CATGTCAATC CGAAGAGTGA TGCCCACCCA 540AGAAGTTCAG GAGCTGCCGA TTCCTTCCAA GCTTTTGGAG TTTCTCTCGT ATCGTATTTA 600GAAGATTCTG CCTTCCCTAG TAGTAGGGAC TGACAGAATA CACTTAACAC AAACCTCAAG 660CTTTACTGAC TTCAATTATC TGTTTTTAAA GACGTAGAAG ATTTATTTAA TTTGATATGT 720TCTTGTACTG CATTTTGATC AGTTGAGCTT TTAAAATATT ATTTATAGAC AATAGAAGTA 780TTTCTGAACA TATCAAATAT AAATTTTTTT AAAGATCTAA CTGTGAAAAC ATACATACCT 840GTACATATTT AGATATAAGC TGCTATATGT TGAATGGACC CTTTTGCTTT TCTGATTTTT 900AGTTCTGACA TGTATATATT GCTTCAGTAG AGCCACAATA TGTATCTTTG CTGTAAAGTG 960CAAGGAAATT TTAAATTCTG GGACACTGAG TTAGATGGTA AATACTGACT TACGAAAGTT 1020GAATTGGGTG AGGCGGGCAA ATCACCTGAG GTCAGCAGTT TGAGACTAGC CTGGCAAACA 1080TGATGAAACC CTGTCTCTAC TAAAAATACA AAAAAAAAAA AA 1122(2)关于SEQ ID NO17的信息(i)序列特征(A)长度2537个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置422..2029(xi)序列描述SEQ ID NO17CGGCACGAGC CGGGCTCCGT CCGGAGGAAG CGAGGCTGCG CCGCCGGCCC GGCAGGAGCG60GAGGACGGGA GCGCGGGCGG TCGCGCTCGC CCTGTCGCTG ACTGCGCTGC CCCGGCCCAT 120CCTTGCCTGG CCGCAGGTGC CCTGGATGAG GCCGCCGCGC GTGTCCCGGC CGCTGAGTGT 180CCCCCGCGGT CGCCCGGCGC CTGCCCTCAA GCGGCCGCCT CTCCTTGCCC GGGTCCCCGT 240TTTCCCCCGG CGCAGTCCTC CTCCGGTGGG CGCCTCCGCA CCTCGGCGCA GGCGGCACGG 300CCCTCGGGCC GGGATGGATC CGCCGGGAAG AGGAAGACAA GCCGGGGCGT TGAGCCCCTG 360CGCACGGTGC CGCCGCGCGT AGTGGGAGCT TACTCGCAGT AGGCTCTCGC TCTTCTAATC 420A ATG GAT AAA GTG GGG AAA ATG TGG AAC AAC TTA AAA TAC AGA TGC 466Met Asp Lys Val Gly Lys Met Trp Asn Asn Leu Lys Tyr Arg Cys1 5 10 15CAG AAT CTC TTC AGC CAC GAG GGA GGA AGC CGT AAT GAG AAC GTG GAG 514Gln Asn Leu Phe Ser His Glu Gly Gly Ser Arg Asn Glu Asn Val Glu20 25 30ATG AAC CCC AAC AGA TGT CCG TCT GTC AAA GAG AAA AGC ATC AGT CTG 562Met Asn Pro Asn Arg Cys Pro Ser Val Lys Glu Lys Ser Ile Ser Leu35 40 45GGA GAG GCA GCT CCC CAG CAA GAG AGC AGT CCC TTA AGA GAA AAT GTT 610Gly Glu Ala Ala Pro Gln Gln Glu Ser Ser Pro Leu Arg Glu Asn Val50 55 60GCC TTA CAG CTG GGA CTG AGC CCT TCC AAG ACC TTT TCC AGG CGG AAC 658Ala Leu Gln Leu Gly Leu Ser Pro Ser Lys Thr Phe Ser Arg Arg Asn65 70 75CAA AAC TGT GCC GCA GAG ATC CCT CAA GTG GTT GAA ATC AGC ATC GAG 706Gln Asn Cys Ala Ala Glu Ile Pro Gln Val Val Glu Ile Ser Ile Glu80 85 90 95AAA GAC AGT GAC TCG GGT GCC ACC CCA GGA ACG AGG CTT GCA CGG AGA 754Lys Asp Ser Asp Ser Gly Ala Thr Pro Gly Thr Arg Leu Ala Arg Arg100 105 110GAC TCC TAC TCG CGG CAC GCC CCG TGG GGA GGA AAG AAG AAA CAT TCC 802Asp Ser Tyr Ser Arg His Ala Pro Trp Gly Gly Lys Lys Lys His Ser115 120 125TGT TCC ACA AAG ACC CAG AGT TCA TTG GAT ACC GAG AAA AAG TTT GGT 850Cys Ser Thr Lys Thr Gln Ser Ser Leu Asp Thr Glu Lys Lys Phe Gly130 135 140AGA ACT CGA AGC GGC CTT CAG AGG CGA GAG CGG CGC TAT GGA GTC AGC 898Arg Thr Arg Ser Gly Leu Gln Arg Arg Glu Arg Arg Tyr Gly Val Ser145 150 155TCC ATG CAG GAC ATG GAC AGC GTT TCT AGC CGC GCG GTC GGG AGC CGC 946Ser Met Gln Asp Met Asp Ser Val Ser Ser Arg Ala Val Gly Ser Arg160 165 170 175TCC CTG AGG CAG AGG CTC CAG GAC ACG GTG GGT TTG TGT TTT CCC ATG 994Ser Leu Arg Gln Arg Leu Gln Asp Thr Val Gly Leu Cys Phe Pro Met180 185 190AGA ACT TAC AGC AAG CAG TCA AAG CCA CTC TTT TCC AAT AAA AGA AAA1042Arg Thr Tyr Ser Lys Gln Ser Lys Pro Leu Phe Ser Asn Lys Arg Lys195 200 205ATA CAT CTT TCT GAA TTA ATG CTG GAG AAA TGC CCT TTT CCT GCT GGC1090Ile His Leu Ser Glu Leu Met Leu Glu Lys Cys Pro Phe Pro Ala Gly210 215 220TCG GAT TTA GCA CAA AAG TGG CAT TTG ATT AAA CAG CAT ACC GCC CCT1138Ser Asp Leu Ala Gln Lys Trp His Leu Ile Lys Gln His Thr Ala Pro225 230 235GTG AGC CCA CAC TCA ACA TTT TTT GAT ACA TTT GAT CCA TCA CTG GTG1186Val Ser Pro His Ser Thr Phe Phe Asp Thr Phe Asp Pro Ser Leu Val240 245 250 255TCT ACA GAA GAT GAA GAA GAT AGG CTT CGC GAG AGA AGA CGG CTT AGT1234Ser Thr Glu Asp Glu Glu Asp Arg Leu Arg Glu Arg Arg Arg Leu Ser260 265 270ATC GAA GAA GGG GTG GAT CCC CCT CCC AAC GCA CAA ATA CAC ACC TTT1282Ile Glu Glu Gly Val Asp Pro Pro Pro Asn Ala Gln Ile His Thr Phe275 280 285GAA GCT ACT GCA CAG GTC AAC CCA TTG TAT AAG CTG GGA CCA AAG TTA1330Glu Ala Thr Ala Gln Val Asn Pro Leu Tyr Lys Leu Gly Pro Lys Leu290 295 300GCT CCT GGG ATG ACA GAG ATA AGT GGA GAT GGT TCT GCA ATT CCA CAA1378Ala Pro Gly Met Thr Glu Ile Ser Gly Asp Gly Ser Ala Ile Pro Gln305 310 315GCA ATT GTG ACT CAG AAG AGG ATT CAA CCA CCC TAT GTC TGC AGT CAC1426Ala Ile Val Thr Gln Lys Arg Ile Gln Pro Pro Tyr Val Cys Ser His320 325 330 335GGA GGC AGA AGC AGC GCC AGG TGT CCG GGG ACA GCC ACG CGC ACG TTA1474Gly Gly Arg Ser Ser Ala Arg Cys Pro Gly Thr Ala Thr Arg Thr Leu340 345 350GCA GAC AGG GAG CTT GGA AAG TTC ATA CGC AGA TCG ATT ACA TAC ACT1522Ala Asp Arg Glu Leu Gly Lys Phe Ile Arg Arg Ser Ile Thr Tyr Thr355 360 365GCC TCG TGC CAG ATT TGC TTC AGA TCA CAG GGA ATC CCT GTT ACT GGG1570Ala Ser Cys Gln Ile Cys Phe Arg Ser Gln Gly Ile Pro Val Thr Gly370 375 380GCG TGA TGG ACC GAT ACG AGG CCG AAG CCC TTC TAG AAG GGA AAC CGG1618Ala * Trp Thr Asp Thr Arg Pro Lys Pro Phe * Lys Gly Asn Arg385 390 395AAG GCA CGT TCT TGC TCA GGG ACT CTG CAC AGG AGG ACT ACC TCT TCT1666Lys Ala Arg Ser Cys Ser Gly Thr Leu His Arg Arg Thr Thr Ser Ser400 405 410 415CTG TGA GCT TCC GCC GCT ACA ACA GGT CTC TGC ACG CCC GGA TCG AGC1714Leu * Ala Ser Ala Ala Thr Thr Gly Leu Cys Thr Pro Gly Ser Ser420 425 430AGT GGA ACC ACA ACT TCA GCT TCG ATG CCC ATG ACC CCT GCG TGT TTC1762Ser Gly Thr Thr Thr Ser Ala Ser Met Pro Met Thr Pro Ala Cys Phe435 440 445ACT CCT CCA CGT CAC GGG GCT TCT CGA ACA CTA TAA AGA CCC CAG CTC1810Thr Pro Pro Arg His Gly Ala Ser Arg Thr Leu * Arg Pro Gln Leu450 455 460TTG CAT GTT TTT TGA ACC GTT GCT AAC GAT ATC ACT GAA TAG AAC TTT1858Leu His Val Phe * Thr Val Ala Asn Asp Ile Thr Glu * Asn Phe465 470 475CCC TTT CAG CCT GCA GTA TAT CTG CCG CGC AGT GAT CTG CAG ATG CAC1906Pro Phe Gln Pro Ala Val Tyr Leu Pro Arg Ser Asp Leu Gln Met His480 485 490 495TAC GTA TGA TGG GAT TGA CGG GCT CCC GCT ACC GTC GAT GTT ACA GGA1954Tyr Val * Trp Asp * Arg Ala Pro Ala Thr Val Asp Val Thr Gly500 505 510TTT TTT AAA AGA GTA TCA TTA TAA ACA AAA AGT TAG GGT TCG CTG GTT2002Phe Phe Lys Arg Val Ser Leu * Thr Lys Ser * Gly Ser Leu Val515 520 525AGA ACG AGA CCA GTC AAA GCA AAG TAACTCCTGT CCCCAAAGGG CACTAACTAA 2056Arg Thr Arg Pro Val Lys Ala Lys530 535GTCTGCTCCT CCCGTGCATC GAACTGCACC CATAGGAGGC AGTCAGCTGC TAGGATTTCC 2116CACCCAGAAT GGGAGCTTAG TCATTAGCCT CTGCCCTATG GGGTCCGCTG TTCCTCAGAC 2176AAAGGTGCCT AGGGACAGCA AGATGGCTTG CAGGTGTTCG GTGGGCTGTG ACAACTGAGG 2236GAGGCAACTC TGGGGCATTT GCTATGAAGA ATTCTATTTC TTACCGAAGA ACAAATTATT 2296AATATTGGAT GGGTATTTCA ATAGTGTGAC TAATGTTTGA AATTATTTTT TCTAAGAATT 2356TTTCTATAAC CTTCAGAAAA AGTAGTGATG TTTGTAGTTA CTATAAATCA AGCTTTGAAA 2416GTTCAAAACA AACAAGTTAA ATAAAAGACT ACCTTCCTTT TAGAGAAAAC AAATGCAAGT 2476TTTCCCAGCC ACAGGCATTG TGCACTGTTA ATGTTGCTTG TTATCAGCTC CTTTCTCCTC 2536C 2537(2)关于SEQ ID NO18的信息(i)序列特征(A)长度535个碱基对(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO18Met Asp Lys Val Gly Lys Met Trp Asn Asn Leu Lys Tyr Arg Cys Gln1 5 10 15Asn Leu Phe Ser His Glu Gly Gly Ser Arg Asn Glu Asn Val Glu Met20 25 30Asn Pro Asn Arg Cys Pro Ser Val Lys Glu Lys Ser Ile Ser Leu Gly35 40 45Glu Ala Ala Pro Gln Gln Glu Ser Ser Pro Leu Arg Glu Asn Val Ala50 55 60Leu Gln Leu Gly Leu Ser Pro Ser Lys Thr Phe Ser Arg Arg Asn Gln65 70 75 80Asn Cys Ala Ala Glu Ile Pro Gln Val Val Glu Ile Ser Ile Glu Lys85 90 95Asp Ser Asp Ser Gly Ala Thr Pro Gly Thr Arg Leu Ala Arg Arg Asp100 105 110Ser Tyr Ser Arg His Ala Pro Trp Gly Gly Lys Lys Lys His Ser Cys115 120 125Ser Thr Lys Thr Gln Ser Ser Leu Asp Thr Glu Lys Lys Phe Gly Arg130 135 140Thr Arg Ser Gly Leu Gln Arg Arg Glu Arg Arg Tyr Gly Val Ser Ser145 150 155 160Met Gln Asp Met Asp Ser Val Ser Ser Arg Ala Val Gly Ser Arg Ser165 170 175Leu Arg Gln Arg Leu Gln Asp Thr Val Gly Leu Cys Phe Pro Met Arg180 185 190Thr Tyr Ser Lys Gln Ser Lys Pro Leu Phe Ser Asn Lys Arg Lys Ile195 200 205His Leu Ser Glu Leu Met Leu Glu Lys Cys Pro Phe Pro Ala Gly Ser210 215 220Asp Leu Ala Gln Lys Trp His Leu Ile Lys Gln His Thr Ala Pro Val225 230 235 240Ser Pro His Ser Thr Phe Phe Asp Thr Phe Asp Pro Ser Leu Val Ser245 250 255Thr Glu Asp Glu Glu Asp Arg Leu Arg Glu Arg Arg Arg Leu Ser Ile260 265 270Glu Glu Gly Val Asp Pro Pro Pro Asn Ala Gln Ile His Thr Phe Glu275 280 285Ala Thr Ala Gln Val Asn Pro Leu Tyr Lys Leu Gly Pro Lys Leu Ala290 295 300Pro Gly Met Thr Glu Ile Ser Gly Asp Gly Ser Ala Ile Pro Gln Ala305 310 315 320Ile Val Thr Gln Lys Arg Ile Gln Pro Pro Tyr Val Cys Ser His Gly325 330 335Gly Arg Ser Ser Ala Arg Cys Pro Gly Thr Ala Thr Arg Thr Leu Ala340 345 350Asp Arg Glu Leu Gly Lys Phe Ile Arg Arg Ser Ile Thr Tyr Thr Ala355 360 365Ser Cys Gln Ile Cys Phe Arg Ser Gln Gly Ile Pro Val Thr Gly Ala370 375 380* Trp Thr Asp Thr Arg Pro Lys Pro Phe * Lys Gly Asn Arg Lys385 390 395 400Ala Arg Ser Cys Ser Gly Thr Leu His Arg Arg Thr Thr Ser Ser Leu405 410 415* Ala Ser Ala Ala Thr Thr Gly Leu Cys Thr Pro Gly Ser Ser Ser420 425 430Gly Thr Thr Thr Ser Ala Ser Met Pro Met Thr Pro Ala Cys Phe Thr435 440 445Pro Pro Arg His Gly Ala Ser Arg Thr Leu * Arg Pro Gln Leu Leu450 455 460His Val Phe * Thr Val Ala Asn Asp Ile Thr Glu * Asn Phe Pro465 470 475 480Phe Gln Pro Ala Val Tyr Leu Pro Arg Ser Asp Leu Gln Met His Tyr485 490 495Val * Trp Asp * Arg Ala Pro Ala Thr Val Asp Val Thr Gly Phe500 505 510Phe Lys Arg Val Ser Leu * Thr Lys Ser * Gly Ser Leu Val Arg515 520 525Thr Arg Pro Val Lys Ala Lys530 535(2)关于SEQ ID NO19的信息(i)序列特征(A)长度1221个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO19GATTAAACAG CATACAGCTC CTGTGAGCCC ACATTCAACA TTTTTTGATA CTTTGATCCA 60TCTTTGGTTT CTACAGAAGA TGAAGAAGAT AGGCTTAGAG AGAGAAGGCG GCTTAGTATT 120GAAGAAGGGG TTGATCCCCC TCCCAATGCA CAAATACATA CATTTGAAGC TACTGCACAG 180GTTAATCCAT TATTAAACTG GGACCAAAAT TAGCTCCTGG AATGACTGAA ATAAGTGGGG 240ACAGTTCTGC AATTCCACAA GCTAATTGTG ACTCGGAAGA GGATACAACC ACCCTGTGTT 300GCAGTCACGG AGGCAGAAGC AGCGTCAGAT ATCTGGAGAC AGCCATACCC ATGTTAGCAG 360ACAGGGAGCT TGGAAAGTCC ACACACAGAT TGATTACATA CACTGCTTCG TGCCTGATTT 420GCTTCAAATT ACAGGGAATC CCTGTTACTG GGGAGTGATG GACCGTTATG AAGCAGAAGC 480CCTTCTCGAA GGGAAACCTG AAGGCACGTT TTTGCTCAGG GACTCTGCGC AAGAGGACTA 540CTTCTTCTCT GTGAGCTTCC GCCGATACAA CAGATCCCTG CATGCCCGAA TTGAGCAGTG 600GAATCACAAC TTTAGTTTCG ACGCCCATGA CCCGTGTGTA TTTCACTCCT CCACTGTAAC 660GGGACTTTTA GAACATTATA AAGATCCCAG TTCGTGCATG TTTTTTGAAC CATTGCTTAC 720TATATCACTA AATAGGACTT TCCCTTTTAG CCTGCAGTAT ATCTGTCGCG CGGTAATCTG 780CAGGTGCACT ACGTATGATG GAATTGATGG GCTCCCTCTA CCCTCAATGT TACAGGATTT 840TTTAAAAGAG TATCATTATA AACAAAAAGT TAGAGTTCGC TGGTTGGAAC GAGAACCAGT 900CAAGGCAAAG TAAACTCTCC GGTCCCCAAA GGGTGTTAAC TAGGTCCGCT TTCATGTGCA 960TCAGACAGTA CACCTATAGC AAGCACACGT AGCAGTGTTA GGCTTTTTCA TACAGTATGT 1020AAGCTTAGTG TTAGTATCTG TCAGATGCTA CCTGCTGTTA CTTATTCAGA TAAACATGGT 1080GCCTATTGGA ACAATAGCGG ATAGAGCTAC AGGTGTTCAG TAAGACTACA AAAACATTTT 1140GCCTATTTCG CTAACAGTTT GGTTTTTAAT GGCTGTGGTA TTTGAGTGAG GCAACTCTGG 1200GGCATTTGTT ATGAAGAAAT G1221(2)关于SEQ ID NO20的信息(i)序列特征(A)长度2369个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置116..1330(xi)序列描述SEQ ID NO20GGCACGAGGC GGTGGTGGCG GCGGCGGGCG CGGCCGCGGC GGGGCGGGCG CGGAATGAAG 60GCCCACGGCC CTGGGGGCTG AGGCGCCCGC CGCCTGGGGC GGGCCGCGCG TCCTC ATG 118Met1GAG GCC GGA GAG GAG CCG CTG CTG CTG GCT GAA CTC AAG CCT GGG CGC 166Glu Ala Gly Glu Glu Pro Leu Leu Leu Ala Glu Leu Lys Pro Gly Arg5 10 15CCC CAC CAG TTC GAC TGG AAG TCA AGC TGC GAG ACC TGG AGC GTG GCC 214Pro His Gln Phe Asp Trp Lys Ser Ser Cys Glu Thr Trp Ser Val Ala20 25 30TTC TCG CCA GAC GGT TCC TGG TTC GCC TGG TCT CAA GGA CAC TGC GTG 262Phe Ser Pro Asp Gly Ser Trp Phe Ala Trp Ser Gln Gly His Cys Val35 40 45GTC AAG CTG GTC CCC TGG CCC TTA GAG GAA CAG TTC ATC CCT AAA GGA 310Val Lys Leu Val Pro Trp Pro Leu Glu Glu Gln Phe Ile Pro Lys Gly50 55 60 65TTC GAA GCC AAG AGC CGA AGC AGC AAG AAT GAC CCA AAA GGA CGG GGC 358Phe Glu Ala Lys Ser Arg Ser Ser Lys Asn Asp Pro Lys Gly Arg Gly70 75 80AGT CTG AAG GAG AAG ACG CTG GAC TGT GGC CAG ATT GTG TGG GGG CTG 406Ser Leu Lys Glu Lys Thr Leu Asp Cys Gly Gln Ile Val Trp Gly Leu85 90 95GCC TTC AGC CCG TGG CCC TCT CCA CCC AGC AGG AAA CTC TGG GCA CGT 454Ala Phe Ser Pro Trp Pro Ser Pro Pro Ser Arg Lys Leu Trp Ala Arg100 105 110CAC CAT CCC CAG GCG CCT GAT GTT TCT TGC CTG ATC CTG GCC ACA GGT 502His His Pro Gln Ala Pro Asp Val Ser Cys Leu Ile Leu Ala Thr Gly115 120 125CTC AAC GAT GGG CAG ATC AAG ATT TGG GAG GTA CAG ACA GGC CTC CTG 550Leu Asn Asp Gly Gln Ile Lys Ile Trp Glu Val Gln Thr Gly Leu Leu130 135 140 145CTT CTG AAT CTT TCT GGC CAC CAA GAC GTC GTG AGA GAT CTG AGC TTC 598Leu Leu Asn Leu Ser Gly His Gln Asp Val Val Arg Asp Leu Ser Phe150 155 160ACG CCC AGC GGC AGT TTG ATT TTG GTC TCT GCA TCC CGG GAT AAG ACA 646Thr Pro Ser Gly Ser Leu Ile Leu Val Ser Ala Ser Arg Asp Lys Thr165 170 175CTT CGA ATT TGG GAC CTG AAT AAA CAC GGT AAG CAG ATC CAG GTG TTA 694Leu Arg Ile Trp Asp Leu Asn Lys His Gly Lys Gln Ile Gln Val Leu180 185 190TCC GGC CAT CTG CAG TGG GTT TAC TGC TGC TCC ATC TCC CCT GAC TGT 742Ser Gly His Leu Gln Trp Val Tyr Cys Cys Ser Ile Ser Pro Asp Cys195 200 205AGC ATG CTG TGC TCT GCA GCT GGG GAG AAG TCG GTC TTT CTG TGG AGC 790Ser Met Leu Cys Ser Ala Ala Gly Glu Lys Ser Val Phe Leu Trp Ser210 215 220 225ATG CGG TCC TAC ACA CTA ATC CGG AAA CTA GAA GGC CAC CAA AGC AGT 838Met Arg Ser Tyr Thr Leu Ile Arg Lys Leu Glu Gly His Gln Ser Ser230 235 240GTT GTC TCC TGT GAT TTC TCT CCT GAT TCA GCC TTG CTT GTC ACA GCT 886Val Val Ser Cys Asp Phe Ser Pro Asp Ser Ala Leu Leu Val Thr Ala245 250 255TCG TAT GAC ACC AGT GTG ATT ATG TGG GAC CCC TAC ACC GGC GCG AGG 934Ser Tyr Asp Thr Ser Val Ile Met Trp Asp Pro Tyr Thr Gly Ala Arg260 265 270CTG AGG TCA CTT CAT CAC ACA CAA CTT GAA CCC ACC ATG GAT GAC AGT 982Leu Arg Ser Leu His His Thr Gln Leu Glu Pro Thr Met Asp Asp Ser275 280 285GAC GTC CAC ATG AGC TCC CTG AGG TCC GTG TGC TTC TCA CCT GAA GGC 1030Asp Val His Met Ser Ser Leu Arg Ser Val Cys Phe Ser Pro Glu Gly290 295 300 305TTG TAT CTC GCT ACG GTG GCA GAT GAC AGG CTG CTC AGG ATC TGG GCT 1078Leu Tyr Leu Ala Thr Val Ala Asp Asp Arg Leu Leu Arg Ile Trp Ala310 315 320CTG GAA CTG AAG GCT CCG GTT GCC TTT GCT CCG ATG ACC AAT GGT CTT 1126Leu Glu Leu Lys Ala Pro Val Ala Phe Ala Pro Met Thr Asn Gly Leu325 330 335TGC TGC ACG TTC TTC CCA CAC GGT GGA ATT ATT GCC ACA GGG ACG AGA 1174Cys Cys Thr Phe Phe Pro His Gly Gly Ile Ile Ala Thr Gly Thr Arg340 345 350GAT GGC CAT GTC CAG TTC TGG ACA GCT CCC CGG GTC CTG TCC TCA CTG 1222Asp Gly His Val Gln Phe Trp Thr Ala Pro Arg Val Leu Ser Ser Leu355 360 365AAG CAC TTA TGC AGG AAA GCC CTC CGA AGT TTC CTG ACA ACG TAT CAA 1270Lys His Leu Cys Arg Lys Ala Leu Arg Ser Phe Leu Thr Thr Tyr Gln370 375 380 385GTC CTA GCA CTG CCA ATC CCC AAG AAG ATG AAA GAG TTC CTC ACA TAC 1318Val Leu Ala Leu Pro Ile Pro Lys Lys Met Lys Glu Phe Leu Thr Tyr390 395 400AGG ACT TTC TAGCAGTGCC GGCTCCCCCA CCTCCTGCAG CAGCAGCAGT 1367Arg Thr Phe405ACAAGGGACT GGCTAGGATG GAGTCAGGCA GCTCACACTG GACCAGTGTG GACCTTCCTT 1427CCTCCCATGG CATGTGCAAG TAGGTCTGCG TGACCCCACT TCTGTGGTGC CGGCCTTACC 1487TCGTCTTCAT CCGTGGTGAG CAGCCTTCGT CAGTCTAGTT GTGTTGAAGC CAAGTGCAGT 1547TGTGGATGTT GCTGGGGTAA TAAAGGCAAG CGGGCTCCAG AGCCTCTCTG GTGGCGGCCA 1607AGCCACACTC CCTTAACTGG GAAGTACCTG CCACGTAGGG CATTTCTGCT GCCTATTTCC 1667AGCCAGCGGC TGCATGGTTT GAAGTTCCTC CGTTGTGGTC AGAAGAACTC TGGTGTTTGG 1727TTCCCTGCTC AGCTGCGCGT GGACTGGGCT GAGCTCCTCA CCATACACTA GTGCCGGCTT 1787TTGTTTCCTG TAAACAGTGG TTGCATGTGT AGAGAAGTAA CAAGCGAGTA TTCAGATCAT 1847ACGAGGAGGC GTTCCTCGGT GCATGACGGT CAGATGGCCA TTTATCAGCA TATTTATTTG 1907TATTTTCTCA GCACATAGTA AGGTACAACT GTGTTTTCTC AATTGTCTCG AAAAAACAGA 1967GTTCTTAAGT GGCCCAGTTG TGGAGCCAAG TCTAAGTCGT GTGGAGTCAG TGCTGACATC 2027ACTGGCTTGT GCTGTCTGTC ACATGTGTTT GTCTCTGCTG CTTGACCTCA TGGGATGTAC 2087CCTCCAGTTC AACTGCCCAA AACAGACAGC CCCTTCCAAG CACCGTTCTT TGACAGCGGT 2147AGCAGCTACC TATTCAAGAC GCCTCACACA AAATCTGCCT TAGAAAGTTA ATATATTTTA 2207AATTATTTTA AAAGAAACTC AACATCTTAT TCTTTGGCCT TTCTTAATTG ATGCTTTATG 2267GAGGCAGTGT TAACATTGTA CAGTGTATGC ATAGAGGAGT CTCCTCTATT TGAAGAACAA 2327TGCAAAATGA GGCTTTCATT GAAGGGAAAA AAAAAAAAAA AA 2369(2)关于SEQ ID NO21的信息(i)序列特征(A)长度404个碱基对(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO21Met Glu Ala Gly Glu Glu Pro Leu Leu Leu Ala Glu Leu Lys Pro Gly1 5 10 15Arg Pro His Gln Phe Asp Trp Lys Ser Ser Cys Glu Thr Trp Ser Val20 25 30Ala Phe Ser Pro Asp Gly Ser Trp Phe Ala Trp Ser Gln Gly His Cys35 40 45Val Val Lys Leu Val Pro Trp Pro Leu Glu Glu Gln Phe Ile Pro Lys50 55 60Gly Phe Glu Ala Lys Ser Arg Ser Ser Lys Asn Asp Pro Lys Gly Arg65 70 75 80Gly Ser Leu Lys Glu Lys Thr Leu Asp Cys Gly Gln Ile Val Trp Gly85 90 95Leu Ala Phe Ser Pro Trp Pro Ser Pro Pro Ser Arg Lys Leu Trp Ala100 105 110Arg His His Pro Gln Ala Pro Asp Val Ser Cys Leu Ile Leu Ala Thr115 120 125Gly Leu Asn Asp Gly Gln Ile Lys Ile Trp Glu Val Gln Thr Gly Leu130 135 140Leu Leu Leu Asn Leu Ser Gly His Gln Asp Val Val Arg Asp Leu Ser145 150 155 160Phe Thr Pro Ser Gly Ser Leu Ile Leu Val Ser Ala Ser Arg Asp Lys165 170 175Thr Leu Arg Ile Trp Asp Leu Asn Lys His Gly Lys Gln Ile Gln Val180 185 190Leu Ser Gly His Leu Gln Trp Val Tyr Cys Cys Ser Ile Ser Pro Asp195 200 205Cys Ser Met Leu Cys Ser Ala Ala Gly Glu Lys Ser Val Phe Leu Trp210 215 220Ser Met Arg Ser Tyr Thr Leu Ile Arg Lys Leu Glu Gly His Gln Ser225 230 235 240Ser Val Val Ser Cys Asp Phe Ser Pro Asp Ser Ala Leu Leu Val Thr245 250 255Ala Ser Tyr Asp Thr Ser Val Ile Met Trp Asp Pro Tyr Thr Gly Ala260 265 270Arg Leu Arg Ser Leu His His Thr Gln Leu Glu Pro Thr Met Asp Asp275 280 285Ser Asp Val His Met Ser Ser Leu Arg Ser Val Cys Phe Ser Pro Glu290 295 300Gly Leu Tyr Leu Ala Thr Val Ala Asp Asp Arg Leu Leu Arg Ile Trp305 310 315 320Ala Leu Glu Leu Lys Ala Pro Val Ala Phe Ala Pro Met Thr Asn Gly325 330 335Leu Cys Cys Thr Phe Phe Pro His Gly Gly Ile Ile Ala Thr Gly Thr340 345 350Arg Asp Gly His Val Gln Phe Trp Thr Ala Pro Arg Val Leu Ser Ser355 360 365Leu Lys His Leu Cys Arg Lys Ala Leu Arg Ser Phe Leu Thr Thr Tyr370 375 380Gln Val Leu Ala Leu Pro Ile Pro Lys Lys Met Lys Glu Phe Leu Thr385 390 395 400Tyr Arg Thr Phe(2)关于SEQ ID NO22的信息(i)序列特征(A)长度1246个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO22GACACTGCAT CGTCAAACTG ATCCCCTGGC CGTTGGAGGA GCAGTTCATC CCTAAAGGGT60TTGAAGCCAA AAGCCGAAGT AGCAAAAATG AGACGAAAGG GCGGGGCAGC CCAAAAGAGA 120AGACGCTGGA CTGTGGTCAG ATTGTCTGGG GGCTGGCCTT CAGCCTGTGC TTTCCCCACC 180CAGCAGGAAG CTCTGGGCAC GCCACCACCC CCAAGTGCCC GATGTCTCTT GCCTGGTTCT 240TGCTACGGGA CTCAACGATG GGCAGATCAA GATCTGGGAG GTGCAGACAG GGCTCCTGCT 300TTTGAATCTT TCCGGCCACC AAGATGTCGT GAGAGATCTG AGCTTCACAC CCAGTGGCAG 360TTTGATTTTG GTCTCCGCGT CACGGGATAA GACTCTTCGC ATCTGGGACC TGAATAAACA 420CGGTAAACAG ATTCAAGTGT TATCGGGCCA CCTGCAGTGG GTTTACTGCT GTTCCATCTC 480CCCAGACTGC AGCATGCTGT GCTCTGCAGC TGGAGAGAAG TCGGTCTTTC TATGGAGCAT 540GAGGTCCTAC ACGTTAATTC GGAAGCTAGA GGGCCATCAA AGCAGTGTTG TCTCTTGTGA 600CTTCTCCCCC GACTCTGCCC TGCTTGTCAC GGCTTCTTAC GATACCAATG TGATTATGTG 660GGACCCCTAC ACCGGCGAAA GGCTGAGGTC ACTCCACCAC ACCCAGGTTG ACCCCGCCAT 720GGATGACAGT GACGTCCACA TTAGCTCACT GAGATCTGTG TGCTTCTCTC CAGAAGGCTT 780GTACCTTGCC ACGGTGGCAG ATGACAGACT CCTCAGGATC TGGGCCCTGG AACTGAAAAC 840TCCCATTGCA TTTGCTCCTA TGACCAATGG GCTTTGCTGG CACATTTTTT CCACATGGTG 900GAGTCATTGC CACAGGGACA AGAGATGGCC ACGTCCAGTT CTGGACAGCT CCTAGGGTCC 960TGTCCTCACT GAAGCACTTA TGCCGGAAAG CCCTTCGAAG TTTCCTAACA ACTTACCAAG 1020TCCTAGCACT GCCAATCCCC AAGAAAATGA AAGAGTTCCT CACATACAGG ACTTTTTAAG 1080CAACACCACA TCTTGTGCTT CTTTGTAGCA GGGTAAATCG TCCTGTCAAA GGGAGTTGCT 1140GGAATAATGG GCCAAACATC TGGTCTTGCA TTGAAATAGC ATTTCTTTGG GATTGTGAAT 1200AGAATGTAGC AAAACCAGAT TCCAGTGTAC TAGTCATGGA TTTTTC 1246(2)关于SEQ ID NO23的信息(i)序列特征(A)长度422个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO23ACCATGGTTC CAAGTCCTCT CCCCTGTGGT CAAGTTGCCC GAATGTTGGG CCCAAGTGCC60TTTTCCTCCT TGGGCCTCCC CTTCTGACCT GCAGGACAGT TTTCCGGAGC CCATTTGGTA 120TGAGGTATTA ATTAGCCTTA ACTAAATTAC AGGGGACTCA GAGGCCGTGC TCCTGACCGA 180TCCAGACACT ATTTTTTTTT TTTTTTTTTA ACAATGGTGT GCATGTGCAG GAAATGACAA 240ATTTGTATGT CAGATTATAC AAGGATGTAT TCTTAAACCG CATGACTATT CAGATGGCTA 300CTGAGTTATC AGTGGCCATT TATTAGCATC ATATTTATTT GTATTTTCTC AACAGATGTT 360AAGGTACAAC TGTGTTTTTC TCGATTATCT AAAAACCATA GTACTTAAAT TGAAAAAAAA 420AA 422(2)关于SEQ ID NO24的信息(i)序列特征(A)长度2019个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO24GGCACGAGGC GGGGTCAGGG CGGAGGCTGA GGACCAAGTA GGCATGGCGG AGGGCGGGAC60CGGCCCCGAT GGACGGGCCG GCCCGGGACC CGCAGGTCCT AATCTGAAGG AGTGGCTGAG 120GGAGCAGTTC TGTGACCATC CACTGGAGCA CTGTGACGAT ACAAGACTCC ATGATGCAGC 180CTATGTAGGG GACCTCCAGA CCCTCAGGAA CCTACTGCAA GAGGAGAGCT ACCGGAGCCG 240CATCAATGAG AAGTCTGTCT GGTGCTGCGG CTGGCTTCCC TGCACACCAC TGAGGATCGC 300AGCCACTGCA GGCCATGGGA ACTGTGTGGA CTTCCTCATA CGCAAAGGGG CCGAGGTGGA 360CCTGGTGGAT GTCAAGGGGC AGACTGCCCT GTATGTGGCT GTAGTGAACG GGCACTTGGA 420GAGCACTGAG ATCCTTTTGG AAGCTGGTGC TGATCCCAAC GGCAGCCGGC ACCACCGCAG 480CACTCCTGTG TACCATGCCT YTCGTGTGGG TAGGGACGAC ATCCTGAAGG CTCTTATCAG 540GTATGGGGCA GATGTTGATG TCAACCATCA TCTGAATTCT GACACCCGGC CCCCTTTTTC 600ACGGCGGCTA ACCTCCTTGG TGGTCTGTCC TCTATACATC AGTGCTGCCT ACCATAACCT 660TCAGTGCTTC AGGCTGCTCT TGCAGGCTGG GGCAAATCCT GACTTCAATT GCAATGGCCC 720TGTCAACACC CAGGAGTTCT ACAGGGGATC CCCTGGGTGT GTCATGGATG CTGTCCTGCG 780CCATGGCTGT GAAGCAGCCT TCGTGAGTCT GTTGGTAGAG TTTGGAGCCA ACCTGAACCT 840GGTGAAGTGG GAATCCCTGG GCCCAGAGGC AAGAGGCAGA AGAAAGATGG ATCCTGAGGC 900CTTGCAGGTC TTTAAAGAGG CCAGAAGTAT TCCCAGGACC TTGCTGAGTT TGTGCCGGGT 960GGCTGTGAGA AGAGCTCTTG GCAAATACCG ACTGCATCTG GTTCCCTCGC TGCCGCTGCC 1020AGACCCCATA AAGAAGTTTT TGCTTTATGA GTAGCATTCA CATGCAGTGC TGACTGCAAT 1080GTGGAAGCCG ATCACCTGCA GTGAAAACTG ACACAGACTC TGGCATCCTG GGAACCATGG 1140CCTGTGCTGC CAGCTTGATC CTTGGCTGTC AGTGAAGAAA AAACGGCTGT GTTCTCTTGG 1200ACTGTGATTC TATCTCAGGT GCTTGGGCCA TCGAACGCTC CTTGAGTCAT TGTCAACTGA 1260GAGGCACATA CAAACTTAAT TTTGTTCCTC TTCAGTCTCT CTGTTTTGGA TTCTTCCTGG 1320CAATGTGTGC AGCATGGGCT GAGCCTGGTG ATTGCCCTAG TGGGGAAGGC TTTTTTCTCC 1380AGGCTATGCA TCTATTTATG TTCCTACTTT GCAATTTATT GTTCTTTTAA GGCTTGATAT 1440CAAAACAGAA AGAGGTTTGT TAAGAAAAGA TATAGGGAGA AAGGAATTCC GGTTCCGTGC 1500ACTTGCTAGC CTGCTTTCCT TGCCTGGGTT TGTCTGTCTA TGCTGCCTGG TGCACATCCC 1560TTCTCTTTGC TGCCACTGTT CTATTTTGGG AGTTGTCTTC CGTCTAAGAT GGCTTCTGGG 1620GTTCTATCTT ATTGCACAGA GGTCCCAGAA CAGTGTTCAT AGGGCACCAT CTGCTCTGCC 1680AAGGGTTTTC TGATGTCTTA CCCTGGGGAT CTTCAGACAG TGGTTACCTT TAGGAGACCC 1740ACCTGGAACT AACCATTAAG TGACTGCCCA CATTCAGATC AGGGACCATC TTAATAGTAC 1800TCACTGCCAG TCCTCACAAG AGAAGATGAC ACGGGTGCTC TCTTCAGACA CTCCCATACA 1860GGAAGTTGGA AAATGTCTTG GTCACCTGGG TTGTTCCCAG GCTACAACTT CTTGGTGTTC 1920CACTAARACC AGRATATCCT AGTTTTTTGG GTTGACTGTT CCCTCCCCAC TTTCCTTGAA 1980NCCCAATGCC CNTTTGTKTN GGTTGCTTCC CTAAAAKTT 2019(2)关于SEQ ID NO25的信息(i)序列特征(A)长度350个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO25Ala Arg Gly Gly Val Arg Ala Glu Ala Glu Asp Gln Val Gly Met Ala1 5 10 15Glu Gly Gly Thr Gly Pro Asp Gly Arg Ala Gly Pro Gly Pro Ala Gly20 25 30Pro Asn Leu Lys Glu Trp Leu Arg Glu Gln Phe Cys Asp His Pro Leu35 40 45Glu His Cys Asp Asp Thr Arg Leu His Asp Ala Ala Tyr Val Gly Asp50 55 60Leu Gln Thr Leu Arg Asn Leu Leu Gln Glu Glu Ser Tyr Arg Ser Arg65 70 75 80Ile Asn Glu Lys Ser Val Trp Cys Cys Gly Trp Leu Pro Cys Thr Pro85 90 95Leu Arg Ile Ala Ala Thr Ala Gly His Gly Asn Cys Val Asp Phe Leu100 105 110Ile Arg Lys Gly Ala Glu Val Asp Leu Val Asp Val Lys Gly Gln Thr115 120 125Ala Leu Tyr Val Ala Val Val Asn Gly His Leu Glu Ser Thr Glu Ile130 135 140Leu Leu Glu Ala Gly Ala Asp Pro Asn Gly Ser Arg His His Arg Ser145 150 155 160Thr Pro Val Tyr His Ala Xaa Arg Val Gly Arg Asp Asp Ile Leu Lys165 170 175Ala Leu Ile Arg Tyr Gly Ala Asp Val Asp Val Asn His His Leu Asn180 185 190Ser Asp Thr Arg Pro Pro Phe Ser Arg Arg Leu Thr Ser Leu Val Val195 200 205Cys Pro Leu Tyr Ile Ser Ala Ala Tyr His Asn Leu Gln Cys Phe Arg210 215 220Leu Leu Leu Gln Ala Gly Ala Asn Pro Asp Phe Asn Cys Asn Gly Pro225 230 235 240Val Asn Thr Gln Glu Phe Tyr Arg Gly Ser Pro Gly Cys Val Met Asp245 250 255Ala Val Leu Arg His Gly Cys Glu Ala Ala Phe Val Ser Leu Leu Val260 265 270Glu Phe Gly Ala Asn Leu Asn Leu Val Lys Trp Glu Ser Leu Gly Pro275 280 285Glu Ala Arg Gly Arg Arg Lys Met Asp Pro Glu Ala Leu Gln Val Phe290 295 300Lys Glu Ala Arg Ser Ile Pro Arg Thr Leu Leu Ser Leu Cys Arg Val305 310 315 320Ala Val Arg Arg Ala Leu Gly Lys Tyr Arg Leu His Leu Val Pro Ser325 330 335Leu Pro Leu Pro Asp Pro Ile Lys Lys Phe Leu Leu Tyr Glu340 345 350(2)关于SEQ ID NO26的信息(i)序列特征(A)长度419个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO26GCATCCATGG CGGAGGGCGG CAGCACGACG GGCGGGCAGG GCCGGGCTCC GCAGGTCGTA60ATCTGAAGGA GTGGCTGAGG GAGCAATTTT GTGATCATCC GCTGGAGCAC TGTGAGGACA 120CGAGGCTCCA TGATGCAGCT TACGTCGGGG ACCTCCAGAC CCTCAGGAGC CTATTGCAAG 180AGGAGAGCTA CCGGAGCCGC ATCAACGAGA AGTCTGTCTG GTGCTGTGGC TGGCTCCCCT 240GCACACCGTT GCGAATCGCG GCCACTGCAG GCCATGGGAG CTGTGTGGAC TTCCTCATCC 300GGAAGGGGGC CGAGGTGGAT CTGGTGGACG TAAAAGGACA GACGGCCCTG TATGTGGCTG 360TGGTGAACGG GCACCTAGAG AGTACCCAGA TCCTTCTCGA AGCTGGCGCG GACCCCAAC 419(2)关于SEQ ID NO27的信息(i)序列特征(A)长度595个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO27GAGGAAGAAG AAAAGTGGAC CCTGAGGCCT TGCAGGTCTT TAAAGAGGCC AGAAGTGTTC60CCAGAACCTT GCTGTGTCTG TGCCGTGTGG CTGTGAGAAG AGCTCTTGGC AAAACCGGCT 120TCATCTGATT CCTTCGCTGC CTCTGCCAGA CCCCATAAAG AAGTTTCTAC TCCATGAGTA 180GACTCCAAGT GCTGCGGTTG ATTCCAGTGA GGGAGAAAGT GATCTGCAGG GAGGTGGACA 240CCGAGCCCTG AGTGCTGTGC TGCTGCTGGT CTCCTGATGG CTGTTGCTGC AGAAGATGTC 300CTCGTAGACT GTCATTGCTC CTCAGGTGCC TGGGCCGCTG AACAGTCCTT GGGTCATTGT 360CAGCTGAGAG GCTTATACTA AAGTTATTAT TGTTTTTCCC AAGTTCTCTG TTCTGGATTT 420TCAGTTGCAT ATTAATGTAA CGGGCCATGG GGTATGTACA TGTAGGGGCT GAGGTTGGAG 480GCCTACTAAT TTCCTGTAGG GAAGACTCCC AGCACTTCTG GAACTGTGCT TCTCTTTATT 540TTTCTACTTC TCAATTTGAT GGTTCGATTA AAGCCTTCTA GTATCTCAAT GAAAA595(2)关于SEQ ID NO28的信息(i)序列特征(A)长度896个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置4..396(xi)序列描述SEQ ID NO28CTG ATG TCC GCA ATT CTG AAG GTT GGA CAC CAC TGC TGG CTG CCT GTG 48Met Ser Ala Ile Leu Lys Val Gly His His Cys Trp Leu Pro Val1 5 10 15ACA TCC GCT GTC AAT CCC CAA AGG ATG CTG AGG CCA CCA CCA ACC GCT 96Thr Ser Ala Val Asn Pro Gln Arg Met Leu Arg Pro Pro Pro Thr Ala20 25 30GTT TTC AAC TGT GCC GCT TGC TGC TGT CTG TGG GGG CAG ATG CTG ATG 144Val Phe Asn Cys Ala Ala Cys Cys Cys Leu Trp Gly Gln Met Leu Met35 40 45AAT ACA TAC CGT GTA GTT CAG CTT CCT GAG GAG GCC AAG GGC TTG GTG 192Asn Thr Tyr Arg Val Val Gln Leu Pro Glu Glu Ala Lys Gly Leu Val50 55 60CCA CCA GAG ATT CTA CAG AAG TAC CAT GGA TTC TAC TCT TCC CTC TTT 240Pro Pro Glu Ile Leu Gln Lys Tyr His Gly Phe Tyr Ser Ser Leu Phe65 70 75GCC TTG GTG AGG CAG CCC AGG TCG CTG CAG CAT CTC TGC CGT TGT GCG 288Ala Leu Val Arg Gln Pro Arg Ser Leu Gln His Leu Cys Arg Cys Ala80 85 90 95CTC CGC AGT CAC CTG GAG GGC TGT CTG CCC CAT GCA CTA CCG CGC CTT 336Leu Arg Ser His Leu Glu Gly Cys Leu Pro His Ala Leu Pro Arg Leu100 105 110CCC CTG CCA CCG CGC ATG CTC CGC TTT CTG CAG CTG GAC TTT GAG GAT 384Pro Leu Pro Pro Arg Met Leu Arg Phe Leu Gln Leu Asp Phe Glu Asp115 120 125CTG CTC TAC TAGGCTTGCT GCCCTGTGAA CAAAGCAGAC CCCACCCCCA 433Leu Leu Tyr130CCCCAAGGGC ATCTCTCAGC AATGAATGAT GCAAGGCGGT CTGTCTTCAA GTCAGGAGTG 493GACGCCTTGA TCCACACTTG AGAGAAGAGG CCAGATCAGC ACCYGGCTGG TAGTGATNGC 553AGAGGGCACC TGTGCAGATC TGTGTGCGCA CTGGAAATCT CTAGGCTGAA GGCYAGAGCA 613AATGGTGCAR GTGTTAGTCC TTGGGANGAG AGACAGANGG TGAGAAAGCA AGACAGAGGT 673GAGAGTGCAC ATGTCAAGTG GTAGATTGCC TTAAAAGAAA GCTAAAAAAA GAAAAAGATT 733CGGGCGAACT TCTTTAGGGG TAATGCTGCA GCGTGTTAAA CTGACTGACC AGCGTCCATA 793TCTTTGGACC CTTCCCGGGT GAAAAAGCCC CTTCATCCTC CAGCGCTCCC CAAGGGTGCT 853TAGCAATACC GGGTGCTTTT CTGCCGCAAA GTGAGTTACC AAA 896(2)关于SEQ ID NO29的信息(i)序列特征(A)长度130个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SE ID NO29Met Ser Ala Ile Leu Lys Val Gly His His Cys Trp Leu Pro Val Thr1 5 10 15Ser Ala Val Asn Pro Gln Arg Met Leu Arg Pro Pro Pro Thr Ala Val20 25 30Phe Asn Cys Ala Ala Cys Cys Cys Leu Trp Gly Gln Met Leu Met Asn35 40 45Thr Tyr Arg Val Val Gln Leu Pro Glu Glu Ala Lys Gly Leu Val Pro50 55 60Pro Glu Ile Leu Gln Lys Tyr His Gly Phe Tyr Ser Ser Leu Phe Ala65 70 75 80Leu Val Arg Gln Pro Arg Ser Leu Gln His Leu Cys Arg Cys Ala Leu85 90 95Arg Ser His Leu Glu Gly Cys Leu Pro His Ala Leu Pro Arg Leu Pro100 105 110Leu Pro Pro Arg Met Leu Arg Phe Leu Gln Leu Asp Phe Glu Asp Leu115 120 125Leu Tyr130(2)关于SEQ ID NO30的信息(i)序列特征(A)长度436个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO30GTGGGGGCGT CATCATGACC TCCTCTAGGG CTCTGCAACA TGACTCCTGT GGTGCAAATC60AACAAATTGT TCACTGATGA ATCCACAAGG ATCTCTGGGC CTACAACCAG GTCCTGGTCC 120ACATGACTGT CGTCTTCGGA GAAGGCACCA CTCGCCCCCG GCAGGTACGG CTGACACCTC 180CATGGGAGAA GACGTATCCA GGCAGCAGCT GCGCGGCCCT TCAAGAGGGC ACATCCCGTC 240ATCTAAAGGC ACGGTGTACT GAAGGTAGTC CTGAGACATG AGTCCGATTA CTACAGGCAC 300GTGTTCCTCC AGGTGGAGGC TCAGGTCCCC GGGTGAGCTG GGGCTGCAGC GGGACTCAGG 360GCGCGGCTCT GGCTGCAGGT CTCGCAGCTC CCTGGGCTGT AGCTCCCGCA GATCCTTGCG 420CACACCGTTG ACTGGT 436(2)关于SEQ ID NO31的信息(i)序列特征(A)长度2180个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO31TTAATAGTAC CTACATAGTA GAAAATTATA ACTCCACTTT AAAACAATGT TTTCTTTCTA60TTCAAATCAA TTTAAAACTT TTTATAAACA TTAATGTTGC AAGAGAATCC AGTCCATTTA 120TGAAAATTAG TTGACAATCA AGTTCACCCA AGAAAATGTT GACTAAGCTA AAGAAATCAC 180AGATAAAACA TTTTACCAAA AGGATAGGTA ACACACAAAA AAATGCTATC ACAGGAAGCT 240ATGATCATCT AATATTTCTT TAATAATAAT TCTAGTTCCA TAGGTTTTCA TGTTATGCCA 300ATTTGTACCC GAGTTTAATT ACAGAAAAGG CAACAATTTC TAAATTGGTG GTATACATTT 360CTTTACAATT TTTTAATGTA AGGCCATTTA TTAAAATAGA CAAACTAGAA GATGAAAACG 420AAGGCAACAG AAAAATTCAA CTTTTCACAA CCAAAAGAAT TAGCACAACC TTAGAAATAA 480TTTAGAAAAA AGTGTTGTTA AAAGATATGT TGCAGATCTC CGTTCCATTA CCCAAGATTA 540TGTCAATTCA CGATTCTAAA TAAATCTTTT TAAAGTAAGA GATTAAAAAC TCATCTTCAG 600TGTATATGTA AATTCCGTGG TTTTATCACA CAGGTATGTT TATTCAACAC TGCTTTGGAA 660ATGGACCATT TAAAAGGACA TGGCAATTTC CATTCTGTTA AGTTTCATTC AACCTTTACT 720TAGGGGTTGA TTACCACATG AAATGTGCTT TTAATGCATA AAAATCACAG TGGATTAGCC 780AGCAAAAGGG ACTGGGCGGG GGGGGCATTG AGGAGAATTT GATAATTCAC ATTGTGATTA 840TTCTGCACAT TGATGAAACA TAATTCACAC CTCTAAAACC TCAAGACTTC CCTTTTTTAA 900AGAACCAAAA TAAACCCAAG ACACCTTGCT GACACTTCCC CACCCCTAAA CAAACTGATG 960ACTCTTTTAC ACATAAAACT GAAATAGTTA TGGCAGCAAA AGATTTTGAT GGCAATGAAA 1020GTTTGTAAAC TGTATTTCAA TCTCTTGTTC TTATTCCCAA AGTGCAAGAT GCAGGGTTCT 1080CAATCTTTCA GTAGTGCTTC TCCTGTAAAT AATCCTTCAT TTTGTTTGGC AAAGGCAGTT 1140TCTGAATTAA GTCTATTCTG GTATACTGAC GTATAACAAA ACGACACAGG TACTGCAACG 1200AGCGCACCTA TGAACCCCGG AACACTGGTT GGCAAGTTCT GACGGAAGTG CAGATTCCAG 1260GCAGCGAGAC CTTGAATAAC AAAAAGCTCC CATTTTCAGA GTCCCTGATT GAATGCTCCA 1320ATTAGATCAA CTATGGACGT ATGTCCTTCC ACATCGGCTG TTCATAAAAG CTAAACCTAC 1380CATTTGAGTG CTCAATTCTA GTGTGAAGTG TTTTACCATG GGAGCGAAAG TCACAGCTTA 1440AAAGGTAACG GTCGTCAGAA CTGTCCCGAA CAAGAAAAGA ACCATCTGGC ACGTTTGCTA 1500GCTTCCCTTC TGCCTCCCAA CGTGTGATTG GTCCCCAGTA CCATCCTTGC TTTGCAAGTT 1560TTTTCAGCTC CTCTGTAAGG CTTGTCACAA CCATGGGACC ACTACTTTGC ACTGAGTCAT 1620AAACTCTTGC AACCCCAGGA GCAGAGTTCG GATCAAAATT CAAATGACAG CGCATAACTT 1680TCAGCCACGT GGGGCTTTCT GTCCAGTGAG TCCACTGAAA GTTCCCCTTT GGGATTTGGA 1740TTATTCCTGC ATTGGAGTAA CCAATGGTGA AGATTGGAGG GACATCCATC GTGAACCCGC 1800TCTCCGGGGT TCTGCAACAT GACTCCCGTG GTGCCAATCA ACAAGCCATT CACCGGACTG 1860ATCCACGAAG ATCTCTGGGG CGACAACTAG GTCCTGGTCT ACCTGACTCT CATCCTCGGG 1920GAAAGCGCGC CCTCCCACTT GAGGAGGAAC CGCAGAGACT TCCATGGGAG AAGAGCTGTC 1980CAGACAATAG CTCCGTGATC CTTCCAAAGG ATACATCCCC TCATCTAAAG GCACAGTATA 2040CTGAATGTAG TCCTGAGGCA TAAGTCCAAT AACGACAGGC ACATGTTCAT CCAGGTGAAG 2100ATGCAGGTCT CCATTATGAG AAGCCGAGCT CTTCAGTGAA TTGGCTTGCT CCTGGCACGT 2160GGTCTCAGAC TGGAGGTCGT 2180(2)关于SEQ ID NO32的信息(i)序列特征(A)长度2649个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO32GGCACGAGGC TGTGTCCAGC ACACAGAGAG GGCCCGGCCA TCTGCTTTGG TTCAGAGCCC60TGTGTCTGTC TGTCACTTAG ACTCTTCCTC CCGGCTCGCA GCTCACCCTC CATCCTCCTT 120ACTGGCTCCA GCATGACTCG CTTCTCTTAT GCAGAGTACT TTGCTCTGTT TCACTCTGGC 180TCTGCACCTT CCAGGTCCCC TTCGTCTCCC GAGAACCCAC CGGCCCGCGC ACCCCTGGGT 240CTGTTCCAAG GGGTCATGCA GAAGTATAGC AGCAACCTGT TCAAGACCTC CCAGATGGCG 300GCTATGGACC CCGTGCTGAA GGCCATCAAG GAAGGGGATG AAGAGGCCTT GAAGATCATG 360ATCCAGGATG GGAAGAATCT TGCAGAGCCC AACAAGGAGG GCTGGCTGCC GCTCCACGAG 420GCTGCCTACT ATGGCCAGCT GGGCTGCCTG AAAGTCCTGC AGCAAGCCTA CCCAGGGACC 480ATTGACCAAC GCACACTGCA GGAAGAGACA GCATTATACC TGGCCACATG CAGAGAACAC 540CTGGATTGCC TCCTGTCGCT GCTCCAGGCG GGGGCAGAGC CTGACATCTC TAACAAATCC 600AGGGAGACTC CACTTTACAA AGCCTGTGAG CGCAAGAACG CGGAGGCGGT GAGGATATTG 660GTGCGATACA ACGCAGACGC CAACCACCGC TGTAACAGGG GCTGGACCGC ACTGCACGAG 720TCTGTCTCCC GCAATGACCT GGAGGTCATG GAGATCCTAG TGAGTGGCGG GGCCAAGGTG 780GAGGCCAAGA ATGTCTACAG CATCACCCCT TTGTTTGTGG CTGCCCAGAG TGGGCAGCTG 840GAGGCCCTGA GGTTCCTGGC CAAGCATGGT GCAGACATCA ACACGCAGGC CAGTGACAGT 900GCATCAGCCC TCTACGAGGC CAGCAAGAAT GAGCATGAAG ACGTGGTAGA GTTTCTTCTC 960TCTCAGGGCG CCGATGCTAA CAAAGCCAAC AAGGACGGCC TGCTCCCCCT GCATGTTGCC 1020TCCAAGAAGG GCAACTATAG AATAGTGCAG ATGCTGCTGC CTGTGACCAG CCGCACGCGC 1080GTGCGCCGTA GCGGCATCAG CCCGCTGCAC CTAGCGGCCG AGCGCAACCA CGACGCGGTG 1140CTGGAGGCGC TGCTGGCCGC GCGCTTCGAC GTGAACGCAC CTCTGGCTCC CGAGCGCGCC 1200CGCCTCTACG AGGACCGCCG CAGTTCTGCG CTCTACTTCG CTGTGGTCAA CAACAATGTG 1260TACGCCACCG AGCTGTTGCT GCTGGCGGGC GCGGACCCCA ACCGCGATGT CATCAGCCCT 1320CTGCTCGTGG CCATCCGCCA CGGCTGCCTG CGCACCATGC AGCTGCTGTT GGACCATGGC 1380GCCAACATCG ACGCCTACAT CGCCACTCAC CCCACCGCCT TTCCAGCCAC CATCATGTTT 1440GCCATGAAGT GCCTGTCGTT ACTCAAGTTC CTTATGGACC TCGGCTGCGA TGGCGAGCCC 1500TGCTTCTCCT GCCTGTACGG CAACGGGCCG CACCACCCGC CCCGCGACCT GGCCGCTTCC 1560ACGACGCACC CGTGGACGAC AAGGCACCTA GCGTGGTGCA GTTCTGTGAG TTCCTGTCGG 1620CCCCGGAAGT GAGCCGCTGG GCGGGACCCA TCATCGATGT CCTCCTGGAC TATGTGGGCA 1680ACGTGCAGCT GTGCTCCCGG CTGAAGGAGC ACATCGACAG CTTTGAGGAC TGGGCTGTCA 1740TCAAGGAGAA GGCAGAACCT CCGAGACCTC TGGCTCACCT CTGCCGGCTG CGGGTTCGGA 1800AGGCCATAGG AAAATACCGG ATAAAACTCC TGGACACACT GCCGCTTCCC GGCAGGCTAA 1860TCAGATACTT GAAATATGAG AATACACAGT AACCAGCCTG GAGAGGAGAT GTGGCCTTCA 1920GACTGTTTCC GGGACGCCCC AGGTGGCCTG CATCCAGGAC CCCCTGGGGT CAGAACAGGT 1980GTGACCTTGC TGGTTCTTTG CTGGAGCTTC ACCCAAAGTG AGAACCTGAT GTGGGGAGTG 2040GACGTGGAAC CTCTGCTTTC ACACTGTCAG CGGATCGCAG ACCCGCTCTG CTTCTGGCCA 2100TAGCCAGAGA CCTTCAACCT GGGGCCAGGG GAGAGCTGGT CTGGGCAAGG TGGCCCAGGC 2160AGGAATCCTG GCCTTAAGCT GGAGAACTTG TAGGAATCCC TCACTGGACC CTCAGCTTTC 2220AGGCTGCGAG GGAGACGCCC AGCCCAAGTA TTTTATTTCC GTGACACAAT AACGTTGTAT 2280CAGAAAAAAA AAAAAACATG GGCGCAGCTT ATTCCTTAGT AGGGTATTTA CTTGCATGCG 2340CGCTTAAAGC TACTGGAAAC ATGCGTTCCA CTATGCTTGA GAATCCCCTT GCACTGGTAA 2400ACGAGAGCCG ACGTGCTTCA AGGTTGGATT TTTGGTTGCC CCTTTGGCGT TCCGCGGGTT 2460TGTCCGACGT AATTGACCCC GTGTTTTGTC ACTTTCGAGT GTTCCGACTA TTGGGGGGCT 2520TTTGGTTGTC CCCAAAATTG TGGGTGGTGT GCGGACGCCA CGAGAAGTGG TTCATGGGCG 2580ATAATCATTA CTGGAGAATG TAGAGCGGCG GTTTTACGAA TAAATATTTT TTAAGCCGCC 2640TTCCCAAAA 2649(2)关于SEQ ID NO33的信息(i)序列特征(A)长度495个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO33CCTCCTGAGA GTTCGCCGGC CCGGGCCCAA TGGGTTGTTC CAAGGGGTCA TGCAGAAATA60CAGCAGCAGC TTGTTCAAGA CCTCCCAGCT GGCGCCTGCG GACCCCTTGA TAAAGGCCAT 120CAAGGATGCG ATGAAGAGGC CTTGAAGACC ATGATCAAGG AAGGGAAGAA TCTCGCAGAG 180CCCAACAAGG AGGGCTGGCT GCCGCTGCAC GAGGCCGCAT ACTATGGCCA GGTGGGCTGC 240CTGAAAGTCC TGCAGCGAGC GTACCCAGGG ACCATCGACC AGCGCACCCT GCAGGAGGAA 300ACAGCCGTTT ACTTGGCAAC GTGCAGGGGC CACCTGGACT GTCTCCTGTC ACTGCTCCAA 360GCAGGGGCAG AGCGGGACAT CTCCAACAAA TCCCGAGAGA ACCGCTCTAC AAAGCCTGTG 420AGCGCAAGAA CGCGGAAGCC GTGAAGATTC TTGGTGCAGC ACAACGCAGA CACCAACAAC 480GCTGCAACCG GGCTG495(2)关于SEQ ID NO34的信息(i)序列特征(A)长度709个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO34GTGCAGCTCT GCTCGCGGCT GAAGGAACAC ATCGACAGCT TTGAGGACTG GGCCGTCATC 60AAGGAGAAGG CAGAACCTCC AAGACCTCTG GCTCACCTTT GCCGACTGCG GGTTCGAAAG120GCCATTGGGA AATACCGTAT AAAACTCCTA GACACCTTGC CGCTCCCAGG CAGGCTGATT180AGATACCTGA AATACGAGAA CACCCAGTAA CTGGGGCCAC GGGGAGAGAG GAGTAGCCCC240TCAGACTCTT CTTACTAAGT CTCAGGACGT CGGTGTTCCC AACTCCAAGG GGACCTGGTG300ACAGACGAGG CTGCAGGCTG CCTCCCTCTC AGCCTGGACA GCTACCAGGA TCTCACTGGG360TCTCAGGGCC CAGAGCTTTG GCCAGAGCAG AGAACAGAAT GTGTCAAGGA GAAGAATCAT420TTGTTTACAA ACTGATGAGC AGATCCCAGA CCTTCTCTAC CTTCAGGAAT GGCAGAAACC480TCTATTCCTG GGGCCAGGGC AGAGCTTGAG GTGTTCTGGG GAAGGTGGTG CTCAGAGCCT540TCCCTGTGCC CCTCCACTTG TTCTGGAAAA CTCACCACTT GACTTCAGAG CTTTCTCTCC600AAAGACTAAG ATGAAGACGT GGCCCAAGGT AGGGGGTAGG GGGAGCCTGG GTCTTGGAGG660GCTTTGTTAA GTATTAATAT AATAAATGTT ACACATGTGA AAAAAAAAA709(2)关于SEQ ID NO35的信息(i)序列特征(A)长度848个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(ix)特征(A)名称/关键CDS(B)位置1..624(xi)序列描述SEQ ID NO35TTG GAG AAG TGT GGT TGG TAT TGG GGG CCA ATG AAT TGG GAA GAT GCA48Leu Glu Lys Cys Gly Trp Tyr Trp Gly Pro Met Asn Trp Glu Asp Ala1 5 10 15GAG ATG AAG CTG AAA GGG AAA CCA GAT GGT TCT TTC CTG GTA CGA GAC96Glu Met Lys Leu Lys Gly Lys Pro Asp Gly Ser Phe Leu Val Arg Asp20 25 30AGT TCT GAT CCT CGT TAC ATC CTG AGC CTC AGT TTC CGA TCA CAG GGT 144Ser Ser Asp Pro Arg Tyr Ile Leu Ser Leu Ser Phe Arg Ser Gln Gly35 40 45ATC ACC CAC CAC ACT AGA ATG GAG CAC TAC AGA GGA ACC TTC AGC CTG 192Ile Thr His His Thr Arg Met Glu His Tyr Arg Gly Thr Phe Ser Leu50 55 60TGG TGT CAT CCC AAG TTT GAG GAC CGC TGT CAA TCT GTT GTA GAG TTT 240Trp Cys His Pro Lys Phe Glu Asp Arg Cys Gln Ser Val Val Glu Phe65 70 75 80ATT AAG AGA GCC ATT ATG CAC TCC AAG AAT GGA AAG TTT CTC TAT TTC 288Ile Lys Arg Ala Ile Met His Ser Lys Asn Gly Lys Phe Leu Tyr Phe85 90 95TTA AGA TCC AGG GTT CCA GGA CTG CCA CCA ACT CCT GTC CAG CTG CTC 336Leu Arg Ser Arg Val Pro Gly Leu Pro Pro Thr Pro Val Gln Leu Leu100 105 110TAT CCA GTG TCC CGA TTC AGC AAT GTC AAA TCC CTC CAG CAC CTT TGC 384Tyr Pro Val Ser Arg Phe Ser Asn Val Lys Ser Leu Gln His Leu Cys115 120 125AGA TTC CGG ATA CGA CAG CTC GTC AGG ATA GAT CAC ATC CCA GAT CTC 432Arg Phe Arg Ile Arg Gln Leu Val Arg Ile Asp His Ile Pro Asp Leu130 135 140CCA CTG CCT AAA CCT CTG ATC TCT TAT ATC CGA AAG TTC TAC TAC TAT 480Pro Leu Pro Lys Pro Leu Ile Ser Tyr Ile Arg Lys Phe Tyr Tyr Tyr145 150 155 160GAT CCT CAG GAA GAG GTA TAC CTG TCT CTA AAG GAA GCG CAG CGT CAG 528Asp Pro Gln Glu Glu Val Tyr Leu Ser Leu Lys Glu Ala Gln Arg Gln165 170 175TTT CCA AAC AGA AGC AAG AGG TGG AAC CCT CCA CGT AGC GAG GGG CTC 576Phe Pro Asn Arg Ser Lys Arg Trp Asn Pro Pro Arg Ser Glu Gly Leu180 185 190CCT GCT GGT CAC CAC CAA GGG CAT TTG GTT GCC AAG CTC CAG CTT TGAAGAACCA631Pro Ala Gly His His Gln Gly His Leu Val Ala Lys Leu Gln Leu195 200 205AATTAAGCTA CCATGAAAAG AAGAGGAAAA GTGAGGGAAC AGGAAGGTTG GGATTCTCTG 691TGCAGAGACT TTGGTTCCCC ACGCAAGCCC TGGGGCTTGG AAGAAGCACA TGACCGTACT 751CTGCGTGGGG CTCCACCTCA CACCCACCCC TGGGCATCTT AGGACTGGAG GGGCTCCTTG 811GAAAACTGGA AGAAGTCTCA ACACTGTTTC TTTTTCA848(2)关于SEQ ID NO36的信息(i)序列特征(A)长度207个氨基酸(B)类型氨基酸(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO36Leu Glu Lys Cys Gly Trp Tyr Trp Gly Pro Met Asn Trp Glu Asp Ala1 5 10 15Glu Met Lys Leu Lys Gly Lys Pro Asp Gly Ser Phe Leu Val Arg Asp20 25 30Ser Ser Asp Pro Arg Tyr Ile Leu Ser Leu Ser Phe Arg Ser Gln Gly35 40 45Ile Thr His His Thr Arg Met Glu His Tyr Arg Gly Thr Phe Ser Leu50 55 60Trp Cys His Pro Lys Phe Glu Asp Arg Cys Gln Ser Val Val Glu Phe65 70 75 80Ile Lys Arg Ala Ile Met His Ser Lys Asn Gly Lys Phe Leu Tyr Phe85 90 95Leu Arg Ser Arg Val Pro Gly Leu Pro Pro Thr Pro Val Gln Leu Leu100 105 110Tyr Pro Val Ser Arg Phe Ser Asn Val Lys Ser Leu Gln His Leu Cys115 120 125Arg Phe Arg Ile Arg Gln Leu Val Arg Ile Asp His Ile Pro Asp Leu130 135 140Pro Leu Pro Lys Pro Leu Ile Ser Tyr Ile Arg Lys Phe Tyr Tyr Tyr145 150 155 160Asp Pro Gln Glu Glu Val Tyr Leu Ser Leu Lys Glu Ala Gln Arg Gln165 170 175Phe Pro Asn Arg Ser Lys Arg Trp Asn Pro Pro Arg Ser Glu Gly Leu180 185 190Pro Ala Gly His His Gln Gly His Leu Val Ala Lys Leu Gln Leu195 200 205(2)关于SEQ ID NO37的信息(i)序列特征(A)长度464个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO37GTTCCAAGCC TAACCCATCT TTGTCGTTTG GAAATTCGGG CCAGTCTAAA AGCAGAGCAC 60CTTCACTCTG ACATTTTCAT CCATCAGTTG CCACTTCCCA GAAGTCTGCA GAACTATTTG120CTCTATGAAG AGGTTTTAAG AATGAATGAG ATTCTAGAAC CAGCAGCTAA TCAGGATGGA180GAAACCAGCA AGGCCACCTG ACACAGGTCC TTTAATTCTG TTTAGTCACA AAAGACGGCT240TGTGTGACTG TTTGGATTTG GTGATCAAAT GTCCATGTTT ACAGTTGCTT TTCCCAGTTT300GTGTCTTTCC CAATATTGTG AACCTTATCC ATCTTGCCTT ACTCAGTTTT ATTTCTAGTG360CACTTTGTTG TGTATTATTT GTTTACCTGA CCATTTTCTA CTTTATTCTG CTAATAAACT420GTAATTCTGA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA 464(2)关于SEQ ID NO38的信息(i)序列特征(A)长度747个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO38GGGGATCGAA AGCGGGGGCT TCTGGGACGC AGCTCTGGAG ACGCGGCCTC GGACCAGCCA60TTTCGGTGTA GAAGTGGCAG CACGGCAGAC TGGTCAAACA AATGGATTTT ACAGAGGCTT 120ACGCGGACAC GTGCTCTACA GTTGGACTTG CTGCCAGGGA AGGCAATGTT AAAGTCTTAA 180GGAAACTGCT CAAAAAGGGC CGAAGTGTCG ATGTTGCTGA TAACAGGGGA TGGATGCCAA 240TTCATGAAGC AGCTTATCAC AACTCTGTAG AATGTTTGCA AATGTTAATT AATGCAGATT 300CATCTGAAAA CTACATTAAG ATGAAGACCT TTGAAGGTTT CTGTGCTTTG CATCTCGCTG 360CAAGTCAAGG ACATTGGAAA ATCGTACAGA TTCTTTTAGA AGCTGGGGCA GATCCTAATG 420CAACTACTTT AGAAGAAACG ACACCATTGT TTTTAGCTGT TGAAAATGGA CAGATAGATG 480TGTTAAGGCT GTTGCTTCAA CACGGAGCAA ATGTTAATGG ATCCCATTCT ATGTGTGGAT 540GGAACTCCTT GCACCAGGCT TCTTTTCAGG AAAATGCTGA GATCATAAAA TTGCTTCTTA 600GAAAAGGAGC AAACAAGGAA TGCCAGGATG ACTTTGGAAT CACACCTTTA TTTGTGGCTG 660CTCAGTATGG CCAAGCTAGA AAGCTTTGAA GCATACTTAT TTCATCCGGG TGCAAATGTC 720AATTGTCAAG CCTTGGACAA AGCTACC 747(2)关于SEQ ID NO39的信息(i)序列特征(A)长度1018个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO39CACAAATGGG ACCATACAAA AATCTTGGAC TTGTTAATAA CCACTTACTA ACCGGGACCT60GTGACACTGG GCTAAACAAA GTAAGTCCCT GTTTACTCAG CAGTGTTTGG GGGACATGAA 120GGATTGCCTA GAAATATTAC TCCGGAATGG TCTACAGCCC AGACGCCCAG GCGTGCCTTG 180TTTTTGGATT CAGTTCTCCT GTGTGCATGG CTTTCCAAAA GGAGGTGGAG CTGTAGTTCT 240TTGGAATTGT GAACATTCTT TTGAAATATG GAGCCCAGAT AAATGAACTT CATTTGGCAT 300ACTGCCTGAA GTACGAGAAG TTTTCGATAT TTCGCTACTT TTTGAGGAAA GGTTGCTCAT 360TGGGACCATG GAACCATATA TATGAATTTG TAAATCATGC AATTAAAGCA CAAGCAAAAT 420ATAAGGAGTG GTTGCCACAT CTTCTGGTTG CTGGATTTGA CCCACTGATT CTACTGTGCA 480ATTCTTGGAT TGACTCAGTC AGCATTGACA CCCTTATCTT CACTTTGGAG TTTACTAATT 540GGAAGACACT TGCACCAGCT GTTGAAAGGA TGCTCTCTGC TCGTGCCTCA AACGCTTGGA 600TTCTACAGCA ACATATTGCC CACTGTTCCA TCCCTGACCC ATCTTTGTCG TTTGGAAATT 660CGGTCCAGTC TAAAATCAGA ACGTCTACGG TCTGACAGTT ATATTAGTCA GCTGCCACTT 720CCCAGAAGCC TACATAATTA TTTGCTCTAT GAAGACGTTC TGAGGATGTA TGAAGTTCCA 780GAACTGGCAG CTATTCAAGA TGGATAAATC AGTGAAACTA CTTAACACAG CTAATTTTTT 840TCTCTGAAAA ATCATCGAGA CAAAAGAGCC ACAGAGTACA AGTTTTTATG ATTTTATAGT 900CAAAAGATGA TTATTGATTG TCAGATAGGT TAGGTTTTGG GGGGCCAGTA GTTCAGTGAG 960AATGTTTATG TTTACAACTA GCCTTCCCAG TAAAAAAAAA AAAAAAAAAA AAAAAAAA1018(2)关于SEQ ID NO40的信息(i)序列特征(A)长度1897个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO40CGGGGGGCTG GGACCTGGGG CGTAACCGTC TCTACCACGA CGGCAAGAAC CAGCCAAGTA60AAACATACCC AGCCTTTCTG GAGCCGGACG AGACATTCAT TGTCCCTGAC TCCTTTTTCG 120TGGCCCTGGA CATGRATGAT GGGACCTTAA GTTTCATCGT GGATGGACAG TACATGGGAG 180TGGCTTTCCG GGGACTCAAG GGTAAAAAGC TGTATCCTGT AGTGAGTGCC GTCTGGGGCC 240ACTGTGAGAT CCGCATGCGC TACTTGAACG GACTTGATCC TGAGCCCCTG CCACTCATGG 300ACCTGTGCCG GCGTTCGGTG CGCCTAGCGC TGGGAAAAGA GCGCCTGGGT GCCATCCCCG 360CTCTGCCGCT ACCTGCCTCC CTCAAAGCCT ACCTCCTCTA CCAGTGATCC ACATCCCAGG 420ACCGCCATAC GACAGCCATC TGGTGCCAAR TCACTGAGCC CGTTGGGGTC CGCCGACCCC 480TGCGCCTGGG ATGGAAGCCC ACCTCAGCCA TGGGCAGACG TGCCCCCTCA TCCTACCGGC 540TGCCTCTGCT GGGGGAACCT ATGCCAACGG ACTTCTCCCT TCCCAACACT GGCTGAAGCA600GCAGCACCCA GGCCCTTCCC TGAACCAGAT GCAGAGAATA AACTATGAAA ACCTCTCTCA660GGCGCCTTCT GCTCTCAGGT GGAGTGGGCT GCCCCCCACT CTCTGCAGAG AGAGGCTACA720CCCACCTGGG GGGTCCTGGG AGGTAAGACT AGTAGGAGGT GCCAGGGCTG ARTCCAAAAG780CAGGAATGGC CAGGAMCAGG CCATACAGAT GAAGCTCAGG ATGTCACATA CCATGGACAM840TGAGACAGAA CCCCAGGTTG GAMTTCCCTT GGGCCAACGA GTGCCAGCTT TAATGTCAGC900TGCMGGTGCT CTGTGGCCTG TATTTATTCT TTAAACAGTA GCAAAGGCCA TTTATTTATT960CCACTTAGAA AGGAAACCTT GGTGGGTGGY TTCCCTCGAT GTGCTTTCCC CCACCTCCCT 1020GGAATGTGTG TGCCACACCT GTCCTTGTCC CAGGCCAGGA CTGTGGCACA TGAGCTGGTG 1080TGCACAGATA CACGTATGTC GTCGTGCATG ACCCCTGACT AGTTCCTAAG TAGCCCTGCA 1140CCAAGCACCA GAGCAGACCC CAAGAGAGGC CCGTGCAAGT CCCCATGTCC CCAGGTCCCT 1200GCTTCTGTTG CCTTGGGACT CATACACCGG CACACGTGTT TCAGCCTCTT GACTTCCATG 1260AGCTTCGAAT TTTGCCCCCG ATTCTTCTGA TATTTCCCAT TGGCATCCTC CAAAGCTCTG 1320GGCCTGGAGG GCATTAGGAC ACATGGAATG AGTGGGGTCT CCAGCCCCTG GGAAAGCCAC 1380TGGCAAGGCA GGATTAGAAA GACCAAGAGC AGGGTGGGGC GCCATGAAGC CTGTATGCCT 1440CTCAGGCTCA AGACCCCGCC ACACACCCAC TCAAGCCTCA GAAGTGGTGT GTAGGGCAGC 1500CCCAGGAGAG GAATGCCTGT CCTAGCAGCA CGTACATGGA GCACCCCACA TGTGCTCCAG 1560CCCTCTGGCT GTTTCTCTTG CTCTAGAATC AACTCCCTAC ATTGGGAATG TAGCCATTTG 1620GTAGAGGACT TGCCTAGCCT GCAGGAAGCT CACGTTCCAT CCCCTGCACC AAGGAGAATC 1680AAAGCTCAGG AGGCTGAGGC AGGAGGATTG CTGTCAGTGG TGTACAGAGG TCATGGCCAT 1740CCTGGGCTAT ATTAAACCTT GTCCTTTAAG AAAAAGAAAA GAAATCAACT TCCATTGAAT 1800CTGAGTTCTG CTCATTTCTG CACAGGTACA ATAGATGACT TKATTTGTTG AAAAATGKTT 1860AATATATTTA CMTATATATA TATTTGTAAG AAGCATT1897(2)关于SEQ ID NO41的信息(i)序列特征(A)长度134个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO41Gly Gly Trp Asp Leu Gly Arg Asn Arg Leu Tyr His Asp Gly Lys Asn1 5 10 15Gln Pro Ser Lys Thr Tyr Pro Ala Phe Leu Glu Pro Asp Glu Thr Phe20 25 30Ile Val Pro Asp Ser Phe Phe Val Ala Leu Asp Met Xaa Asp Gly Thr35 40 45Leu Ser Phe Ile Val Asp Gly Gln Tyr Met Gly Val Ala Phe Arg Gly50 55 60Leu Lys Gly Lys Lys Leu Tyr Pro Val Val Ser Ala Val Trp Gly His65 70 75 80Cys Glu Ile Arg Met Arg Tyr Leu Asn Gly Leu Asp Pro Glu Pro Leu85 90 95Pro Leu Met Asp Leu Cys Arg Arg Ser Val Arg Leu Ala Leu Gly Lys100 105 110Glu Arg Leu Gly Ala Ile Pro Ala Leu Pro Leu Pro Ala Ser Leu Lys115 120 125Ala Tyr Leu Leu Tyr Gln130(2)关于SEQ ID NO42的信息(i)序列特征(A)长度265个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO42AAGGGTAAAA AACTGTATCC TGTAGTGAGT GCCGTCTGGG GCCACTGTAG ATCCGAATGC 60GCTACTTGAA CGGACTCGAT CCCGAGACTG CCGCTCATGG ATTTGTGCCG TCGCTCGGTG120CGCCTGGCCC TGGGGAGGGA GCGCCTGGGG GAGAACCACA CCTGCCGCTG CCGGCTTCCC180TCAAGGCCTA CCTCCTCTAC CAGTGACGTT CGCCATCATA CCGCCAGCGC GACAGCCACC240TGGTGCCAAC TCACTGAGCC GCCTG 265(2)关于SEQ ID NO43的信息(i)序列特征(A)长度2438个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO43AAGTGGCGGC GGTCCCTGGA GAGCAGGCGG AGGCAGCGGC AAGTCTGACT CTGGGCTGAC 60CGTGGAGCCG GGGCGGGGGC TGACAGCCAG GCCTCCGCCT GGCGGGAGCC GCACGAGGAG120CGGGAGTGGC CGGGCCTCTC TTCCGCGCTT GAGCGAGCGC CGGGTGATGG CGGTGGTGAT180GGCGGCAGGC GCTCGGACAG CTCCGCTTGA GCTGAGCTCG GAGAGATCCG TCCAGAAAGT240GCCCAGAAGA AACTTCCTCT TAGAAAAGCT GAAAAACACA RTATTTATAA CACTGGAAAT 300TGTAAAGAAT TTGTTTAAAA TGGCTGAAAA CAATAGTAAA AATGTAGATG TACGGCCTAA 360AACAAGTCGG AGTCGAAGTG CTGACAGGAA GGATGGTTAT GTGTGGAGTG GAAAGAAGTT 420GTCTTGGTCC AAAAAGAGTG AGAGTTGTTC TGAATCTGAA GCCATAGGTA CTGTTGAGAA 480TGTTGAAATT CCTCTAAGAA GCCAAGAAAG GCAGCTTAGC TGTTCGTCCA TTGAGTTGGA 540CTTAGATCAT TCCTGTGGGC ATAGATTTTT AGGCCGATCC CTTAAACAGA AACTGCAAGA 600TGCGGTGGGG CAGTGTTTTC CAATAAAGAA TTGTAGTGGC CGACACTCTC CAGGGCTTCC 660ATCTAAAAGA AAGATTCATA TCAGTGAACT CATGTTAGAT AAGTGCCCTT TCCCACCTCG 720CTCAGATTTA GCCTTTAGGT GGCATTTTAT TAAACGACAC ACTGTTCCTA TGAGTCCCAA 780CTCAGATGAA TGGGTGAGTG CAGACCTGTC TGAGAGGAAA CTGAGAGATG CTCAGCTGAA 840ACGAAGAAAC ACAGAAGATG ACATACCCTG TTTCTCACAT ACCAATGGCC AGCCTTGTGT 900CATAACTGCC AACAGTGCTT CGTGTACAGG TGGTCACATA ACTGGTTCTA TGATGAACTT 960GGTCACAAAC AACAGCATAG AAGACAGTGA CATGGATTCA GAGGATGAAA TTATAACGCT 1020GTGCACAAGC TCCAGAAAAA GGAATAAGCC CAGGTGGGAA ATGGAAGAGG AGATCCTGCA 1080GTTGGAGGCA CCTCCTAAGT TCCACACCCA GATCGACTAC GTCCACTGCC TTGTTCCAGA 1140CCTCCTTCAG ATCAGTAACA ATCCGTGCTA CTGGGGTGTC ATGGACAAAT ATGCAGCCGA 1200AGCTCTGCTG GAAGGAAAGC CAGAGGGCAC CTTTTTACTT CGAGATTCAG CGCAGGAAGA 1260TTATTTATTC TCTGTTAGTT TTAGACGCTA CAGTCGTTCT CTTCATGCTA GAATTGAGCA 1320GTGGAATCAT AACTTTAGCT TTGATGCCCA TGATCCTTGT GTCTTCCATT CTCCTGATAT 1380TACTGGGCTC CTGGAACACT ATAAGGACCC CAGTGCCTGT ATGTTCTTTG AGCCGCTCTT 1440GTCCACTCCC TTAATCCGGA CGTTCCCCTT TTCCTTGCAG CATATTTGCA GAACGGTTAT 1500TTGTAATTGT ACGACTTACG ATGGCATCGA TGCCCTTCCC ATTCCTTCGC CTATGAAATT 1560GTATCTGAAG GAATACCATT ATAAATCAAA AGTTAGGTTA CTCAGGATTG ATGTGCCAGA 1620GCAGCAGTGA TGCGGAGAGG TTAGAATGTC GACCTGCATA CATATTTTCA TTTAATATTT 1680TATTTTTCTT ATGCCTCTTT GAATTTTTGT ACAAAGGCAG TTGAATCAAA TAAAACTGTG 1740CCCTAAGTTT TAATTCCAGA TCAATTTATT TTTTTTATGA TACACTTGTT ATATATTTTT 1800AAGCAGGTGT TTGGTTTTGT TTTTACCATA TAAATTTACA TATGGTCCAG GCATATTTAC 1860AATTTCAAGG CATTGCATAT ACATTTGAAT ATTCTGTATT TTTTAAATAA TCTTTTGTTC 1920TTTCCTATGT GTGAAATATT TTGCTAATCT ATGCTATCAG TATTCTTGTA TGACCGAATA 1980GTTACCTATT CTCTTTTCAT CTTGAAGATT TTCAGTAAAG AGTGTTGTAA TCAATCCATT 2040ATAATGTAAT TGACTTTTGT AATTTGCCAA TAGGAGTGTT AAACAACAAA ATGATTTAAA 2100ATGAAACTTA ATGTATTTTC ATTTTAAATA TTAACTAAAC CAAGTTTGTT TGTTAGTTAT 2160TCTAGCCAAT AAGAAAAGAG AATGTAGCAT CCTAGAGGTG TATTTGTTCT GCAGTTTGGC 2220AGGACCGTCA GTTAGTCCAA ATAAACATCC CCTCAGCGTG GAGGCGAATG GAACCTGTGC 2280TCCTTTCTTA CGGGAAGCTT TGCAAAGCAA AATAGCAGGG TTACAAGCTT GGAGTTGTTA 2340AGGCAACTAG AGTTTTCTCT ATTAATTTAT AGACTGTTGT TGCACCTACT TAGCTCTTTT 2400TTGGGAACTC TAGTTCCCAG GGGAAAATAC CTCGTGCC 2438(2)关于SEQ ID NO44的信息(i)序列特征(A)长度542个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO44Ser Gly Gly Gly Pro Trp Arg Ala Gly Gly Gly Ser Gly Lys Ser Asp1 5 10 15Ser Gly Leu Thr Val Glu Pro Gly Arg Gly Leu Thr Ala Arg Pro Pro20 25 30Pro Gly Gly Ser Arg Thr Arg Ser Gly Ser Gly Arg Ala Ser Leu Pro35 40 45Arg Leu Ser Glu Arg Arg Val Met Ala Val Val Met Ala Ala Gly Ala50 55 60Arg Thr Ala Pro Leu Glu Leu Ser Ser Glu Arg Ser Val Gln Lys Val65 70 75 80Pro Arg Arg Asn Phe Leu Leu Glu Lys Leu Lys Asn Thr Xaa Phe Ile85 90 95Thr Leu Glu Ile Val Lys Asn Leu Phe Lys Met Ala Glu Asn Asn Ser100 105 110Lys Asn Val Asp Val Arg Pro Lys Thr Ser Arg Ser Arg Ser Ala Asp115 120 125Arg Lys Asp Gly Tyr Val Trp Ser Gly Lys Lys Leu Ser Trp Ser Lys130 135 140Lys Ser Glu Ser Cys Ser Glu Ser Glu Ala Ile Gly Thr Val Glu Asn145 150 155 160Val Glu Ile Pro Leu Arg Ser Gln Glu Arg Gln Leu Ser Cys Ser Ser165 170 175Ile Glu Leu Asp Leu Asp His Ser Cys Gly His Arg Phe Leu Gly Arg180 185 190Ser Leu Lys Gln Lys Leu Gln Asp Ala Val Gly Gln Cys Phe Pro Ile195 200 205Lys Asn Cys Ser Gly Arg His Ser Pro Gly Leu Pro Ser Lys Arg Lys210 215 220Ile His Ile Ser Glu Leu Met Leu Asp Lys Cys Pro Phe Pro Pro Arg225 230 235 240Ser Asp Leu Ala Phe Arg Trp His Phe Ile Lys Arg His Thr Val Pro245 250 255Met Ser Pro Asn Ser Asp Glu Trp Val Ser Ala Asp Leu Ser Glu Arg260 265 270Lys Leu Arg Asp Ala Gln Leu Lys Arg Arg Asn Thr Glu Asp Asp Ile275 280 285Pro Cys Phe Ser His Thr Asn Gly Gln Pro Cys Val Ile Thr Ala Asn290 295 300Ser Ala Ser Cys Thr Gly Gly His Ile Thr Gly Ser Met Met Asn Leu305 310 315 320Val Thr Asn Asn Ser Ile Glu Asp Ser Asp Met Asp Ser Glu Asp Glu325 330 335Ile Ile Thr Leu Cys Thr Ser Ser Arg Lys Arg Asn Lys Pro Arg Trp340 345 350Glu Met Glu Glu Glu Ile Leu Gln Leu Glu Ala Pro Pro Lys Phe His355 360 365Thr Gln Ile Asp Tyr Val His Cys Leu Val Pro Asp Leu Leu Gln Ile370 375 380Ser Asn Asn Pro Cys Tyr Trp Gly Val Met Asp Lys Tyr Ala Ala Glu385 390 395 400Ala Leu Leu Glu Gly Lys Pro Glu Gly Thr Phe Leu Leu Arg Asp Ser405 410 415Ala Gln Glu Asp Tyr Leu Phe Ser Val Ser Phe Arg Arg Tyr Ser Arg420 425 430Ser Leu His Ala Arg Ile Glu Gln Trp Asn His Asn Phe Ser Phe Asp435 440 445Ala His Asp Pro Cys Val Phe His Ser Pro Asp Ile Thr Gly Leu Leu450 455 460Glu His Tyr Lys Asp Pro Ser Ala Cys Met Phe Phe Glu Pro Leu Leu465 470 475 480Ser Thr Pro Leu Ile Arg Thr Phe Pro Phe Ser Leu Gln His Ile Cys485 490 495Arg Thr Val Ile Cys Asn Cys Thr Thr Tyr Asp Gly Ile Asp Ala Leu500 505 510Pro Ile Pro Ser Pro Met Lys Leu Tyr Leu Lys Glu Tyr His Tyr Lys515 520 525Ser Lys Val Arg Leu Leu Arg Ile Asp Va1 Pro Glu Gln Gln530 535 540(2)关于SEQ ID NO45的信息(i)序列特征(A)长度4999个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO45CCCTCTGGGC AAGCCGCCCC CCCCCCACCC ATCTACCACA CACACACACA CACACACACA60CACACATTCA GACCTTGGGG CAAAAACAAA GCAAAATAAC AACAACAAAA ACACTGCCTG 120TGGAAAGTCC TTACTTCAGG AAGGTTGGCA GATGAGGAGC AAGGGAACAT TTTATCAGGA 180CTGCCACAAA GGAGTCTTTT TTTTTAATGG TTTTTCAAGA CAGGGTTTCT CTGTATAGCC 240CTGGCTGTCC TGGAGCTCAC TTTGTAGACC AGGCTGGCCT CGAACTCAGA AATTCGCCTG 300CCTCTGCCTC CTGAGTGCTG GGATTAAAGG CGTGCAGCAC CATGTCCAAC TGGCATTTTC 360TCAATTAAGG TTCGTTCCTT TCAGATAACT CTAGGTTCTG GGTCAAGCTG ACACAAGGCT 420ACACAGCACA GTTTGTATGC CACATTCAGT TCAGAAGACA CCCAACCTCC CTGGAACTGG 480AACTTATGCA CATTTGTGAG CTTCCACTTG GGAGTGGGAA CCTGAACTGG GTCCTCTGCA 540AGAGCAGCCG TGCTCTTAAC TGCTGAGCCA TTTCAGCAGC CTCACATCAG AATTAAGTTA 600GAAATTAGCCG GGTATGAATC ATACCCTTAG AATCCTAGCA TCTGAAAGCA GAGCTAAGAG660AAACAGGGAT TCAAGACCAG CTCTTGGCTA CAGAGCCCGT CCTGTCCTAG GATGGGCTAC 720AAGAGACTAT TTCAAAGCCA TCCAAACAAC AATAACTACA ACAACAACAA GGTTAAAATT 780AGGCTGGGCA CAGGGTACAC ACCTTTAATG CCAACACTCA GGAGGCAGAG GCAGGCTGAT 840CAGTGTGAGT TTGAGTTCAA CGTGGTCTAC ATAGGGAGTT CTAGGCCAGC AGAGGTTACA 900GTCTCTCTCT CTCTCTCTCT CTCTCTCTCT CTCTCACACA CACACACACA CACACACACA 960CACACACACA CACACACGGT GGCATTATGG GATTTTTTTG GGATAAGGTT TCTCTGTCTA 1020GCCCTGGCAT AGATTCACTC TGTAGACTAG GCTAGCCTTG AACTCAGAGA TCCGCCTGCC 1080TCTGCCTCCC AAGTGCTGGG ATTATAGGTG TTGCACCACC ACTGCCCAGC CACTTTGGGA 1140TTTTTGAACT GTTATCAAGA GGCTTTCGAG GAGGTCAAAC TTCAACAGCA ACCTCTCCAT 1200GATAATGTAG CTAATGATCA AACGACACTC AAAACTTAAC CCTTAAAGCA CACATCCACC 1260AGACAGCGTG CCCACTCGTA GTTCCATTAC TCAGGAGGCT GAAGCAGGAG GATGAAGGAC 1320TAAGGCTTCA GCAACCTAGG GAGCCGCAGG GGACAGTAGT CTCAATCCCT ACATTCTCCT 1380GAACACAGGA GCAGGAGTTC AGGAAGGGTG TCAAGGCCGC TTACTGATCT TAGGGCCTCA 1440GGAATGACTA GCTCAGGCAG AGAGAGCAAA GGTCTCCAGT GGAGAAGTCT ACACACACAC 1500ACACACACAC ACACACACAC ACACACACAC AGAATCCAAG GCGATGACGT CATCAAAGGG 1560TTAATTCTAG TCTGGGATGG GGGGGAGGGT GGGGCACGCA GCTGTCAGGT GGCTTTGGAA 1620AAATAAACTG CTGAAGAGTC TGACGCCAGG GAGTCCTGGG AGGGACAAGA GGTTACCCAC 1680TCAAAGAGTG TGCTCCACAA AGCATGCGCG CTTGTCCACG TCTGGAGTCG TCACTTATTT 1740TTTGCCTGGA TTCTTTGTAG CCGGTGGGTT CTCAAGGCGG TAAGTGGTGT GGCCGCCGTG 1800GTCTGGGAGG TGACGATAGG GTTAATCGTC CACAGAGCCC AGGGGCGGAG CGCGGGCGGG 1860CGTCCGCAGC CCCGCTGGAG CCGGAAGCAG TGGCTGGTCA GGGGCGCTTC TAGCCTTCCC 1920TATCTGTACT TCCACAGAGG TCTCTGCGAG CTAGGGGGAC AGTGAGGTGC GGGGTAGGGG 1980CCCGGCGTTA GAGCCAGCAA GGGGACGGTT CACGGTAAGG TCTGAGGGAG AGAGAGCTCC 2040TGAGAAACTT GGGGGGCGCG ACACAGATAG GGTGAAAGCA GAGTGATAGA CCTGGGATGG 2100TTAGGGGACC AAGGGAAGAC CAGGCTGGTT GGCATACACC GGTGAACGGA TGGGAGTCCT 2160AGGGAAAGAT GATGCGCCTA ACAGTCCTTT CTGTCTCCAC ACCACTCCAG GGGACGATCC 2220GGAGCTCAAC TTTCAAAAGC GAGACGCCCC AGCAAGCCTG TTTTGAGAAG TTCTTCAGCG 2280GCTCTCCTCA TGGGCCAGAC GGCCCTGGCA AGGGGCAGCA GCAGCACCCC TACCTCGCAG 2340GCTCTGTACT CGGACTTCTC TCCTCCCGAG GGCTTGGAGG AGCTCCTGTC TGCTCCCCCT 2400CCTGACCTGG TTGCCCAACG GCACCACGGC TGGAACCCCA AGGATTGCTC CGAGAACATC 2460GATGTCAAGG AAGGGGGTCT GTGCTTTGAG CGGCGCCCTG TGGCCCAGAG CACTGATGGA 2520GTCCGGGGGA AACGGGGCTA TTCGAGAGGT CTGCACGCCT GGGAGATCAG CTGGCCCCTG 2580GAGCAAAGGG GCACACACGC CGTGGTGGGC GTGGCCACCG CCCTCGCCCC GCTGCAGGCT 2640GACCACTATG CGGCGCTTTT GGGCAGCAAC AGCGAGTCCT GGGGCTGGGA TATTGGGCGG 2700GGAAAATTGT ATCATCAGAG TAAGGGCCTC GAGGCCCCCC AGTATCCAGC TGGACCTCAG 2760GGTGAGCAGC TAGTGGTGCC AGAGAGACTG CTGGTGGTTC TGGACATGGA GGAGGGGACT 2820CTTGGCTACT CTATTGGGGG CACGTACCTG GGACCAGCCT TCCGTGGACT GAAGGGGAGG 2880ACCCTCTATC CCTCTGTAAG TGCTGTTTGG GGCCAGTGCC AGGTCCGCAT CCGCTACATG 2940GGCGAAAGAA GAGGTGAGAT ACGGACTAGG TGTGGGGAGA TCACTACTCT TGGCAATGGT 3000TTGGGCTGGA AACTCATGGT TGGAGCACAG GAAGTAGGCT TCTTGTCACT TTGGCCTGTC 3060ACTTAGATGG CCTTGGATCT AGCTTCACTC CCAATCCCTA TTGGATGTGA TGCACAAATT 3120CAGAGCCTTT GGGTCTCCCT CAGCTGAGGT GGCGGTGGAA ATGGAGGAAG AAGGAAGGGT 3180GCCTGAGCAG GATCTCAAGT TCAAGGATGC CTGGAGTTGC TTACTTACCT TGTCTTCCTT 3240CTCTCTCCGC AGTGGAGGAA CCACAATCCC TTCTGCACCT GAGCCGCCTG TGTGTGCGCC 3300ATGCTCTGGG GGACACCCGG CTGGGTCAAA TATCCACTCT GCCTTTGCCC CCTGCCATGA 3360AGCGCTATCT GCTCTACAAA TGACCCAGTA GTACAGGGTG TGCTGGCACC CTACCGTGGG 3420GACAGGTGGA GAGGCACCCG CTGGCCTAGA CAACTTTAAA AAGCTGGTGA AGCTGGGGGG 3480GGGGGGCTGG ACCCCTTCAC CTCCCCTTCT CACAGGAGCA AGACATATAG AAATGATATT 3540AAACACCATG GCAGCCTGGG ACAAAGAGGT TTTTGAAGTA AAAAATGAGA TGTATTGTCA 3600CAACCTGTTT CATTATTGTT TTTTGTTTTG TTTTACACTC CCCCACCCCA GGCTAGAGCC 3660CCATCACTGT CTTAAGGAAT TATGACAACC CACAAAGCTC AGGCCCAGGT GTTTATTTCC 3720CTTACATGTA GGATGGTTCA CAAACACAAT ACAGGGGCTT TGGCACCGTG GGGGAGGGGA 3780CTATCCCAGG CCTCTTAGGG TCTCATGTAT ACCGAATTCA GACCCGAAAG CTCTGAATTT 3840CTGCATCAGA CATCCAGTAG AACTTGGGAG TGAAGCTAGA GCCAAGGCCA TCTAAGTGAC 3900AGGCCAAAGT GACACGAAGC CCACTTCCTG TGCTCCAACC ATGAGTTTCC AGCCCAAACC 3960AATGGAAGGT GATTTCACTT GTCAGGGCCC AAAGGGACAG TCAGTTCTAC TCCCTCCCCT 4020CACTAGGAGC CACCTTGGTG ACAGTTGATT CTACCCACTG TAAGTGGTAA AGGGATTGGC 4080CTGGTCCCAA CCATAATAGG GCGGTGGAAA CGGCTCAGGA GGGTACAGCG TGGATTAGGC 4140CACAAGATGG GGCAGATGAT GTCATCAGAA GCATGTGACC GGTGGGAGCA GTTACTAAAC 4200TTCTGGGCAA CCTAGTCCAT GCTATGCAGG CAGGTAGAGG GATGGGCAGT GCTCATTGTT 4260TGGCATTGAT GATGTCCACA AATTCAGGCT TGAGAGATGC GCCACCCACA AGGAAGCCGT 4320CCACGTCAGG CTGGCTTGCC AGCTCTTTGC AGGTTGCTCC AGTCACAGAA CCTGTACCAG 4380GAACAAGAAG ACAGTTTGGT CAGGTCTATG ATCAGAACAC TTAAGCCCCA CCTCTCTGTG 4440CAAGGCAGCC TCAGTCTGTC TTAGCCCATT TCCGTCTTAG CTAGAGCCAA AGCCACTCAC 4500CTCCATAAAT GATCCGGGTG CTCTGAGCCA CCCCATCATT GACATTGGAT TTCAGCCATC 4560CCCGGAGCTT CTCGTGTACT TCCTGTGCCT AGAAGGAGGA GGCAGAGCTA CTAAGTAAGC 4620TCCTTCCTAT CTATCATTCA AGGAGTAAAA ACCACTGGTT CTCACATAGA GTTGAGTTTC 4680CAGAAAAGCC CCGGGACCAG AGAGTGGCAA GGCTCCAATC CCACCAGGCT TGGAATGAAC 4740ATTTTTGGCA AAGTCACTCT CCTTGGTGAG TTTGGGGGCC CTCTGTCTCT AAAGGGGCTT 4800GGATGGGCTC CATAGCTGTG TGAGTCTGTT AAAGCCGGAC AGGCTGAGGA GCTCTGGGTA 4860GTTACCTGCT GAGGGGTTGC CGTCTTGCCA GTCCCAATGG CCCACACAGG TTCATAGGCC 4920AGGACCACCT TGCTCCAGTC TTTCACATTA TCTGTGGGGC AGAGAGGAGA GTGAGTAGGA 4980AGGAGCTGAC CCGCCAAGC 4999(2)关于SEQ ID NO46的信息(i)序列特征(A)长度264个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO46Met Gly Gln Thr Ala Leu Ala Arg Gly Ser Ser Ser Thr Pro Thr Ser1 5 10 15Gln Ala Leu Tyr Ser Asp Phe Ser Pro Pro Glu Gly Leu Glu Glu Leu20 25 30Leu Ser Ala Pro Pro Pro Asp Leu Val Ala Gln Arg His His Gly Trp35 40 45Asn Pro Lys Asp Cys Ser Glu Asn Ile Asp Val Lys Glu Gly Gly Leu50 55 60Cys Phe Glu Arg Arg Pro Val Ala Gln Ser Thr Asp Gly Val Arg Gly65 70 75 80Lys Arg Gly Tyr Ser Arg Gly Leu His Ala Trp Glu Ile Ser Trp Pro85 90 95Leu Glu Gln Arg Gly Thr His Ala Val Val Gly Val Ala Thr Ala Leu
100 105 110Ala Pro Leu Gln Ala Asp His Tyr Ala Ala Leu Leu Gly Ser Asn Ser115 120 125Glu Ser Trp Gly Trp Asp Ile Gly Arg Gly Lys Leu Tyr His Gln Ser130 135 140Lys Gly Leu Glu Ala Pro Gln Tyr Pro Ala Gly Pro Gln Gly Glu Gln145 150 155 160Leu Val Val Pro Glu Arg Leu Leu Val Val Leu Asp Met Glu Glu Gly165 170 175Thr Leu Gly Tyr Ser Ile Gly Gly Thr Tyr Leu Gly Pro Ala Phe Arg180 185 190Gly Leu Lys Gly Arg Thr Leu Tyr Pro Ser Val Ser Ala Val Trp Gly195 200 205Gln Cys Gln Val Arg Ile Arg Tyr Met Gly Glu Arg Arg Val Glu Glu210 215 220Pro Gln Ser Leu Leu His Leu Ser Arg Leu Cys Val Arg His Ala Leu225 230 235 240Gly Asp Thr Arg Leu Gly Gln Ile Ser Thr Leu Pro Leu Pro Pro Ala245 250 255Met Lys Arg Tyr Leu Leu Tyr Lys260(2)关于SEQ ID NO47的信息(i)序列特征(A)长度5615个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO47GTACTTTCTT TATATCTCCA TAATTTTATT TACTATTACT ACATGATACA TTATTTTATA 60AAAGTCTTTG TAACCTCCTT AAGGATTCAC TGCTTAATCT CCAGTGCTTA GCACAAATCA 120TTAAATGCGA ACCAGAAACT CTTCCAAATG TGTTACATCT ATAACCTCAT TGGATTCTCA 180CTACCAACCC CATGCAATAG ATACTAATGT GATCTCTGTC TTACAGAGGA AGAAACAGGC 240ACAGGGAGGT TCAGTAATTT GCCCAAGGTC ATACACACAC TGGCCTTCAG GTATTCATGC 300CCGGGGAGTC TGGTCCCACA GCTGGCATGT TTGCCATTAT ATTATATTGC CTCCTTATAG 360TGTCGGCACT CATTAAGCAC ATTGACAGCT ATGCTTGGTG AGTGACTACT ATGTACCCAG 420CTCTGTGCTA CATGCTTTAC CTGGATTATT TCAACTGCAC AACAACCCTG TGAGGTAACT 480ACCATCATTG CTCCTATTTT ACATAACAGA AAACTACAGA AATCTGGGGC TGGGCGTAGT 540GGCTCATGCC TGAAATCCCA GCACTTTGGG AGACCCTGTC TCTAAAAAAA ATTTTTTTTT 600GGCCGGACGT GGTGGCTCAC ACCTGTAATC TCAGCACTTT GGGAGGCTAA GGCAGGCAGA 660TCACAAGGTC AGGAGTTCTA GACCAGCCTG GCCAACATGG CAAAACCCTG TGTCTACTAA 720AAATACAAAA AATAGCTAGG CGTGGTGGCA GGTGCCTGTA ATCCCAGCTA CTCAGGAGGC 780TGAGGCAGGA GAATCCCCTG AACCTGGGAG ATGGAGGTTA CAGAGAGCCG AGATCGTGCC 840GCTGCACTCC AGCCTGGGCA ACAAGAGCAA GACTCTGTCT CGAAAAAAAT AAAAATAAAA 900ATAAAAATAT TTTTTTAAAA ATTAGCTGGG TGTGGTAGCA CATGCCTGTA GTCCCAGCTA 960CTTGGGAGGC TGAGGTAGGA GGATCACTTG AGCCCAGGAG GTCAAGGCTG CAGTGGGCTG 1020TGATGGCGCC ACTGCACTCT AGCCTTGGTG ACAGCAAGAC CCTGTCTCAA AAAAAAAAAA 1080AAGAGAAATC GGGCAACTTC CCCAAGATCG CGCAGTTAAC TAGTGGCATA GCTTCACTCA 1140AACTCGAAGT CTTAATCAGG ACACTCTACC AAATGAGATC AACGGCTCAG TAATGGATTG 1200GCATCCAGTA TGAAGACTGG ACCAGCAGGG AGAACTATGA TGCGTACAGC CTAGAGCCTG 1260AAGCAGATTT CACAGCCTCA GAGGTGGCAC AGGCTGACTC ACAACCCGGG GCAGAAAGGG 1320ACCAGCCCAG AAACAGTGAC CCAGAATCAC AGGGAAGTAG AAATGGGATT CGGCACAATG 1380AAGCCCCTCC TTGACCCCAT GCTCCTTACC CTCAGGGGCG CAGGAGTTAG TCGCTCAGGC 1440GGCTCAAAGG TCTTGACGGT GGAGAACACC ATCCCCAGGG ATTCCCGACG CGGTGATGCC 1500ATCAAAGCGT TAATTCTGAG ATGGGCCTGC CCGGGTGCGG ACTCTGCCGC AGCAAGAGAA 1560GGGTTAACTG CCCCGGGCCT TCGCCGTGGG GGCGGGGCCT CGGGGAGGGT CACAGCCCGG 1620GACTGAGACC CGAGGTTAAC CGCCCGGGGT GGGCTCCACG GGGGCGGGGC ATGCTCTCCG 1680CGGCTGCTGC CGGTATAGAG CGGTAACTGC CCAGGAGGGG GCGGGGCCCC ACAGGGGCGT 1740GGCCTCGGAG CTGCACGGCC GTGGGCGGCG ATGAGAGGGT TAAGCCCCAG AGGGCCCTGG 1800AGGGGCGGGG CCGCGGGACG GGCTCGGCCC AAGGGAGGAG CTGGGGGCGG AAGCGGCCGG 1860CGGTCTGCGC CCTGCGCGCC TCGGCTTCTT TCCGCCCGGC TCCTTCAGAG GCCCGGCGAC 1920CTCCAGGGCT GGGAAGTCAA CCGAGGTTCG GGGGCAGCGG CGAGGGCTCC GGGCGAGTAA 1980GGGGGATGGT CCATGCTGAG GCCCAAATGG GGCGAACTCG CGAGAGTCTC TGGCGACCTG 2040GATCAGATGG GGCGAGGGCA GATGAAGGGC CCAGGAGCTT TGGGGCAGCG AGGAGGGAGG 2100AGCGGGCCCG TTGGCAAACT TGGGTGAAAG GATGGGGTAC CTGGGTGACG AGCCCCCGCC 2160AGGATTCTGC TCTTCACGCC CCTTTTCTCC CAGCTCCCTT CCAGGTCAAT CCAAACTGGA 2220GCTCAACTTT CAGAAGAGAA AGACGCCCCA GCAAGCCTCT TTCGGGGAGT CCTCTAGCTC 2280CTCACCTCCA TGGGCCAGAC AGCTCTGGCA GGGGGCAGCA GCAGCACCCC CACGCCACAG 2340GCCCTGTACC CTGACCTCTC CTGTCCCGAG GGCTTGGAAG AGCTGCTGTC TGCACCCCCT 2400CCTGACCTGG GGGCCCAGCG GCGCCACGGT TGGAACCCCA AAGACTGTTC AGAGAACATC 2460GAGGTCAAGG AAGGAGGGTT GTACTTTGAG CGGCGGCCCG TGGCCCAGAG CACTGATGGG 2520GCCCGGGGTA AGAGGGGCTA TTCAAGGGGC CTGCACGCCT GGGAGATCAG CTGGCCCCTA 2580GAGCAGAGGG GCACGCATGC CGTGGTGGGC GTGGCCACGG CCCTCGCCCC GCTGCAGACT 2640GACCACTACG CGGCGCTGCT GGGCAGCAAC AGCGAGTCGT GGGGCTGGGA CATCGGGCGG 2700GGGAAGCTGT ACCATCAGAG CAAGGGGCCC GGAGCCCCCC AGTATCCAGC GGGAACTCAG 2760GGTGAGCAGC TGGAGGTGCC AGAGAGACTG CTGGTGGTTC TGGACATGGA GGAGGGAACT 2820CTGGGCTACG CTATTGGGGG CACCTACCTG GGGCCAGCAT TCCGCGGACT GAAGGGCAGG 2880ACCCTCTATC CGGCAGTAAG CGCTGTCTGG GGCCAGTGCC AGGTCCGCAT CCGCTACCTG 2940GGCGAAAGGA GAGGTGAGGC CTGGGGCAGA CGTGGGGAGA ACTTTCTGTC CCTGGTGGCA 3000GTGGTTTGGG ATGGAAACTC TTCTGACAAG AGCAGAGGGG ATGGACCTTC ATCCAGCCTG 3060CCTCAACCTC TGTTCAGTGC TGGGAAAGGC TAGGGGTCTT CACAGCTGTT ATTTAATTTA 3120ACCCAACAGC AATAGAGGTG AAACAGGCTT GAGAAAGCAA CTTTCTCAAG TTCTCTTGGC 3180CAGTAAATGG TGAACCTTCA GAATGGAGGG AGGAACTGCA GGGATGAGAG AATTCAGGAG 3240ATATCAACCC CTGAGCAAGA GGTGCAAAGC GTTAGGTACT GGGTTTGATG TACAGGTCCA 3300AAAGAAGGAT GGGCAGAGCC AGGTACCCAG GCTGTATACC GGATTCCCTG GGCTCTAACC 3360TGTCTCTGTG CCACATACCT ACTTCCTTCC TCAGCCACAC CTCTGGATGG AGACACTGGG 3420GCCCTGGGCA CCAGGGAGGA GAGCAGTGGA GGAGGCAGGG CCTTAGGGTG GGGCAGCAGG 3480GGAGGAGCCT CCCCAGGAAC TGACTGGGTC CAGGGCTTGG AGCTGCTCTC TGCAGTTGTG 3540TGGGCTGTAG AGTGGAGGGC CATCCCTCCT CACCTCAGCC CCAGCTCCCA AGCCTCTGGA 3600GTCAAAGCCT GGGCCAGCTC CACCACTGTC AGAGCCACCT TGGCCTGTTG TTTAGAGGGC 3660CTTAGCCAGC TCTTCACCCC CAGCTCTGAC TAGGGATGTG TGAAATCTTA TCTGGGAGGC 3720AGAACTTCCG GGTATCTCAA ATTCCCCTTT CAGCCAGGTG GGCACACTCG AAGCAGGAAA 3780GCAGAAAGGC ATCTGAGTAG GACCCCGTAG TTTGAGGACA TCTGGCTGGT GGCTGCACCC 3840ATACTTACAT TCCCCTCCTT CTCTCTCCCA GCGGAGCCAC ACTCCCTTCT GCACCTGAGC 3900CGCCTGTGTG TGCGCCACAA CCTGGGGGAT ACCCGGCTCG GCCAGGTGTC TGCCCTGCCC 3960TTGCCCCCTG CCATGAAGCG CTACCTGCTC TACCAGTGAG CCCTGTGATA CCACAGACTG 4020TGCTGAGGTC TTGCCACCAC CCCTCCCCTT GGGGAGGTGG GGAGGCACTG CTGGCCTAGA 4080CCAGCTGCTG AAAGCTGGTG AGGCTGAGCC CCTACCCCAA CCCAAGCTCT GCGGAAATCA4140ACAGCCCCAG AGCCACTTGG AGGGAGGAAG AAAGGGAGCC GGCGTTCAAG GCTATGACAG4200TCTGCTACGC AAAACATTTT TTCAAGTAAA AATAGTAAGA GATGTTGTTA TAGAAACCTG4260TTCTTGTTTT TTTTTTTTTC TTGCACAAAT GATCATTTAT ATAGCTGCCT CAAAAAGGAA4320GATTATCTGG GCAAGTCCAG TGAAGGCAGA CAAACCACAA GACCTAGTGC CAGGTTTATT4380CCCTCACATG GGTGGTTCAC ATACACAGCA CAGAGGCACG GGCACCATGG GAGAGGGCAG4440CACTCCTGCC TTCTGAGGGG ATCTTGGCCT CACGGTGTAA GAAGGGAGAG GATGGTTTCT4500CTTCTGCCCT CACTAGGGCC TAGGGAACCC AGGAGCAAAT CCCACCACGC CTTCCATCTC4560TCAGCCAAGG AGAAGCCACC TTGGTGACGT TTAGTTCCAA CCATTATAGT AAGTGGAGAA4620GGGATTGGCC TGGTCCCAAC CATTACAGGG TGAAGATATA AACAGTAAAG GAAGATACAG4680TTTGGATGAG GCCACAGGAA GGAGCAGATG ACACCATCAG AAGCATATGC AGGGAAAGGG4740CAGTTACTGG GCTTCTGGGC TGCTTAGTCC CTGGCTTGGC AGGAAGGGTA GGGAAGATGG4800ATGGGGCTCA TTGTTTGGCA TTGATGATGT CCACGAATTC GGGCTTGAGG GAAGCACCAC4860CCACAAGGAA GCCATCCACA TCAGGCTGGC TGGCCAGCTC CTTGCAGGTT GCCCCAGTCA4920CAGAGCCTGG GAAGGGAGCA GAACAAGGGC TTGGTCAAGA ATGGGATGAG TCTGCCCCAT4980CCCCACCTCC ATGTCCGAGG GCTCAGTCTA GTCCTCAGCC CACTCCACCT CAGCCGGGAA5040CCAAAGCCAC TCACCTCCAT AAATGATACG GGTGCTCTGA GCCACCGCAT CAGAGACGTT5100GGACTTCAGC CATCCTCGGA GCTTCTCGTG TACTTCCTGG GCCTAGAACA AGAAGCTGGC5160CTAAGTAAGA CCTTTTCTGC CTCTCTAAGA GGAAAAATCA CTGGCACCAG TGGACACTTA5220GTGTGGTTTC TGACTGAGTC AGAGTACCAG GGCTCTGATC CAAGCCAGGC CCTGGACTGG5280ATGCCCTTGG ACAAGTCACT GTCTCTGGGT TCAAGGTCTC TGTGTCTTTG AAATAAGGGG5340TTGCCCCATG TGGGCTGTGT CTGTCCAAAC CTATTGAGGC AGGCTGGGAT GAGGGCAGGG5400CTCCTGGGCC CGGTTACCTG TTGGGGTGTT GCAGTCTTGC CAGTACCAAT GGCCCACACA5460GGCTCATAGG CCAGGACGAC CTTGCTCCAG TCCTTCACGT TATCTGCAGG GCAGAGATAC 5520AGATGGAGGG AAGGGTGAAC AAGAAAGAGC TCTCCAGCCA GGTTCTCCGG AGTACGAAGA 5580ACGGTGGCCT ACTGCCCCCT AGTGGACATT GGGGG 5615(2)关于SEQ ID NO48的信息(i)序列特征(A)长度263个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑结构线型(ii)分子类型蛋白质(xi)序列描述SEQ ID NO48Met Gly Gln Thr Ala Leu Ala Gly Gly Ser Ser Ser Thr Pro Thr Pro1 5 10 15Gln Ala Leu Tyr Pro Asp Leu Ser Cys Pro Glu Gly Leu Glu Glu Leu20 25 30Leu Ser Ala Pro Pro Pro Asp Leu Gly Ala Gln Arg Arg His Gly Trp35 40 45Asn Pro Lys Asp Cys Ser Glu Asn Ile Glu Val Lys Glu Gly Gly Leu50 55 60Tyr Phe Glu Arg Arg Pro Val Ala Gln Ser Thr Asp Gly Ala Arg Gly65 70 75 80Lys Arg Gly Tyr Ser Arg Gly Leu His Ala Trp Glu Ile Ser Trp Pro85 90 95Leu Glu Gln Arg Gly Thr His Ala Val Val Gly Val Ala Thr Ala Leu100 105 110Ala Pro Leu Gln Thr Asp His Tyr Ala Ala Leu Leu Gly Ser Asn Ser115 120 125Glu Ser Trp Gly Trp Asp Ile Gly Arg Gly Lys Leu Tyr His Gln Ser130 135 140Lys Gly Pro Gly Ala Pro Gln Tyr Pro Ala Gly Thr Gln Gly Glu Gln145 150 155 160Leu Glu Val Pro Glu Arg Leu Leu Val Val Leu Asp Met Glu Glu Gly165 170 175Thr Leu Gly Tyr Ala Ile Gly Gly Thr Tyr Leu Gly Pro Ala Phe Arg180 185 190Gly Leu Lys Gly Arg Thr Leu Tyr Pro Ala Val Ser Ala Val Trp Gly195 200 205Gln Cys Gln Val Arg Ile Arg Tyr Leu Gly Glu Arg Arg Ala Glu Pro210 215 220His Ser Leu Leu His Leu Ser Arg Leu Cys Val Arg His Asn Leu Gly225 230 235 240Asp Thr Arg Leu Gly Gln Val Ser Ala Leu Pro Leu Pro Pro Ala Met245 250 255Lys Arg Tyr Leu Leu Tyr Gln260(2)关于SEQ ID NO49的信息(i)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO49AGCTAGATCT GGACCCTACA ATGGCAGC 28(2)关于SEQ ID NO50的信息(i)序列特征(A)长度36个碱基对(B)类型核酸
(C)链型单链(D)拓扑结构线型(ii)分子类型DNA(xi)序列描述SEQ ID NO50AGCTAGATCT GCCATCCTAC TCGAGGGGCC AGCTGG 3权利要求
1.一种核酸分子，包含编码在其C末端区域含有SOCS元件盒的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子。
2.根据权利要求1所述的核苷酸序列，其中蛋白进一步包含蛋白分子相互作用区域。
3.根据权利要求1所述的核苷酸序列，其中蛋白分子相互作用区域位于SOCS元件盒的N端区域。
4.根据权利要求2或3所述的核苷酸序列，其中蛋白分子相互作用区域是蛋白分子结合区域或蛋白蛋白结合区域。
5.根据权利要求4所述的核苷酸序列，其中蛋白分子相互作用区域是一个或多个SH2结构域、WD-40重复或锚蛋白重复。
6.根据权利要求1-5中的任意一项所述的核苷酸序列，其中SOSC元件盒包含如下氨基酸序列X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P。
7.根据权利要求6所述的核苷酸序列，其中蛋白调节信号传导。
8.根据权利要求7所述的核苷酸序列，其中信号传导由细胞因子、激素、微生物群体或微生物产物、寄生物、抗原或其它效应物分子调节。
9.根据权利要求8所述的核苷酸序列，其中蛋白调节细胞因子介导的信号传导。
10.根据权利要求9所述的核苷酸序列，其中信号传导由一个或多个细胞因子EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF介导。
11.根据权利要求10所述的核苷酸序列，其中信号传导由一个或多个IL-6、LIF、OSM、IFNγ和/或促血小板生成素介导。
12.根据权利要求11所述的核苷酸序列，其中信号传导由IL-6介导。
13.根据权利要求1所述的核苷酸序列，其中核苷酸序列编码主要如SEQ ID NO.4，SEQ ID NO.6，SEQ ID NO.8，SEQ ID NO.10，SEQID NO.12，SEQ ID NO.14，SEQ ID NO.18，SEQ ID NO.21，SEQ IDNO.25，SEQ ID NO.29，SEQ ID NO.36，SEQ ID NO.41，SEQ IDNO.44，SEQ ID NO.46或SEQ ID NO.48中所列出的氨基酸序列或与列出的序列的全部或部分有至少约15％相似性的氨基酸序列，或在42℃低严格条件下与核酸分子杂交的核苷酸序列。
14.根据权利要求1所述的核苷酸序列，其中核苷酸序列主要如SEQ ID NO.3，SEQ ID NO.5，SEQ ID NO.7，SEQ ID NO.9，SEQ IDNO.11，SEQ ID NO.13，SEQ ID NO.15，SEQ ID NO.16，SEQ IDNO.17，SEQ ID NO.20，SEQ ID NO.22，SEQ ID NO.23，SEQ IDNO.24，SEQ ID NO.26，SEQ ID NO.27，SEQ ID NO.28，SEQ IDNO.30，SEQ ID NO.31，SEQ ID NO.32，SEQ ID NO.33，SEQ IDNO.34，SEQ ID NO.35，SEQ ID NO.37，SEQ ID NO.38，SEQ IDNO.39，SEQ ID NO.40，SEQ ID NO.42，SEQ ID NO.43，SEQ ID NO.45或SEQ ID NO.47的核苷酸序列或与所列出的序列的全部或部分有至少15％相似性的核苷酸序列或在42℃低严格条件下能与列出的序列杂交的核苷酸序列。
15.一种核酸分子，包含编码表现以下特征的蛋白或其衍生物、同系物、类似物或模拟物的核苷酸序列或与其互补的核苷酸序列的核酸分子或在42℃低严格条件下与其杂交的核酸分子(i)在其C末端包含具有以下氨基酸序列的SOCS元件盒X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白分子相互作用结构域；并且(iii)调节信号传导。
16.在其C末端区域含有SOCS元件盒的分离的蛋白或其衍生物、同系物或模拟物。
17.根据权利要求16所述的分离的蛋白，其中蛋白进一步包含蛋白分子相互作用区域。
18.根据权利要求17所述的分离的蛋白，其中蛋白分子相互作用区域位于SOCS元件盒的N端区域。
19.根据权利要求16或17所述的分离的蛋白，其中蛋白分子相互作用区域是蛋白DNA结合区域或蛋白蛋白结合区域。
20.根据权利要求19所述的分离的蛋白，其中蛋白分子相互作用区域是一个或多个SH2结构域、WD-40重复或锚蛋白重复。
21.根据权利要求16-20中的任意一项所述的分离的蛋白，其中SOCS元件盒包含如下氨基酸序列X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P。
22.根据权利要求21所述的分离的蛋白，其中蛋白调节信号传导。
23.根据权利要求22所述的分离的蛋白，其中信号传导由细胞因子或其它内源分子、激素、微生物群体或微生物产物，寄生物、抗原或其它效应物分子调节。
24.根据权利要求23所述的分离的蛋白，其中蛋白调节细胞因子介导的信号传导。
25.根据权利要求24所述的分离的蛋白，其中信号传导由一个或多个细胞因子EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF介导。
26.根据权利要求25所述的分离的蛋白，其中信号传导由一个或多个IL-6、LIF、OSM、IFNγ和/或促血小板生成素介导。
27.根据权利要求26述的分离的蛋白，其中信号传导由IL-6介导。
28.根据权利要求16所述的分离的蛋白，其中核苷酸序列编码主要如SEQ ID NO.4，SEQ ID NO.6，SEQ ID NO.8，SEQ ID NO.10，SEQID NO.12，SEQ ID NO.14，SEQ ID NO.18，SEQ ID NO.21，SEQ IDNO.25，SEQ ID NO.29，SEQ ID NO.36，SEQ ID NO.41，SEQ IDNO.44，SEQ ID NO.46或SEQ ID NO.48中所列出的氨基酸序列或与列出的序列的全部或部分有至少约15％相似性的氨基酸序列或在42℃低严格条件下与核酸分子杂交的核苷酸序列。
29.根据权利要求16所述的核苷酸序列，其中核苷酸序列主要如SEQ ID NO.3，SEQ ID NO.5，SEQ ID NO.7，SEQ ID NO.9，SEQ IDNO.11，SEQ ID NO.13，SEQ ID NO.15，SEQ ID NO.16，SEQ IDNO.17，SEQ ID NO.20，SEQ ID NO.22，SEQ ID NO.23，SEQ IDNO.24，SEQ ID NO.26，SEQ ID NO.27，SEQ ID NO.28，SEQ IDNO.30，SEQ ID NO.31，SEQ ID NO.32，SEQ ID NO.33，SEQ IDNO.34，SEQ ID NO.35，SEQ ID NO.37，SEQ ID NO.38，SEQ IDNO.39，SEQ ID NO.40，SEQ ID NO.42，SEQ ID NO.43，SEQ ID NO.45或SEQ ID NO.47的核苷酸序列或与所列出的序列的全部或部分有至少15％相似性的核苷酸序列或在42℃低严格条件下能与列出的序列杂交的核苷酸序列。
30.具有以下特征的分离的蛋白或其衍生物、同系物、类似物或模拟物(i)在其C末端包含SOCS元件盒，所述SDCS元件包含以下氨基酸序列X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P；(ii)在SOCS元件盒N端区域内包含至少一个SH2结构域、WD-40重复和/或锚蛋白重复或其它蛋白分子相互作用结构域；并且(iii)调节信号传导。
31.调节细胞中SOCS蛋白水平的方法，该方法包括使含有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂在足以调节所述SOCS蛋白水平的条件下接触一段时间。
32.在含SOCS基因的细胞中调节信号传导的方法，包括使所述细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
33.影响其中至少一种细胞带有SOCS基因的细胞间相互作用的方法，该方法包括使带有SOCS基因的细胞与有效量的SOCS基因表达或SOCS蛋白活性的调节剂接触足以调节信号传导的一段时间。
34.根据权利要求31-33中的任意一项所述的方法，其中信号传导由细胞因子、激素、微生物群体或微生物产物、寄生物、抗原或其它效应物分子调节。
35.根据权利要求34所述的方法，其中信号传导由一个或多个细胞因子EPO、TPO、G-CSF、GM-CSF、IL-3、IL-2、IL-4、IL-7、IL-13、IL-6、LIF、IL-12、IFNγ、TNFα、IL-1和/或M-CSF介导。
36.根据权利要求35所述的方法，其中信号传导由一个或多个IL-6、LIF、OSM、IFNγ和/或促血小板生成素介导。
37.根据权利要求36所述的方法，其中信号传导由IL-6介导。
38.根据权利要求31-37中的任意一项所述的方法，其中SOSC基因编码带有含如下氨基酸序列的SOCS元件盒的蛋白X1X2X3X4X5X6X7X8X9X10X11X12X13X14X15X16[Xi]nX17X18X19X20X21X22X23[Xj]nX24X25X26X27X28其中，X1是L，I，V，M，A或P；X2是任何氨基酸残基；X3是P，T或S；X4是L，I，V，M，A或P；X5是任何氨基酸；X6是任何氨基酸；X7是L，I，V，M，A，F，Y或W；X8是C，T或S；X9是R，K或H；X10是任何氨基酸；X11是任何氨基酸；X12是L，I，V，M，A或P；X13是任何氨基酸；X14是任何氨基酸；X15是任何氨基酸；X16是L，I，V，M，A，P，G，C，T或S；[Xi]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xi可以包含相同或不同的选自任何氨基酸残基的氨基酸；X17是L，I，V，M，A或P；X18是任何氨基酸；X19是任何氨基酸；X20L，I，V，M，A或P；X21是P；X22是L，I，V，M，A，P或G；X23是P或N；[Xj]n是n个氨基酸的序列，其中n是从1到50个氨基酸，而其中序列Xj可以包含相同或不同的选自任何氨基酸残基的氨基酸；X24是L，I，V，M，A或P；X25是任何氨基酸；X26是任何氨基酸；X27是Y或F；X28是L，I，V，M，A或P。
39.根据权利要求38所述的方法，其中SOCS基因包含选自SEQID NO.3，SEQ ID NO.5，SEQ ID NO.7，SEQ ID NO.9，SEQ ID NO.11，SEQ ID NO.13，SEQ ID NO.15，SEQ ID NO.16，SEQ ID NO.17，SEQID NO.20，SEQ ID NO.22，SEQ ID NO.23，SEQ ID NO.24，SEQ IDNO.26，SEQ ID NO.27，SEQ ID NO.28，SEQ ID NO.30，SEQ IDNO.31，SEQ ID NO.32，SEQ ID NO.33，SEQ ID NO.34，SEQ IDNO.35，SEQ ID NO.37，SEQ ID NO.38，SEQ ID NO.39，SEQ IDNO.40，SEQ ID NO.42，SEQ ID NO.43，SEQ ID NO.45或SEQ IDNO.47的核苷酸序列。
40.根据权利要求38所述的方法，其中SOCS基因编码包含主要如SEQ ID NO.4，SEQ ID NO.6，SEQ ID NO.8，SEQ ID NO.10，SEQID NO.12，SEQ ID NO.14，SEQ ID NO.18，SEQ ID NO.21，SEQ IDNO.25，SEQ ID NO.29，SEQ ID NO.36，SEQ ID NO.41，SEQ IDNO.44，SEQ ID NO.46或SEQ ID NO.48中所列出的氨基酸序列的蛋白。
全文摘要
本发明总的涉及治疗和诊断试剂,更具体地,本发明提供能调节信号传导,例如但不限于细胞因子介导的信号传导的治疗分子。本发明在调节对细胞因子及其它信号传导介质如内源或外源分子、抗原、微生物群体和微生物产物、病毒或其组成成分、离子、激素和寄生物的细胞反应性中有用。
文档编号A61K31/7088GK1253565SQ97180920
公开日2000年5月17日申请日期1997年10月31日优先权日1996年11月1日
发明者D·J·希尔顿, W·S·亚历山大, E·M·威尼, T·A·威尔逊, R·T·理查森, R·斯塔尔, S·E·尼科尔森, D·梅特卡夫, N·A·尼克拉申请人:沃尔特及伊莱萨霍尔医学研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D.J.希尔顿;W.S.亚历山大;E.M.威尼;T.A.威尔逊;R.T.理查森;R.斯塔尔;S.E.尼科尔森;D.梅特卡夫;N.A.尼克拉
技术所有人：沃尔特及伊莱萨霍尔医学研究院
我是此专利的发明人

上一篇：微型角膜刀的制作方法
上一篇：带有机械与粘贴式复合锁紧系统的一次性卫生用品的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。