具有抑癌功能的新的人蛋白及其编码序列的制作方法

文档序号:3535093阅读:530来源:国知局
专利名称:具有抑癌功能的新的人蛋白及其编码序列的制作方法
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有抑癌功能的人蛋白的多核苷酸和此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究具有抑癌功能的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有抑癌功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有抑癌功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性(a)编码上述的具有抑癌功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。更佳地,该多核苷酸的序列选自下组SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有抑癌功能的蛋白活性的多肽的制备方法,该方法包含(a)在适合表达具有抑癌功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有抑癌功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有抑癌功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有抑癌功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的公开内容,对本领域的技术人员而言是显而易见的。
3T3细胞是一种小鼠成纤维细胞(J.Cell.Biol.,17299,1963)。在癌症研究领域中,常将外源基因(尤其是人基因)引入3T3细胞,观察其对3T3细胞生长的影响情况。通常认为,对3T3细胞生长有影响的基因是癌症相关基因,其中对3T3细胞生长有抑制作用的基因大多是抑癌基因,而对3T3细胞生长有促进作用的基因大多是(原)癌基因。
本发明采用大规模cDNA克隆转染小鼠胚胎成纤维细胞,在获得具有抑癌作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有抑癌功能的蛋白对3T3细胞具有抑制克隆形成的作用,其抑制率≥50%。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有抑癌功能的蛋白或多肽”是指具有抑癌功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有抑癌功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有抑癌功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有抑癌功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP9457蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO2的蛋白质,但与SEQ IDNO3所示的编码区序列有差别的核酸序列。再以PP9943蛋白为例,编码成熟多肽的编码区序列可以与SEQ ID NO6所示的编码区序列相同或者是简并的变异体。对于其他具有抑癌功能的蛋白,可依此类推。
编码成熟多肽的多核苷酸包括只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO2所示的成熟多肽有相同的生物学功能(以PP9457蛋白为例)和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有抑癌功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有抑癌功能的蛋白的特异DNA片段序列产生也能用下列方法获得1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,Molecular Cloning,A Laboratory Manual,Cold SpringHarbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于)(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有抑癌功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有抑癌功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,745463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明多核苷酸的载体,以及用本发明载体或具有抑癌功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;2241431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有抑癌功能的蛋白多肽。一般来说有以下步骤(1).用本发明的编码具有抑癌功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养的宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有抑癌功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.2633521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有抑癌功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有抑癌功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于)直接做为药物治疗具有抑癌功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有抑癌功能的蛋白功能的抗体、多肽或其它配体。例如,抗体可用于激活或抑制具有抑癌功能的人蛋白的功能。用表达的重组具有抑癌功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有抑癌功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有抑癌功能的人蛋白的药剂的方法。激动剂提高具有抑癌功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有抑癌功能的人蛋白的膜制剂与标记的具有抑癌功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有抑癌功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有抑癌功能的人蛋白的拮抗剂可以与具有抑癌功能的人蛋白结合并消除其功能,或是抑制具有抑癌功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有抑癌功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将本发明蛋白加入生物分析测定中,通过测定化合物影响具有抑癌功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有抑癌功能的蛋白以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有抑癌功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有抑癌功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有抑癌功能的蛋白的无表达或异常/无活性的具有抑癌功能的蛋白的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体可用于治疗具有抑癌功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有抑癌功能的蛋白基因转移至细胞内。构建携带具有抑癌功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组具有抑癌功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有抑癌功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有抑癌功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于)多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。这些抗体可用常规方法制备。抗具有抑癌功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有抑癌功能的人蛋白。
与具有抑癌功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。本发明中的抗体可用于治疗或预防与具有抑癌功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有抑癌功能的人蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有抑癌功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。
多克隆抗体的生产可用具有抑癌功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有抑癌功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,816851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗具有抑癌功能的人蛋白的单链抗体。
能与本发明蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有抑癌功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有抑癌功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有抑癌功能的人蛋白水平,可以用作解释具有抑癌功能的人蛋白在各种疾病中的重要性和用于诊断具有抑癌功能的蛋白起作用的疾病。
具有抑癌功能的蛋白的多聚核苷酸可用于具有抑癌功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有抑癌功能的蛋白的多聚核苷酸可用于检测具有抑癌功能的蛋白的表达与否或在疾病状态下具有抑癌功能的蛋白的异常表达。如具有抑癌功能的蛋白DNA序列可用于对活检标本的杂交以判断具有抑癌功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有抑癌功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有抑癌功能的蛋白的转录产物。
检测具有抑癌功能的蛋白基因的突变也可用于诊断具有抑癌功能的蛋白相关的疾病。具有抑癌功能的蛋白突变的形式包括与正常野生型具有抑癌功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。这些序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。为了将这些序列与疾病相关基因相关联。第一步就是将本发明DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。
本发明的具有抑癌功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有抑癌功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1cDNA基因的获得及对3T3细胞克隆形成的抑制作用PP9457、PP9943、PP9974、PP10443、PP10472、PP11662、PP11741、PP12301、PP12616、PP12723、PP14356和PP14737是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染3T3细胞系。100ngDNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上12个克隆有抑制3T3细胞克隆形成作用,结果如下表所示。cDNA克隆转染细胞(3T3)后的克隆形成情况
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO1、4、7、10、13、16、19、22、25、28、31、34)。
实施例2从胎盘cDNA中PCR获得全长基因取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3′1个循环;94℃30″→60℃30″→72℃1′,共35个循环;72℃10′,1个循环进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符,随后用常规技术将扩增产物转入宿主细胞,获得重组蛋白(SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35)。
基因特异引物
实施例3cDNA克隆序列分析1.PP9457A核苷酸序列(SEQ ID N01)长度25541 GCTCTGACAG ATGGCCTATT GAGGTCAACT TGAATGTGAG GGCTACGGTG TGGTTTCAAA61 CATTCATGAT GGATGTATTT TCCTACCCCT AACTTAAGGA GAAAAAAAAA AAGACTTCCT121 TTTTTTTGCC AAAGTCCAGA AAGGGGCCTT TAGCCTTTAG TAGGAGCTCA AATTGTTGGG181 GCCCCTCTAC CTCTCTCAGG GCTAGAACTG CCTGACTCTT GGTGGACGAG CCCTTCAGGG241 TTCTGCTTTC AGCCCCACCT GGACAGAGGC TTACAAGACT AGGGTCTGGA CCAGAATCTG301 TGTATTTCTG TCTGGGACCA GGAAGCCGCA GCTGTCCCAT CATCCCCAGC AAATCCTAGA361 AGTGGAGTCT GGATACTTCA AGGATAGAAG TGTTGGCACG CACAGCCATG GACCCAGCTG421 AGCAGAGCAG ACGCTTTGCA GGCTGCCCCT GGCTTCTTCC TCCCTTTCCC GCTTCTGCTC481 TCTTTATGGA CTGGTCAGAG GGTAGGTGGG AAAGAACAGA CAAGCCATGG GAAGTTGGCA541 GTGGGGAGAT TTCCACTGTG GAAACCGCCT GGGAATTCCG GCCAGCAGCT TCCTCCTTCA601 GCCACCTGGC CATACCCCTT AAATAAGCCC CTCACCTTGC TGCCTCAGGA CCTTCAAGAT661 TCCATCTGTG GGCTGGCCGG CAAGATGGCA CCAGTGGGGA CCCACACCCT GGCTGGGCAG721 AGGTGCTGCT AGCAACCTCT CTTCCTCTAT AAGAGGAAAT GGAAAATGCA GGGTGTGGAA781 TTGCCCTTTG GGGTCCTTCC TTAATTGAAG GCCACCTTCT CACAGGTTTC ATTCTGCAGG841 GATTTACTGG AATCTATTGG TGCTGCTGCA TGAGTCTGCT GACAACCTGA CTGCACAAGG901 ACTGGGTAGC AGACTCCTCA GAGTCCTCTT GACACAAATG TCAGATTTGT GTCACTCTTC961 TGCCTTCGTG AAAAGCCAAT AGCACTCTCA GATATCAGGG GATTTTAGTT CCAAGCAGGG1021 ACCCTGGTTT CCATACTGCC CTCAGCTGGA GTTTGGATCC AAAGGCTCTG GCTAAGTCAT1081 TATGTCACTT TTTCACAGGA ATGTAAATTT GACTGTCACC TCTGAATTTG TTCAGTGTCC1141 CACCATGGTC TATGAGAAGT ACACTGGAAG CGTGGGGGGA ACACATGACA TGATTTGTGA1201 ATATCATCAT CTTTGCCAGA CAAGTCTCCA GGGGATCCCT GTTTCCCAAC TGAAAGGTGT1261 GAACGGACAC ACACACAGCC TGGATGACGC CTTGGCTGTT CTAAGGGGCT GTAAGGTGGG1321 CTCTGGGCCT TCCAGCTAGG CTCTCAAGCA CAGCAGAAGC CTCACTGGGC TGCTATGTCT1381 CTGTATTTGT GGCTTGTGTG GTAGCCTCAG AAGCAGAGCT GTTTGGCAGA CTGGCTGGAG1441 AAATTCCCTC TAGGAGACTT GCCTGTGCTG TGCTTCCAGG TCACAGAGCC CCCCGGAAAC1501 TCACAGGGGC CCTCTTCCCA GAAAAGAATC TATTCTATCA CTTCAGAATC AGGACACTCA1561 AGCTCTGGCA GAGGAAGGCC AAGTTACTTT CATGGTCTTA CCCTCTGCTT TTCCCCTTTT1621 TGCAAAAAAC CACTGGCCAA ATCCGAACCA TTGCCCTTGT TTCCCCCACG TTCTCTCTCA1681 GATCTTTGTC TCGAAGGGAA AACATAGTGG ATGAAAAGGT GTGGCAGGCT TTGGCACCTT1741 GTTAAAATTT CTAGTCATCT GTGGATGTTA CCTTGCTTGT CCACAGCAGC CAGTCACCCT1801 GGCCAGTCCC ACTTCCTGGA TAATTCTCTA CCCTCACCCC ACAGAGCCAT CTCTCTCCAG1861 ACCAAAAGCT GGAAGGAGAG TTGCTTTGAG AGCTTGTTTT TACAACTGCA TGTTTATTAT1921 GATACTTTCT CTCCAAAGGA AACTTTTAAA TCAATGGGAA CAATTAGCAA CAGAAAGAGC1981 ACAGTCCCTG CTTTTGACTG GGTTCCTATT TTAAGCACAA ATGAGAGCTC TGGAGCCAGA2041 ATGCCAGGGT TCTAACTTCA GCATTCACTT ACTAGCTGTA TGATCTTGGC CAAGTCACTT2101 CACCTCCCTG AGCCCCAATT CCCAAGTTTG TGAAATGGCA ACAATACCTA TGTGTCACTG2161 GATTATTGGT TAAAACAGAA TGAGATTCCT TGTGTGAAAA TAGCTATTAT ACCTGACACA2221 CTCATCGTAT GGGCTCTGCA AAGGGATATT CCCCAACCTG TCCTTCCTGA CAGGAAGCAT2281 AGGGCACTGC AGATGGGGAA GCATGTCACC TTGGCAGTGA CTCGGTGGCT TCCCAAGCAG2341 GAGTGTCAGG GGAACCATGA GAGAGAGTCT AGGAGCAAAC ACATCACCAC CCTGAGCAGA2401 TACAGGAGTG GGGAGGGGGC TGTAACTCAG TGAGTGGCTT CCAGGGGCCC CAGGCCCTGC2461 TGGATGTGGG CCAAGCCCTA CAGCTTCCCT AGGCAGTAAG TAAAAACATT CTCCTAGCAT2521 TAAAATGGTT TCCATAAAAA AAAAAAAAAA AAAAB核苷酸序列(SEQ ID NO2)长度1141 MKRCGRLWHL VKISSHLWML PCLSTAASHP GQSHFLDNSL PSPHRAISLQ TKSWKESCFE61 SLFLQLHVYY DTFSPKETFK SMGTISNRKS TVPAFDWVPI LSTNESSGAR MPGFC.核苷酸及氨基酸组合序列(SEQ ID NO3) 克隆号PP9457起始编码子1711 ATG 终止编码子2053 TAA 蛋白质分子量12942.19(注(1)给出的是起始和终止编码子第一个核苷酸的位置,(2)分子量单位是道尔顿)1 GCT CTG ACA GAT GGC CTA TTG AGG TCA ACT TGA ATG TGA GGG CTA CGG 4849 TGT GGT TTC AAA CAT TCA TGA TGG ATG TAT TTT CCT ACC CCT AAC TTA 9697 AGG AGA AAA AAA AAA AGA CTT CCT TTT TTT TGC CAA AGT CCA GAA AGG 144145 GGC CTT TAG CCT TTA GTA GGA GCT CAA ATT GTT GGG GCC CCT CTA CCT 192193 CTC TCA GGG CTA GAA CTG CCT GAC TCT TGG TGG ACG AGC CCT TCA GGG 240241 TTC TGC TTT CAG CCC CAC CTG GAC AGA GGC TTA CAA GAC TAG GGT CTG 288289 GAC CAG AAT CTG TGT ATT TCT GTC TGG GAC CAG GAA GCC GCA GCT GTC 336337 CCA TCA TCC CCA GCA AAT CCT AGA AGT GGA GTC TGG ATA CTT CAA GGA 384385 TAG AAG TGT TGG CAC GCA CAG CCA TGG ACC CAG CTG AGC AGA GCA GAC 432433 GCT TTG CAG GCT GCC CCT GGC TTC TTC CTC CCT TTC CCG CTT CTG CTC 480481 TCT TTA TGG ACT GGT CAG AGG GTA GGT GGG AAA GAA CAG ACA AGC CAT 528529 GGG AAG TTG GCA GTG GGG AGA TTT CCA CTG TGG AAA CCG CCT GGG AAT 576577 TCC GGC CAG CAG CTT CCT CCT TCA GCC ACC TGG CCA TAC CCC TTA AAT 624625 AAG CCC CTC ACC TTG CTG CCT CAG GAC CTT CAA GAT TCC ATC TGT GGG 672673 CTG GCC GGC AAG ATG GCA CCA GTG GGG ACC CAC ACC CTG GCT GGG CAG 720721 AGG TGC TGC TAG CAA CCT CTC TTC CTC TAT AAG AGG AAA TGG AAA ATG 768769 CAG GGT GTG GAA TTG CCC TTT GGG GTC CTT CCT TAA TTG AAG GCC ACC 816817 TTC TCA CAG GTT TCA TTC TGC AGG GAT TTA CTG GAA TCT ATT GGT GCT 864865 GCT GCA TGA GTC TGC TGA CAA CCT GAC TGC ACA AGG ACT GGG TAG CAG 912913 ACT CCT CAG AGT CCT CTT GAC ACA AAT GTC AGA TTT GTG TCA CTC TTC 960961 TGC CTT CGT GAA AAG CCA ATA GCA CTC TCA GAT ATC AGG GGA TTT TAG10081009 TTC CAA GCA GGG ACC CTG GTT TCC ATA CTG CCC TCA GCT GGA GTT TGG10561057 ATC CAA AGG CTC TGG CTA AGT CAT TAT GTC ACT TTT TCA CAG GAA TGT11041105 AAA TTT GAC TGT CAC CTC TGA ATT TGT TCA GTG TCC CAC CAT GGT CTA11521153 TGA GAA GTA CAC TGG AAG CGT GGG CGG AAC ACA TGA CAT GAT TTG TGA12001201 ATA TCA TCA TCT TTG CCA GAC AAG TCT CCA GGG GAT CCC TGT TTC CCA12481249 ACT GAA AGG TGT GAA CGG ACA CAC ACA CAG CCT GGA TGA CGC CTT GGC12961297 TGT TCT AAG GGG CTG TAA GGT GGG CTC TGG GCC TTC CAG CTA GGC TCT13441345 CAA GCA CAG CAG AAG CCT CAC TGG GCT GCT ATG TCT CTG TAT TTG TGG13921393 CTT GTG TGG TAG CCT CAG AAG CAG AGC TGT TTG GCA GAC TGG CTG GAG14401441 AAA TTC CCT CTA GGA GAC TTG CCT GTG CTG TGC TTC CAG GTC ACA GAG14881489 CCC CCC GGA AAC TCA CAG GGG CCC TCT TCC CAG AAA AGA ATC TAT TCT15361537 ATC ACT TCA GAA TCA GGA CAC TCA AGC TCT GGC AGA GGA AGG CCA AGT15841585 TAC TTT CAT GGT CTT ACC CTC TGC TTT TCC CCT TTT TGC AAA AAA CCA16321633 CTG GCC AAA TCC GAA CCA TTG CCC TTG TTT CCC CCA CGT TCT CTC TCA16801681 GAT CTT TGT CTC GAA GGG AAA ACA TAG TGG ATG AAA AGG TGT GGC AGG17281 Met Lys Arg Cys Gly Arg 61729 CTT TGG CAC CTT GTT AAA ATT TCT AGT CAT CTG TGG ATG TTA CCT TGC17767 Leu Trp His Leu Val Lys Ile Ser Ser His Leu Trp Met Leu Pro Cys 221777 TTG TCC ACA GCA GCC AGT CAC CCT GGC CAG TCC CAC TTC CTG GAT AAT182423 Leu Ser Thr Ala Ala Ser His Pro Gly Gln Ser His Phe Leu Asp Asn 381825 TCT CTA CCC TCA CCC CAC AGA GCC ATC TCT CTC CAG ACC AAA AGC TGG187239 Ser Leu Pro Ser Pro His Arg Ala Ile Ser Leu Gln Thr Lys Ser Trp 541873 AAG GAG AGT TGC TTT GAG AGC TTG TTT TTA CAA CTG CAT GTT TAT TAT192055 Lys Glu Ser Cys Phe Glu Ser Leu Phe Leu Gln Leu His Val Tyr Tyr 701921 GAT ACT TTC TCT CCA AAG GAA ACT TTT AAA TCA ATG GGA ACA ATT AGC196871 Asp Thr Phe Ser Pro Lys Glu Thr Phe Lys Ser Met Gly Thr Ile Ser 861969 AAC AGA AAG AGC ACA GTC CCT GCT TTT GAC TGG GTT CCT ATT TTA AGC201687 Asn Arg Lys Ser Thr Val Pro Ala Phe Asp Trp Val Pro Ile Leu Ser 1022017 ACA AAT GAG AGC TCT GGA GCC AGA ATG CCA GGG TTC TAA CTT CAG CAT2064103 Thr Asn Glu Ser Ser Gly Ala Arg Met Pro Gly Phe *** 1152065 TCA CTT ACT AGC TGT ATG ATC TTG GCC AAG TCA CTT CAC CTC CCT GAG21122113 CCC CAA TTC CCA AGT TTG TGA AAT GGC AAC AAT ACC TAT GTG TCA CTG21602161 GAT TAT TGG TTA AAA CAG AAT GAG ATT CCT TGT GTG AAA ATA GCT ATT22082209 ATA CCT GAC ACA CTC ATC GTA TGG GCT CTG CAA AGG GAT ATT CCC CAA22562257 CCT GTC CTT CCT GAC AGG AAG CAT AGG GCA CTG CAG ATG GGG AAG CAT23042305 GTC ACC TTG GCA GTG ACT CGG TGG CTT CCC AAG CAG GAG TGT CAG GGG23522353 AAC CAT GAG AGA GAG TCT AGG AGC AAA CAC ATC ACC ACC CTG AGC AGA24002401 TAC AGG AGT GGG GAG GGG GCT GTA ACT CAG TGA GTG GCT TCC AGG GGC24482449 CCC AGG CCC TGC TGG ATG TGG GCC AAG CCC TAC AGC TTC CCT AGG CAG24962497 TAA GTA AAA ACA TTC TCC TAG CAT TAA AAT GGT TTC CAT AAA AAA AAA25442545 AAA AAA AAA A 25542.PP9943A核苷酸序列(SEQ ID NO4)长度20391 GCTGAAAATA AAATCAGGCC TGTGTGCTGG GCCTGGCCTG TAGTAAGTAC TTCCCAACCC61 CTTCTCTTGA CCCACAAATG TTGATGGAGC CCTTCTGTGC CAGGCCCTGA GCTGGGCTGA121 GGAGGCAGTG AGAGGCAGCT GACATTGTCC TTTCGTGGGA GAAGAGTTCA CTCAGGCTTC181 TTTCCACTGC GTTAACCCAG CCCGAGGGAG CCAAACCCCT GGAATCTATT CCCCTTGGCA241 AGAACTCCCA GGGTTCCAGG CAGGACTGAC CCCGCACTCC GAGGCATCAG GCCCAGAGCA301 CTTGGCTGAT CCAGGTGCCA TCCTTCCCGA AACACCACCC ACAGGCAGAA AAGAGCCAAA361 CAGGCCAGGA AACCTGTCCC AGATTCTGGC TTCCAGCTGT GGAGGGAATA GCCAGGGCTG421 GTGCAGATGA GTCGGGAAAC CCAGCAGAGA TGGAGGGGGG AGTCTTCGTC ATAACACGTG481 GCACTGGCAC ATTCAAGGTC GGTTAGCATG GATCAGACAG GATCGTAGCA TGATGAGGGG541 TTAGCACAAG GACTAGAGTG GTTCTCAGCC CTGGCTGTAC ATGAGATTTG CCTGGGCAAC601 TCGAAAACTC CGGTGGCTGG GCCATAGACT CCTGAAGTCA GGCTCTCAGG AGCAGAAGGG661 CCATCAGTCA TCGTTTAAGC TCCTCGGGTG CTCCCAATGC ATAGTCAAGG TTGAGAGCTA721 CTGGCCTGGA GCCGTGCCTG GTAACAGTAG GTGCCACCTG CGTGTTAGAT GTGGTTTATA781 ATGGAGACAC GGTGCACAGC TGCTCCAGAG AGACACATCT GGGCAGTTAC AGTCCAGCAC841 AGCAGTGGAG GCTTCCCGCG GCAGCAGGAG AGCCCACAGG AAGCTTTCAG CTCAGTGAAG901 GGAGTCAAGG TCAGGCTTCT TGGAAGGAGG TTGGACAGGG CAGCTTTGGC CTCTGAGTCT961 TGGGGGCCTC CCCATGTGGA ACTGTGCTCT TAAACCAGGG CATCACCACC TCAACAGATG1021 CCAGGGTTTC CTGGTAAATG TAAAATACAC AAGTCAGGCA GGGCACAGGG GCCCACCCCT1081 GTAATTTCAG CACTTTGGGA GGACAAGGCA GGAGGATTGT TAGAGGTCAG GAGTTTGAGA1141 CCAACCTGGG CAATATAATG ATACCCCCCA TCTCTACAAA AAATAAAAAA ATTAGCCAGG1201 CATGGTGATG TGGGAGGATT GTTTGAGCTC AAGTGGTCGA GGCTTCAGTG AGTCATGGTT1261 GCGCCACTGC AGTCCAGCCT GGGCAACAGA GCGAGACCCC GTCTCTATAA AATAAAACAT1321 GCAAATCACT GTCCAGCCAA CACCCCAGTC CAGATCCCTG CATTCGATCC AAGGGAGGCA1381 GACTGCTGGG GGAAATTGAG AGTCCTCGAG GTGCCCCTGG CAGTGAGCGG CCAGAAAGAG1441 AAGCAGGAAG GCGCCAGCAT CACGAGGAAC TGCTTCCCTC AAAGTGCTGG GATTACAGGT1501 GTGAGCCACC GCGCCAGGCC TCAGCCCACT TCTTTTGGGT GGCAATGGTT TGGATATCGT1561 TTGTCCTCAC TAAAATTCAT GTTGAGATTC GAGCCCCAGT GTGGCAGGTG TTGGGATGTG1621 GGGCCTCATA GGAGCTGTGT GGTCTTGGAG GTGGAGTCCT CATGGATAGA TTAATGCCTG1681 CCTTAAGGGG TGAGTGAGTG CTCACCCTTG GGAATTTGGG AATTTGGTTT TCTCTCCCTT1741 GCTTCCTTCA GCACCATGTG ATCTCTGTGC ACACAGCTGC ATCCTTCTGC CCTCCCCCAG1801 AAGCAGCAGC AGCCTCAGGG ATGAGGGAGG TCCTCAGTGA GTGCACCTGC CCAGTCTTGA1861 ACCTTCCAGC CATCAGAATC TGAGCCAAAT CAACCTCTTC CTTTTATAAA GACCCAGCCT1921 CAGGTCTTCT GTCAGAGCAA CACAAAATGG ACTCAGCACG GATCAAATTG TGTCTCCCCC1981 ACCCCCACAA AAAACTTTAT ATTAAAATCC TAACCCCCAG CAAAAAAAAA AAAAAAAAAB核苷酸序列(SEQ ID NO5)长度1391 MVAPLQSSLG NRARPRLYKI KHANHCPANT PVQIPAFDPR EADCWGKLRV LEVPLAVSGQ61 KEKQEGASIT RNCFPQSAGI TGVSHRARPQ PTSFGWQWFG YRLSSLKFML RFEPQCGRCW121 DVGPHRSCVV LEVESSWIDC.核苷酸及氨基酸组合序列(SEQ ID NO6)克隆号PP9943起始编码子1255 ATG 终止编码子1672 TAA 蛋白质分子量15661.181 GCT GAA AAT AAA ATC AGG CCT GTG TGC TGG GCC TGG CCT GTA GTA AGT 4849 ACT TCC CAA CCC CTT CTC TTG ACC CAC AAA TGT TGA TGG AGC CCT TCT 9697 GTG CCA GGC CCT GAG CTG GGC TGA GGA GGC AGT GAG AGG CAG CTG ACA 144145 TTG TCC TTT CGT GGG AGA AGA GTT CAC TCA GGC TTC TTT CCA CTG CGT 192193 TAA CCC AGC CCG AGG GAG CCA AAC CCC TGG AAT CTA TTC CCC TTG GCA 240241 AGA ACT CCC AGG GTT CCA GGC AGG ACT GAC CCC GCA CTC CGA GGC ATC 288289 AGG CCC AGA GCA CTT GGC TGA TCC AGG TGC CAT CCT TCC CGA AAC ACC 336337 ACC CAC AGG CAG AAA AGA GCC AAA CAG GCC AGG AAA CCT GTC CCA GAT 384385 TCT GGC TTC CAG CTG TGG AGG GAA TAG CCA GGG CTG GTG CAG ATG AGT 432433 CGG GAA ACC CAG CAG AGA TGG AGG GGG GAG TCT TCG TCA TAA CAC GTG 480481 GCA CTG GCA CAT TCA AGG TCG GTT AGC ATG GAT CAG ACA GGA TCG TAG 528529 CAT GAT GAG GGG TTA GCA CAA GGA CTA GAG TGG TTC TCA GCC CTG GCT 576577 GTA CAT GAG ATT TGC CTG GGC AAC TCG AAA ACT CCG GTG GCT GGG CCA 624625 TAG ACT CCT GAA GTC AGG CTC TCA GGA GCA GAA GGG CCA TCA GTC ATC 672673 GTT TAA GCT CCT CGG GTG CTC CCA ATG CAT AGT CAA GGT TGA GAG CTA 720721 CTG GCC TGG AGC CGT GCC TGG TAA CAG TAG GTG CCA CCT GCG TGT TAG 768769 ATG TGG TTT ATA ATG GAG ACA CGG TGC ACA GCT GCT CCA GAG AGA CAC 816817 ATC TGG GCA GTT ACA GTC CAG CAC AGC AGT GGA GGC TTC CCG CGG CAG 864865 CAG GAG AGC CCA CAG GAA GCT TTC AGC TCA GTG AAG GGA GTC AAG GTC 912913 AGG CTT CTT GGA AGG AGG TTG GAC AGG GCA GCT TTG GCC TCT GAG TCT 960961 TGG GGG CCT CCC CAT GTG GAA CTG TGC TCT TAA ACC AGG GCA TCA CCA10081009 CCT CAA CAG ATG CCA GGG TTT CCT GGT AAA TGT AAA ATA CAC AAG TCA10561057 GGC AGG GCA CAG GGG CCC ACC CCT GTA ATT TCA GCA CTT TGG GAG GAC11041105 AAG GCA GGA GGA TTG TTA GAG GTC AGG AGT TTG AGA CCA ACC TGG GCA11521153 ATA TAA TGA TAC CCC CCA TCT CTA CAA AAA ATA AAA AAA TTA GCC AGG12001201 CAT GGT GAT GTG GGA GGA TTG TTT GAG CTC AAG TGG TCG AGG CTT CAG12481249 TGA GTC ATG GTT GCG CCA CTG CAG TCC AGC CTG GGC AAC AGA GCG AGA12961 Met Val Ala Pro Leu Gln Ser Ser Leu Gly Asn Arg Ala Arg 141297 CCC CGT CTC TAT AAA ATA AAA CAT GCA AAT CAC TGT CCA GCC AAC ACC134415 Pro Arg Leu Tyr Lys Ile Lys His Ala Asn His Cys Pro Ala Asn Thr 301345 CCA GTC CAG ATC CCT GCA TTC GAT CCA AGG GAG GCA GAC TGC TGG GGG139231 Pro Val Gln Ile Pro Ala Phe Asp Pro Arg Glu Ala Asp Cys Trp Gly 461393 AAA TTG AGA GTC CTC GAG GTG CCC CTG GCA GTG AGC GGC CAG AAA GAG144047 Lys Leu Arg Val Leu Glu Val Pro Leu Ala Val Ser Gly Gln Lys Glu 621441 AAG CAG GAA GGC GCC AGC ATC ACG AGG AAC TGC TTC CCT CAA AGT GCT148863 Lys Gln Glu Gly Ala Ser Ile Thr Arg Asn Cys Phe Pro Gln Ser Ala 781489 GGG ATT ACA GGT GTG AGC CAC CGC GCC AGG CCT CAG CCC ACT TCT TTT153679 Gly Ile Thr Gly Val Ser His Arg Ala Arg Pro Gln Pro Thr Ser Phe 941537 GGG TGG CAA TGG TTT GGA TAT CGT TTG TCC TCA CTA AAA TTC ATG TTG158495 Gly Trp Gln Trp Phe Gly Tyr Arg Leu Ser Ser Leu Lys Phe Met Leu 1101585 AGA TTC GAG CCC CAG TGT GGC AGG TGT TGG GAT GTG GGG CCT CAT AGG1632111 Arg Phe Glu Pro Gln Cys Gly Arg Cys Trp Asp Val Gly Pro His Arg 1261633 AGC TGT GTG GTC TTG GAG GTG GAG TCC TCA TGG ATA GAT TAA TGC CTG1680127 Ser Cys Val Val Leu Glu Val Glu Ser Ser Trp Ile Asp *** 1401681 CCT TAA GGG GTG AGT GAG TGC TCA CCC TTG GGA ATT TGG GAA TTT GGT17281729 TTT CTC TCC CTT GCT TCC TTC AGC ACC ATG TGA TCT CTG TGC ACA CAG17761777 CTG CAT CCT TCT GCC CTC CCC CAG AAG CAG CAG CAG CCT CAG GGA TGA18241825 GGG AGG TCC TCA GTG AGT GCA CCT GCC CAG TCT TGA ACC TTC CAG CCA18721873 TCA GAA TCT GAG CCA AAT CAA CCT CTT CCT TTT ATA AAG ACC CAG CCT19201921 CAG GTC TTC TGT CAG AGC AAC ACA AAA TGG ACT CAG CAC GGA TCA AAT19681969 TGT GTC TCC CCC ACC CCC ACA AAA AAC TTT ATA TTA AAA TCC TAA CCC20162017 CCA GCA AAA AAA AAA AAA AAA AA 20393.PP9974A核苷酸序列(SEQ ID NO7)长度26301 GGCGAACACA GCACACACGA ACACAGCACA CACAGCACAC ACACAAACAC AGCACACACA61 TGCACACAGC ACATGCACAC ACAGCACACA CATGAACACA GCACACAGCA CACACATGCA121 CACAGCACAC ACGCATGCAC AGCACACATG AACACAGCAC ACACAAACAC ACAGCACACA181 CATGCACACA CAGCACACAC ACTCATGCGC AGCACATACA TGAACACAGC TCACAGCACA241 CAAACACGCA GCACACACGT TGCACACGCA AGCACCCACC TGCACACACA CATGCGCACA301 CACACGCACA CCCCCACAAA ATTGGATGAA AACAATAAGC ATATCTAAGC AACTACGATA361 TCTGTATGGA TCAGGCCAAA GTCCCGCTAA GATTCTCCAA TGTTTTCATG GTCTGAGCCC421 CCCTCCTGTT CCCATCTGCA CTGCCCCTCG GCCCTGTCTG TGCCCTGCCT CTCAGAGGAG481 GGGGCTCAGA TGGTGCGGCC TGAGTGTGCG GCCGGCGGCA TTTGGGATAC ACCCGTAGGG541 TGGGCGGGGT GTGTCCCAGG CCTAATTCCA TCTTTCCACC ATGACAGAGA TGCCCTTGTG601 AGGCTGGCCT CCTTGGCGCC TGTCCCCACG GCCCCCGCAG CGTGACGCAC GATGCTCCCC661 ATACCCCACC CATTCCCGAT ACACCTTACT TACTGTGTGT TGGCCCAGCC AGAGTGAGGA721 AGGAGTTTGG CCACATTGGA GATGGCGGTA GCTGAGCAGA CATGCCCCCA CGAGTAGCCT781 GACTCCCTGG TGTGCTCCTG GAAGGAAGAT CTTGGGGACC CCCCCACCGG AGCACACCTA841 GGGATCATCT TTGCCCGTCT CCTGGGGACC CCCCAAGAAA TGTGGAGTCC TCGGGGGCCG901 TGCACTGATG CGGGGAGTGT GGGAAGTCTG GCGGTTGGAG GGGTGGGTGG GGGGCAGTGG961 GGGCTGGGCG GGGGGAGTTC TGGGGTAGGA AGTGGTCCCG GGAGATTTTG GATGGAAAAG1021 TCAGGAGGAT TGACAGCAGA CTTGCAGAAT TACATAGAGA AATTAGGAAC CCCCAAATTT1081 CATGTCAATT GATCTATTCC CCCTCTTTGT TTCTTGGGGC ATTTTTCCTT TTTTTTTTTT1141 TTTTGTTTTT TTTTTACCCC TCCTTAGCTT TATGCGCTCA GAAACCAAAT TAAACCCCCC1201 CCCCATGTAA CAGGGGGGCA GTGACAAAAG CAAGAACGCA CGAAGCCAGC CTGGAGACCA1261 CCACGTCCTG CCCCCCGCCA TTTATCGCCC TGATTGGATT TTGTTTTTCA TCTGTCCCTG1321 TTGCTTGGGT TGAGTTGAGG GTGGAGCCTC CTGGGGGGCA CTGGCCACTG AGCCCCCTTG1381 GAGAAGTCAG AGGGGAGTGG AGAAGGCCAC TGTCCGGCCT GGCTTCTGGG GACAGTGGCT1441 GGTCCCCAGA AGTCCTGAGG GCGGAGGGGG GGGTTGGGCA GGGTCTCCTC AGGTGTCAGG1501 AGGGTGCTCG GAGGCCACAG GAGGGGGCTC CTGGCTGGCC TGAGGCTGGC CGGAGGGGAA1561 GGGGCTAGCA GGTGTGTAAA CAGAGGGTTC CATCAGGCTG GGGCAGGGTG GCCGCCTTCC1621 GCACACTTGA GGAACCCTCC CCTCTCCCTC GGTGACATCT TGCCCGCCCC TCAGCACCCT1681 GCCTTGTCTC CAGGAGGTCC GAAGCTCTGT GGGACCTCTT GGGGGCAAGG TGGGGTGAGG1741 CCGGGGAGTA GGGAGGTCAG GCGGGTCTGA GCCCACAGAG CAGGAGAGCT GCCAGGTCTG1801 CCCATCGACC AGGTTGCTTG GGCCCCGGAG CCCACGGGTC TGGTGATGCC ATAGCAGCCA1861 CCACCGCGGC GCCTAGGGCT GCGGCAGGGA CTCGGCCTCT GGGAGGTTTA CCTCGCCCCC1921 ACTTGTGCCC CCAGCTCAGC CCCCCTGCAC GCAGCCCGAC TAGCAGTCTA GAGGCCTGAG1981 GCTTCTGGGT CCTGGTGACG GGGCTGGCAT GACCCCGGGG GTCGTCCATG CCAGTCCGCC2041 TCAGTCGCAG AGGGTCCCTC GGCAAGCGCC CTGTGAGTGG GCCATTCGGA ACATTGGACA2101 GAAGCCCAAA GAGCCAAATT GTCACAATTG TGGAACCCAC ATTGGCCTGA GATCCAAAAC2161 GCTTCGAGGC ACCCCAAATT ACCTGCCCAT TCGTCAGGAC ACCCACCCAC CCAGTGTTAT2221 ATTCTGCCTC GCCGGAGTGG GTGTTCCCGG GGGCACTTGC CGACCAGCCC CTTGCGTCCC2281 CAGGTTTGCA GCTCTCCCCT GGGCCACTAA CCATCCTGGC CCGGGCTGCC TGTCTGACCT2341 CCGTGCCTAG TCGTGGCTCT CCATCTTGTC TCCTCCCCGT GTCCCCAATG TCTTCAGTGG2401 GGGGCCCCCT CTTGGGTCCC CTCCTCTGCC ATCACCTGAA GACCCCCACG CCAAACACTG2461 AATGTCACCT GTGCCTGCCG CCTCGGTCCA CCTTGCGGCC CGTGTTTGAC TCAACTCAGC2521 TCCTTTAACG CTAATATTTC CGGCAAAATC CCATGCTTGG GTTTTGTCTT TAACCTTGTA2581 ACGCTTGCAA TCCCAATAAA GCATTAAAAG TCAAAAAAAA AAAAAAAAAAB核苷酸序列(SEQ ID NO8)长度1131 MTPGVVHASP PQSQRVPRQA PCEWAIRNIG QKPKEPNCHN CGTHIGLRSK TLRGTPNYLP61 IRQDTHPPSV IFCLAGVGVP GGTCRPAPCV PRFAALPWAT NHPGPGCLSD LRAC.核苷酸及氨基酸组合序列(SEQ ID NO9) 克隆号PP9974起始编码子2009 ATG 终止编码子2348 TAG 蛋白质分子量12086.381 G GCG AAC ACA GCA CAC ACG AAC ACA GCA CAC ACA GCA CAC ACA CAA 4647 ACA CAG CAC ACA CAT GCA CAC AGC ACA TGC ACA CAC AGC ACA CAC ATG 9495 AAC ACA GCA CAC AGC ACA CAC ATG CAC ACA GCA CAC ACG CAT GCA CAG142143 CAC ACA TGA ACA CAG CAC ACA CAA ACA CAC AGC ACA CAC ATG CAC ACA190191 CAG CAC ACA CAC TCA TGC GCA GCA CAT ACA TGA ACA CAG GTC ACA GCA238239 CAC AAA CAC GCA GCA CAC ACG TTG CAC ACG CAA GCA CCC ACC TGC ACA286287 CAC ACA TGC GCA CAC ACA CGC ACA CCC CCA CAA AAT TGG ATG AAA ACA334335 ATA AGC ATA TCT AAG CAA CTA CGA TAT CTG TAT GGA TCA GGC CAA AGT382383 CCC GCT AAG ATT CTC CAA TGT TTT CAT GGT CTG AGC CCC CCT CCT GTT430431 CCC ATC TGC ACT GCC CCT CGG CCC TGT CTG TGC CCT GCC TCT CAG AGG478479 AGG GGG CTC AGA TGG TGC GGC CTG AGT GTG CGG CCG GCG GCA TTT GGG526527 ATA CAC CCG TAG GGT GGG CGG GGT GTG TCC CAG GCC TAA TTC CAT CTT574575 TCC ACC ATG ACA GAG ATG CCC TTG TGA GGC TGG CCT CCT TGG CGC CTG622623 TCC CCA CGG CCC CCG CAG CGT GAC GCA CGA TGC TCC CCA TAC CCC ACC670671 CAT TCC CGA TAC ACC TTA CTT ACT GTG TGT TGG CCC AGC CAG AGT GAG718719 GAA GGA GTT TGG CCA CAT TGG AGA TGG CGG TAG CTG AGC AGA CAT GCC 766767 CCC ACG AGT AGC CTG ACT CCC TGG TGT GCT CCT GGA AGG AAG ATC TTG 814815 GGG ACC CCC CCA CCG GAG CAC ACC TAG GGA TCA TCT TTG CCC GTC TCC 862863 TGG GGA CCC CCC AAG AAA TGT GGA GTC CTC GGG GGC CGT GCA CTG ATG 910911 CGG GGA GTG TGG GAA GTC TGG CGG TTG GAG GGG TGG GTG GGG GGC AGT 958959 GGG GGC TGG GCG GGG GGA GTT CTG GGG TAG GAA GTG GTC CCG GGA GAT10061007 TTT GGA TGG AAA AGT CAG GAG GAT TGA CAG CAG ACT TGC AGA ATT ACA10541055 TAG AGA AAT TAG GAA CCC CCA AAT TTC ATG TCA ATT GAT CTA TTC CCC11021103 CTC TTT GTT TCT TGG GGC ATT TTT CCT TTT TTT TTT TTT TTT GTT TTT11501151 TTT TTA CCC CTC CTT AGC TTT ATG CGC TCA GAA ACC AAA TTA AAC CCC11981199 CCC CCC ATG TAA CAG GGG GGC AGT GAC AAA AGC AAG AAC GCA CGA AGC12461247 CAG CCT GGA GAC CAC CAC GTC CTG CCC CCC GCC ATT TAT CGC CCT GAT12941295 TGG ATT TTG TTT TTC ATC TGT CCC TGT TGC TTG GGT TGA GTT GAG GGT13421343 GGA GCC TCC TGG GGG GCA CTG GCC ACT GAG CCC CCT TGG AGA AGT CAG13901391 AGG GGA GTG GAG AAG GCC ACT GTC CGG CCT GGC TTC TGG GGA CAG TGG14381439 CTG GTC CCC AGA AGT CCT GAG GGC GGA GGG GGG GGT TGG GCA GGG TCT14861487 CCT CAG GTG TCA GGA GGG TGC TCG GAG GCC ACA GGA GGG GGC TCC TGG15341535 CTG GCC TGA GGC TGG CCG GAG GGG AAG GGG CTA GCA GGT GTG TAA ACA15821583 GAG GGT TCC ATC AGG CTG GGG CAG GGT GGC CGC CTT CCG CAC ACT TGA16301631 GGA ACC CTC CCC TCT CCC TCG GTG ACA TCT TGC CCG CCC CTC AGC ACC16781679 CTG CCT TGT CTC CAG GAG GTC CGA AGC TCT GTG GGA CCT CTT GGG GGC17261727 AAG GTG GGG TGA GGC CGG GGA GTA GGG AGG TCA GGC GGG TCT GAG CCC17741775 ACA GAG CAG GAG AGC TGC CAG GTC TGC CCA TCG ACC AGG TTG CTT GGG18221823 CCC CGG AGC CCA CGG GTC TGG TGA TGC CAT AGC AGC CAC CAC CGC GGC18701871 GCC TAG GGC TGC GGC AGG GAC TCG GCC TCT GGG AGG TTT ACC TCG CCC19181919 CCA CTT GTG CCC CCA GCT CAG CCC CCC TGC ACG CAG CCC GAC TAG CAG19661967 TCT AGA GGC CTG AGG CTT CTG GGT CCT GGT GAC GGG GCT GGC ATG ACC20141 Met Thr 22015 CCG GGG GTC GTC CAT GCC AGT CCG CCT CAG TCG CAG AGG GTC CCT CGG20623 Pro Gly Val Val His Ala Ser Pro Pro Gln Ser Gln Arg Val Pro Arg 182063 CAA GCG CCC TGT GAG TGG GCC ATT CGG AAC ATT GGA CAG AAG CCC AAA211019 Gln Ala Pro Cys Glu Trp Ala Ile Arg Asn Ile Gly Gln Lys Pro Lys 342111 GAG CCA AAT TGT CAC AAT TGT GGA ACC CAC ATT GGC CTG AGA TCC AAA215835 Glu Pro Asn Cys His Asn Cys Gly Thr His Ile Gly Leu Arg Ser Lys 502159 ACG CTT CGA GGC ACC CCA AAT TAC CTG CCC ATT CGT CAG GAC ACC CAC220651 Thr Leu Arg Gly Thr Pro Asn Tyr Leu Pro Ile Arg Gln Asp Thr His 562207 CCA CCC AGT GTT ATA TTC TGC CTC GCC GGA GTG GGT GTT CCC GGG GGC225467 Pro Pro Ser Val Ile Phe Cys Leu Ala Gly Val Gly Val Pro Gly Gly 822255 ACT TGC CGA CCA GCC CCT TGC GTC CCC AGG TTT GCA GCT CTC CCC TGG230283 Thr Cys Arg Pro Ala Pro Cys Val Pro Arg Phe Ala Ala Leu Pro Trp 982303 GCC ACT AAC CAT CCT GGC CCG GGC TGC CTG TCT GAC CTC CGT GCC TAG235099 Ala Thr Asn His Pro Gly Pro Gly Cys Leu Ser Asp Leu Arg Ala *** 1142351 TCG TGG CTC TCC ATC TTG TCT CCT CCC CGT GTC CCC AAT GTC TTC AGT23982399 GGG GGG CCC CCT CTT GGG TCC CCT CCT CTG CCA TCA CCT GAA GAC CCC24462447 CAC GCC AAA CAC TGA ATG TCA CCT GTG CCT GCC GCC TCG GTC CAC CTT24942495 GCG GCC CGT GTT TGA CTC AAC TCA GCT CCT TTA ACG CTA ATA TTT CCG25422543 GCA AAA TCC CAT GCT TGG GTT TTG TCT TTA ACC TTG TAA CGC TTG CAA25902591 TCC CAA TAA AGC ATT AAA AGT CAA AAA AAA AAA AAA AAA A 26304.PP10443A核苷酸序列(SEQ ID NO10)长度25251 GCCGGACCTT CAGGCCCTGG GGTGAATTCA GCTGCTCCTA CATCAGCTTC CGGAACCACC61 AAAAATTCAA ATTGGGATTT TCCGGAGTAA ACAAGAGCCT ATAGCCCTTT GCTCAATGCT121 GGATTTAATA CGTATATATT TTTAAGCGAG TTGGTTTTTT CCCCTTTGAT TTTTGATCTT181 CGCGACAGTT CCTCCCACGC ATATTATCGT TGTTGCCGTC GTTTTCTCTC CCCGCGTGGC241 TCCTTGACCT GCGAGGGAGA GAGAGGACAC CGAAGCCGGG AGCTCGCAGG GACCATGTAT301 CAGAGCTTGG CCATGGCCGC CAACCACGGG CCGCCCCCCG GTGCCTACGA GGCGGGCGGC361 CCCGGCGCCT TCATGCACGG CGCGGGCGCC GCGTCCTCGC CAGTCTACGT GCCCACACCG421 CGGGTGCCCT CCTCCGTGCT GGGCCTGTCC TACGTCCAGG GCGGAGGCGC GGGCTCTGCG481 TCCGGAGGCG CCTCGGGCGG CAGCTCCGGT GGGGCCGCGT CTGGTGCGGG GCCCGGGACC541 CAGCAGGGCA GCCCGGGATG GAGCCAGGCG GGAGCCGACG GAGCCGCTTA CACCCCGCCG601 CCGGTGTCGC CGCGCTTCTC CTTCCCGGGG ACCACCGGGT CCCTGGCGGC CGCCGCCGCC661 GCTGCCGCGG CCCGGGAAGC TGCGGCCTAC AGCAGTGGCG GCGGAGCGGC GGGTGCGGGC721 CTGGCGGGCC GCGAGCAGTA CGGGCGCGCC GGCTTCGCGG GCTCCTACTC CAGCCCCTAC781 CCGGCTTACA TGGCCGACGT GGGCGCGTCC TGGGCCGCAG CCGCCGCCGC CTCCGCCGGC841 CCCTTCGACA GCCCGGTCCT GCACAGCCTG CCCGGCCGGG CCAACCCGGC CGCCCGACAC901 CCCAATCTCG GTGAGTAGGA GCGCGAGGGC TGGGGCGCGT GAGGGCCGGG GCAGGGGCCG961 TCTTGAGCCC TGTCGAGGGC CTCTTGTTTT TCCACCAACG CCTTCGTTGG GCTGGGGATG1021 GTGCTTCACT ACCTCGAGTT TCTAGGGAAG GCAGAAGCCA GTGCGGGGCT GGCGACATCA1081 CAGCCCCAGA AGACCGGCTT CTGTGGAAGG GGCCGGGCCT GCCCGCCGGG GCCTCTTCTG1141 AGATGGTGTC AGGGTCGGAG TGCGGCCTCC CCGCCATCCC AGACATCGAC CGTGGCCGCG1201 CTGCGCTGTG GGTGACGCGG GAGGACAGCG GGCTCCCTGG AGAGCCGGGG GCAGCGGCCT1261 GGGATTTCCT CGTGGAAGGT GCTGGAGATT GCTGAGTTTC TGCGCCCCTT TCCTCCCCGC1321 CCGCCCTCGG GCCTCCGCAG GGAACTGATT ACAATGGTTT GGACCGCAGA CCTTCTGGGC1381 CATTTGGCGG CCCAGCTGGA GGATCCCTCG GGGTAGCTGA TGATTTTCCC GTCGGGGGTC1441 TCACACCGAG AACAAAGGAG GGATGGACAA AGGAGACGCC GGGGAGATGC GCGGAACAGG1501 AGCCGGCACT GTGCGGGTGC CACCCGGCCG AGCGCGTGGG CGCATCATGC GGGCAGCGGG1561 GGGGGGGGGC GCACACGCCC GGTCAGTGTC CGGGAACATA GGGACCTCAA ACGGGCTTGT1621 TCATGACACC CGAGTTAAAT GGAGACTTTG CAGTCGCTTG CACGCGTGGA GCCTCCTCTT1681 CTCGCGTGGG CCAGGGTTGG AAATAACCGT TGTGGTAGGT TCCATGCAGT GTTTCCATCG1741 GATGTCAGAC GGGGAGGGAC GGCAAACCTG TCTCAACCTC CACTGATTCA CAAATAAACG1801 CAGCGGGATC TGAGAAGGGG CCTGAGTACA CGGGCCGGGG GAGAAAGGGA AGTGGCAACC1861 CCTAGTTCAA AATGCAAACG ACCTCTGGAA TTTCGGGAAG AGACGGAGGA GTGAGTTTGG1921 ATTGAGCCCA CCCTGTGGGG GAGGGGAAGC CCAGGCTTGA GAAGCAAAGC TCGCGTTTAT1981 TGACCACCTA CTAAGTGCTA AATCCTTCTG CATTTGTTCT CACTTTGAAG AGTAAAGGCT2041 ACCCCTGCCA GGTTTCCAGT CTTGGGCTGG CTCCGAGAAG GGCCTAGGCT TTGAAGCGCT2101 TTTAAATTGT CCTCTGGCCC TGGGTGGCCA GGGAAGGTTC CCGGGGGTGC AGCCAAATAC2161 ACATCGCCGG CAAACTGATT AACCCTGAAA GTGGCGCCGA GGCCCGGTCT GTGGCTCTTG2221 GTGTTCCCCT CCCCCTCACC CCTCTTGGGG GAGCCAGACG GCCACCCCCA GGGGAGGAGG2281 GGCCCGGCCG AGCCTCGCCG CGACTTTTGC GAGATAGCGC GGCGACATGG CCACACAATG2341 GAGCCCGCAG GCGGGAGTGC GGGGCGGGGC GCGGCGCCCT GGCCTTGCGC GCTTACGGGG2401 TCCTCTCCAG GGCCCTCTGG GGCCTCTGAC TTAAAATAGG GAGGACTGGG CCAGGAGATC2461 GAGACCATCC TGGCCAACCT GTTGAAACCC CGCCTCTACT AAAATACAAA AAAAAAAAAA2521 AAAAAB核苷酸序列(SEQ ID NO11)长度2071 MYQSLAMAAN HGPPPGAYEA GGPGAFMHGA GAASSPVYVP TPRVPSSVLG LSYLQGGGAG61 SASGGASGGS SGGAASGAGP GTQQGSPGWS QAGADGAAYT PPPVSPRFSF PGTTGSLAAA121 AAAAAAREAA AYSSGGGAAG AGLAGREQYG RAGFAGSYSS PYPAYMADVG ASWAAAAAAS181 AGPFDSPVLH SLPGRANPAA RHPNLGEC.核苷酸及氨基酸组合序列(SEQ ID NO12) 克隆号PP10443起始编码子295 ATG 终止编码子916 TAG 蛋白质分子量19350.811 GCC GGA CCT TCA GGC CCT GGG GTG AAT TCA GCT GCT CCT ACA TCA GCT 4849 TCC GGA ACC ACC AAA AAT TCA AAT TGG GAT TTT CCG GAG TAA ACA AGA 9697 GCC TAT AGC CCT TTG CTC AAT GCT GGA TTT AAT ACG TAT ATA TTT TTA 144145 AGC GAG TTG GTT TTT TCC CCT TTG ATT TTT GAT CTT CGC GAC AGT TCC 192193 TCC CAC GCA TAT TAT CGT TGT TGC CGT CGT TTT CTC TCC CCG CGT GGC 240241 TCC TTG ACC TGC GAG GGA GAG AGA GGA CAC CGA AGC CGG GAG CTC GCA 288289 GGG ACC ATG TAT CAG AGC TTG GCC ATG GCC GCC AAC CAC GGG CCG CCC 3361 Met Tyr Gln Ser Leu Ala Met Ala Ala Asn His Gly Pro Pro 14337 CCC GGT GCC TAC GAG GCG GGC GGC CCC GGC GCC TTC ATG CAC GGC GCG 38415 Pro Gly Ala Tyr Glu Ala Gly Gly Pro Gly Ala Phe Met His Gly Ala 30385 GGC GCC GCG TCC TCG CCA GTC TAC GTG CCC ACA CCG CGG GTG CCC TCC 43231 Gly Ala Ala Ser Ser Pro Val Tyr Val Pro Thr Pro Arg Val Pro Ser 46433 TCC GTG CTG GGC CTG TCC TAC CTC CAG GGC GGA GGC GCG GGC TCT GCG 48047 Ser Val Leu Gly Leu Ser Tyr Leu Gln Gly Gly Gly Ala Gly Ser Ala 62481 TCC GGA GGC GCC TCG GGC GGC AGC TCC GGT GGG GCC GCG TCT GGT GCG 52863 Ser Gly Gly Ala Ser Gly Gly Ser Ser Gly Gly Ala Ala Ser Gly Ala 78529 GGG CCC GGG ACC CAG CAG GGC AGC CCG GGA TGG AGC CAG GCG GGA GCC 57679 Gly Pro Gly Thr Gln Gln Gly Ser Pro Gly Trp Ser Gln Ala Gly Ala 94577 GAC GGA GCC GCT TAC ACC CCG CCG CCG GTG TCG CCG CGC TTC TCC TTC 62495 Asp Gly Ala Ala Tyr Thr Pro Pro Pro Val Ser Pro Arg Phe Ser Phe 110625 CCG GGG ACC ACC GGG TCC CTG GCG GCC GCC GCC GCC GCT GCC GCG GCC 672111 Pro Gly Thr Thr Gly Ser Leu Ala Ala Ala Ala Ala Ala Ala Ala Ala 126673 CGG GAA GCT GCG GCC TAC AGC AGT GGC GGC GGA GCG GCG GGT GCG GGC 720127 Arg Glu Ala Ala Ala Tyr Ser Ser Gly Gly Gly Ala Ala Gly Ala Gly 142721 CTG GCG GGC CGC GAG CAG TAC GGG CGC GCC GGC TTC GCG GGC TCC TAC 768143 Leu Ala Gly Arg Glu Gln Tyr Gly Arg Ala Gly Phe Ala Gly Ser Tyr 158769 TCC AGC CCC TAC CCG GCT TAC ATG GCC GAC GTG GGC GCG TCC TGG GCC 816159 Ser Ser Pro Tyr Pro Ala Tyr Met Ala Asp Val Gly Ala Ser Trp Ala 174817 GCA GCC GCC GCC GCC TCC GCC GGC CCC TTC GAC AGC CCG GTC CTG CAC 864175 Ala Ala Ala Ala Ala Ser Ala Gly Pro Phe Asp Ser Pro Val Leu His 190865 AGC CTG CCC GGC CGG GCC AAC CCG GCC GCC CGA CAC CCC AAT CTC GGT 912191 Ser Leu Pro Gly Arg Ala Asn Pro Ala Ala Arg His Pro Asn Leu Gly 206913 GAG TAG GAG CGC GAG GGC TGG GGC GCG TGA GGG CCG GGG CAG GGG CCG 960207 Glu *** 208961 TCT TGA GCC CTG TCG AGG GCC TCT TGT TTT TCC ACC AAC GCC TTC GTT10081009 GGG CTG GGG ATG GTG CTT CAC TAC CTC GAG TTT CTA GGG AAG GCA GAA10561057 GCC AGT GCG GGG CTG GCG ACA TCA CAG CCC CAG AAG ACC GGC TTC TGT11041105 GGA AGG GGC CGG GCC TGC CCG CCG GGG CCT CTT CTG AGA TGG TGT CAG11521153 GGT CGG AGT GCG GCC TCC CCG CCA TCC CAG ACA TCG ACC GTG GCC GCG12001201 CTG CGC TGT GGG TGA CGC GGG AGG ACA GCG GGC TCC CTG GAG AGC CGG12481249 GGG CAG CGG CCT GGG ATT TCC TCG TGG AAG GTG CTG GAG ATT GCT GAG12961297 TTT CTG CGC CCC TTT CCT CCC CGC CCG CCC TCG GGC CTC CGC AGG GAA13441345 CTG ATT ACA ATG GTT TGG ACC GCA GAC CTT CTG GGC CAT TTG GCG GCC13921393 CAG CTG GAG GAT CCC TCG GGG TAG CTG ATG ATT TTC CCG TCG GGG GTC14401441 TCA CAC CGA GAA CAA AGG AGG GAT GGA CAA AGG AGA CGC CGG GGA GAT14881489 GCG CGG AAC AGG AGC CGG CAC TGT GCG GGT GCC ACC CGG CCG AGC GCG15361537 TGG GCG CAT CAT GCG GGC AGC GGG GGG GGG GGG CGC ACA CGC CCG GTC15841585 AGT GTC CGG GAA CAT AGG GAC CTC AAA CGG GCT TGT TCA TGA CAC CCG16321633 AGT TAA ATG GAG ACT TTG CAG TCG CTT GCA CGC GTG GAG CCT CCT CTT16801681 CTC GCG TGG GCC AGG GTT GGA AAT AAC CGT TGT GGT AGG TTC CAT GCA17281729 GTG TTT CCA TCG GAT GTC AGA CGG GGA GGG ACG GCA AAC CTG TCT CAA17761777 CCT CCA CTG ATT CAC AAA TAA ACG CAG CGG GAT CTG AGA AGG GGC CTG18241825 AGT ACA CGG GCC GGG GGA GAA AGG GAA GTG GCA ACC CCT AGT TCA AAA18721873 TGC AAA CGA CCT CTG GAA TTT CGG GAA GAG ACG GAG GAG TGA GTT TGG19201921 ATT GAG CCC ACC CTG TGG GGG AGG GGA AGC CCA GGC TTG AGA AGC AAA19681969 GCT CGC GTT TAT TGA CCA CCT ACT AAG TGC TAA ATC CTT CTG CAT TTG20162017 TTC TCA CTT TGA AGA GTA AAG GCT ACC CCT GCC AGG TTT CCA GTC TTG20642065 GGC TGG CTC CGA GAA GGG CCT AGG CTT TGA AGC GCT TTT AAA TTG TCC21122113 TCT GGC CCT GGG TGG CCA GGG AAG GTT CCC GGG GGT GCA GCC AAA TAC21602161 ACA TCG CCG GCA AAC TGA TTA ACC CTG AAA GTG GCG CCG AGG CCC GGT22082209 CTG TGG CTC TTG GTG TTC CCC TCC CCC TCA CCC CTC TTG GGG GAG CCA22562257 GAC GGC CAC CCC CAG GGG AGG AGG GGC CCG GCC GAG CCT CGC CGC GAC23042305 TTT TGC GAG ATA GCG CGG CGA CAT GGC CAC ACA ATG GAG CCC GCA GGC23522353 GGG AGT GCG GGG CGG GGC GCG GCG CCC TGG CCT TGC GCG CTT ACG GGG24002401 TCC TCT CCA GGG CCC TCT GGG GCC TCT GAC TTA AAA TAG GGA GGA CTG24482449 GGC CAG GAG ATC GAG ACC ATC CTG GCC AAC CTG TTG AAA CCC CGC CTC24962497 TAC TAA AAT ACA AAA AAA AAA AAA AAA AA 25255.PP10472A核苷酸序列(SEQ ID NO13)长度27871 GTCGGGGCTT TCTATGAGAG GCTGTGGCCA GAGAGGACCC TGGGCTGCCT GGACAGTCAG61 GACCTGGCTG TGGCCGATGG CCACCAACAC TCAGATCCGG CCGGAGGGAC ACAAAGGGAC121 ATGGGAGCGA GGTCAAGGGG CTCACAGGGG AGGAACGTGA GATGCGGGAG GAATCACGCA181 CACCAGCAGG TGCCGGCATT TCTAAAGGCG CCTGGGCAGC CTGGCTCATC CACCCTCAGG241 AGCGAGCATC GCCTGACACA GGGCACTTAG TGTCCACCAC CAAGTACCCT GTTGTCCCCA301 CCAACCCCAA GACACAAGAA GTCACCCCAG AGCCAGCCCC AGAGCGCTGG GAGGGGGGCA361 CTCACCCGTG TGTGAGGTAG GGGTGAGGGG TGTGGGGGGA GCCACTTCCT GCGTCCCCCG421 CAGGCGGCCG GAGGCTGTGG AAGGGAGGCC GCGGGTAGCC GGGTTCCGCG AGTGTCTCAG481 CCGCTCCTCT CGGTCCCTGC GCTCCCGCTC GGCGTCATCG GCGGCCCGGC TGGCACCCTG541 AGGAGGCAGG AGGTGAGGCC GGAATGGAAC CAGCTTTGGC AGAAAGCAAC CCTAGGTCCT601 AGGCTGCCCC GGCCACGTGA GAAAATACCT ACCAAAGGGC ACTGGGACGA GACTTTTGCC661 TGCAAAGCCC CCCACAGGCT GCACGTTTCT CCTCATGGGA TGACAGCATC ATCCCCACAA721 GGGGTCAGAG CCAGGCCTCT CAGCTCCCCC AACAATCGAA AAAACCCCAC TCGCCATGGC781 ATCTCCCTGT GGGCTCAGAA CTTCCTTAAA CTTCCAAATG GGCAGCAGCT ACCCCCTGCT841 GCTCTGTGAA CATGCTCACT AACACGTGCA GAAAGAGGAG AGGGACAGGA ACCATCGGAG901 GCCAAAGACA GGCCCCAAAT GGTGACAGCT GGGGAGGAAA GCGGGGTGGG GATGAGAGCG961 TTTGGTCGGA CGAGGAGTAC ACTCAGGGTC CGGACCCTGC AGCCTCCAAC AGCCTGTGCA1021 GGTGTGGTGG CGTGGCCAGC AGCCGGCAGC CGGATCTGTG CTGCACTATC CAGATGCACG1081 GGGGTGGGGA GGTCAGATTT TAAGCCGAGA CAGCAACCTA TGAAAAAGCA GATTCTAACT1141 GCCAATGCTG TGCGGCAGGG GCCTGCAAAC TACAGCCCCG GGGCCAAACC CAGGTGCCAC1201 TTCTTCCTGC AAGTACAGCT CATTGGACAC AGCCACGTTC ACCAGGCAAC ACACAGACCG1261 ACACACCTGC GGCTGCAGCA CCGTGCGGCC AGCACCGCCC AGACTCCTCA TGCTGCCATT1321 TACGGAAAAC GCTGGCCTAG CCTGCTCTGA GGGCCGGGTG ACTCTAATGC CGCAGGAGGG1381 TCGCTCTGAT TCCTCCCGAG GCAGCACAGC CCCGGCAGAG GGACTGATCT GCCCTGCCGA1441 GTGCACCCCT CCCGGCACCT GGGCCCCGAG GCTCGGGCCT GCCTCGCCTG CCATCTCTCC1501 GGTGCCTCCA AGTACTCCCC ACGCTGATGG GCACTTGGCA AGTAAGTCAA GATGAACAGA1561 GTGCACCCCT CCCAGCATCT GGAGACCCCG CCCCTCCCTG GCCCCTGCAC GACTACTGGA1621 CAAGGCTGCC GTTTTTGTAC CCTCCCAAGA GGCAGTTCTG CTCCTCCATC AGACTGCTGC1681 CTGGAAAAGC TCCAAATTCT ATTTAAAACT GACAACAAAA CAGTAAGTTT TTAATGAAGG1741 AACACAACAG TTCCACAGGA GCTTCATTTC TGACAGCGGT GTCTGAAAAG TAATTCAGCT1801 CAGACATGGA CCCAGGGCTG GGCTGCCTGT TTTTAGAGGC TCCACTGCAT ACTTCACACC1861 GCATCAAGAA AGCCACAGGG AAAATCAGCT CATGACAGGG TCAGTCAGGC TAGACGGGTA1921 GCACCTCACC AGGCCCCAAC CCCACTCATC TCGTGGGCAC CACGACCATG TGGCACAGCG1981 AATGGGAATG CGCACCCCCA GCCCCCACCC TCTGCCCCCA GGGCATGCTC TGGGCCCTAG2041 CTCCGCTTGG TGACAGGGAG GGAAGGGGCC TCCTGCTGTC CACACCCAGG AATTCCATGG2101 ACCCCTCTGC GTTCCCTAAT GGCGTCTTAC TTCTTGGCAC CCCTTTCTGG CAGGCAGACA2161 CCCACTCAGT CCAGGTCCTT GCCCACTACA CACTTGCCCT TCACAACCAG AGACACTCCC2221 TATATGGTAC AGCCCCTCAA CAAGACGGCC GCCGGCCTCT CACTGACAAG CCATCCCCCG2281 CACACCACAC TCAGCGAACG TGCTGGCAGT GCGACTTACA AATTTGAGCA TGTTCCAGTC2341 GAACACGTAG TCATAGGAGA AGCCCTGGCG ATGGAACAGA TTCCGGAAAA GCTGCCGCAG2401 GTACGAGTAG TCAGGCTTGT CGTCAAAACG CAAGGAACGG CAGAAATTCA GGTATGTGGC2461 AAATTCGGCT ACAAAACAAG AAACTCAAAG CTAACTCATG AAACCCAACT GCGACTCAAG2521 GTGTCTCTGC CAACGTCGCT GTCTACCTCC TGCTGCTGCA CACTCAAGGG GAGAAGGACA2581 GATGCAAAAC ACCTGTCAGA TTTCTAAGAC CTGAAGCCTT GAGAAAGCAT CGAAAAGTAT2641 TCAAGTCACG GCCGGGTGCG GCGGCTCACG CCTGTCACCC CAGCACTCTA GGAGGCTGAG2701 GAGGGCGGAT CACGAGGTCA GGAGATCAAG ACCATCCTGG CTAACACAGT GAAACCCCAT2761 CTCTACTGAA AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO14)长度1621 MASYFLAPLS GRQTPTQSRS LPTTHLPFTT RDTPYMVQPL NKTAAGLSLT SHPPHTTLSE61 RAGSATYKFE HVPVEHVVIG EALAMEQIPE KLPQVRVVRL VVKTQGTAEI QVCGKFGYKT121 RNSKLTHETQ LRLKVSLPTS LSTSCGCTLK GRRTDAKHLS DFC.核苷酸及氨基酸组合序列(SEQ ID NO15) 克隆号PP10472起始编码子2119 ATG 终止编码子2605 TAA 蛋白质分子量17887.731 GTC GGG GCT TTC TAT GAG AGG CTG TGG CCA GAG AGG ACC CTG GGC TGC 4849 CTG GAC AGT CAG GAC CTG GCT GTG GCC GAT GGC CAC CAA CAC TCA GAT 9697 CCG GCC GGA GGG ACA CAA AGG GAG ATG GGA GCG AGG TCA AGG GGC TCA 144145 CAG GGG AGG AAC GTG AGA TGC GGG AGG AAT CAC GCA CAC CAG CAG GTG 192193 CCG GCA TTT CTA AAG GCG CCT GGG CAG CCT GGC TCA TCC ACC CTC AGG 240241 AGC GAG CAT CGC CTG ACA CAG GGC ACT TAG TGT CCA CCA CCA AGT ACC 288289 CTG TTG TCC CCA CCA ACC CCA AGA CAC AAG AAG TCA CCC CAG AGC CAG 336337 CCC CAG AGC GCT GGG AGG GGG GCA CTC ACC CGT GTG TGA GGT AGG GGT 384385 GAG GGG TGT GGG GGG AGC CAC TTC CTG CGT CCC CCG CAG GCG GCC GGA 432433 GGC TGT GGA AGG GAG GCC GCG GGT AGC CGG GTT CCG CGA GTG TCT CAG 480481 CCG CTC CTC TCG GTC CCT GCG CTC CCG CTC GGC GTC ATC GGC GGC CCG 528529 GCT GGC ACC CTG AGG AGG CAG GAG GTG AGG CCG GAA TGG AAC CAG CTT 576577 TGG CAG AAA GCA ACC CTA GGT CCT AGG CTG CCC CGG CCA CGT GAG AAA 624625 ATA CCT ACC AAA GGG CAC TGG GAC GAG ACT TTT GCC TGC AAA GCC CCC 672673 CAC AGG CTG CAC GTT TCT CCT CAT GGG ATG ACA GCA TCA TCC CCA CAA 720721 GGG GTC AGA GCC AGG CCT CTC AGC TCC CCC AAC AAT CGA AAA AAC CCC 768769 ACT CGC CAT GGC ATC TCC CTG TGG GCT CAG AAC TTC CTT AAA CTT CCA 816817 AAT GGG CAG CAG CTA CCC CCT GCT GCT CTG TGA ACA TGC TCA CTA ACA 864865 CGT GCA GAA AGA GGA GAG GGA CAG GAA CCA TCG GAG GCC AAA GAC AGG 912913 CCC CAA ATG GTG ACA GCT GGG GAG GAA AGC GGG GTG GGG ATG AGA GCG 960961 TTT GGT CGG ACG AGG AGT ACA CTC AGG GTC CGG ACC CTG CAG CCT CCA10081009 ACA GCC TGT GCA GGT GTG GTG GCG TGG CCA GCA GCC GGC AGC CGG ATC10561057 TGT GCT GCA CTA TCC AGA TGC ACG GGG GTG GGG AGG TCA GAT TTT AAG11041105 CCG AGA CAG CAA CCT ATG AAA AAG CAG ATT CTA ACT GCC AAT GCT GTG11521153 CGG CAG GGG CCT GCA AAC TAC AGC CCC GGG GCC AAA CCC AGG TGC CAC12001201 TTC TTC CTG CAA GTA CAG CTC ATT GGA CAC AGC CAC GTT CAC CAG GCA12481249 ACA CAC AGA CCG ACA CAC CTG CGG CTG CAG CAC CGT GCG GCC AGC ACC12961297 GCC CAG ACT CCT CAT GCT GCC ATT TAC GGA AAA CGC TGG CCT AGC CTG13441345 CTC TGA GGG CCG GGT GAC TCT AAT GCC GCA GGA GGG TCG CTC TGA TTC13921393 CTC CCG AGG CAG CAC AGC CCC GGC AGA GGG ACT GAT CTG CCC TGC CGA14401441 GTG CAC CCC TCC CGG CAC CTG GGC CCC GAG GCT CGG GCC TGC CTC GCC14881489 TGC CAT CTC TCC GGT GCC TCC AAG TAC TCC CCA CGC TGA TGG GCA CTT15361537 GGC AAG TAA GTC AAG ATG AAC AGA GTG CAC CCC TCC CAG CAT CTG GAG15841585 ACC CCG CCC CTC CCT GGC CCC TGC ACG ACT ACT GGA CAA GGC TGC CGT16321633 TTT TGT ACC CTC CCA AGA GGC AGT TCT GCT CCT CCA TCA GAC TGC TGC16801681 CTG GAA AAG CTC CAA ATT CTA TTT AAA ACT GAC AAC AAA ACA GTA AGT17281729 TTT TAA TGA AGG AAC ACA ACA GTT CCA CAG GAG CTT CAT TTC TGA CAG17761777 CGG TGT CTG AAA AGT AAT TCA GCT CAG ACA TGG ACC CAG GGC TGG GCT18241825 GCC TGT TTT TAG AGG CTC CAC TGC ATA CTT CAC ACC GCA TCA AGA AAG18721873 CCA CAG GGA AAA TCA GCT CAT GAC AGG GTC AGT CAG GCT AGA CGG GTA19201921 GCA CCT CAC CAG GCC CCA ACC CCA CTC ATC TCG TGG GCA CCA CGA CCA19681969 TGT GGC ACA GCG AAT GGG AAT GCG CAC CCC CAG CCC CCA CCC TCT GCC20162017 CCC AGG GCA TGC TCT GGG CCC TAG CTC CGC TTG GTG ACA GGG AGG GAA20642065 GGG GCC TCC TGC TGT CCA CAC CCA GGA ATT CCA TGG ACC CCT CTG CGT21122113 TCC CTA ATG GCG TCT TAC TTC TTG GCA CCC CTT TCT GGC AGG CAG ACA21601 Met Ala Ser Tyr Phe Leu Ala Pro Leu Ser Gly Arg Gln Thr 142161 CCC ACT CAG TCC AGG TCC TTG CCC ACT ACA CAC TTG CCC TTC ACA ACC220815 Pro Thr Gln Ser Arg Ser Leu Pro Thr Thr His Leu Pro Phe Thr Thr 302209 AGA GAC ACT CCC TAT ATG GTA CAG CCC CTC AAC AAG ACG GCC GCC GGC225631 Arg Asp Thr Pro Tyr Met Val Gln Pro Leu Asn Lys Thr Ala Ala Gly 462257 CTC TCA CTG ACA AGC CAT CCC CCG CAC ACC ACA CTC AGC GAA CGT GCT230447 Leu Ser Leu Thr Ser His Pro Pro His Thr Thr Leu Ser Glu Arg Ala 622305 GGC AGT GCG ACT TAC AAA TTT GAG CAT GTT CCA GTC GAA CAC GTA GTC235263 Gly Ser Ala Thr Tyr Lys Phe Glu His Val Pro Val Glu His Val Val 782353 ATA GGA GAA GCC CTG GCG ATG GAA CAG ATT CCG GAA AAG CTG CCG CAG240079 Ile Gly Glu Ala Leu Ala Met Glu Gln Ile Pro Glu Lys Leu Pro Gln 942401 GTA CGA GTA GTC AGG CTT GTC GTC AAA ACG CAA GGA ACG GCA GAA ATT244895 Val Arg Val Val Arg Leu Val Val Lys Thr Gln Gly Thr Ala Glu Ile 1102449 CAG GTA TGT GGC AAA TTC GGC TAC AAA ACA AGA AAC TCA AAG CTA ACT2496111 Gln Val Cys Gly Lys Phe Gly Tyr Lys Thr Arg Asn Ser Lys Leu Thr 1262497 CAT GAA ACC CAA CTG CGA CTC AAG GTG TCT CTG CCA ACG TCG CTG TCT2544127 His Glu Thr Gln Leu Arg Leu Lys Val Ser Leu Pro Thr Ser Leu Ser 1422545 ACC TCC TGC TGC TGC ACA CTC AAG GGG AGA AGG ACA GAT GCA AAA CAC2592143 Thr Ser Cys Cys Cys Thr Leu Lys Gly Arg Arg Thr Asp Ala Lys His 1582593 CTG TCA GAT TTC TAA GAC CTG AAG CCT TGA GAA AGC ATC GAA AAG TAT2640159 Leu Ser Asp Phe *** 1632641 TCA AGT CAC GGC CGG GTG CGG CGG CTC ACG CCT GTC ACC CCA GCA CTC26882689 TAG GAG GCT GAG GAG GGC GGA TCA CGA GGT CAG GAG ATC AAG ACC ATC27362737 CTG GCT AAC ACA GTG AAA CCC CAT CTC TAC TGA AAA AAA AAA AAA AAA27842785 AAA27876. PP11662A核苷酸序列(SEQ ID NO16)长度20671 GTGGAAAATG GGCATCTCTC CCTCCCATGT TAAGCTTTAA CCTCTGTAAT CTGCCTGTAT61 CTATAGGTGG GCATCTCACT CCATCAAAGG AGCCCAGCCT CTCTTTGTCC CTCTATCCAT121 GCAACAGTCT TCTCTGTGCA TTTCCCCAAG CTGGGCCCTC TTCTACTCTC CATTTAGGCC181 TGTTGATAAC TCCATTACCC ACCCATCACT GCTGTTCCTC CAGGGCCAGC ACTCGGGCGA241 GGCAGGGGAG CTGCCTTCGG TACATAATTT GAAGGGGCAC TCCCTCTTGG GCACATGCCG301 GCCCTGAGTG CCTCCCTTGC CTCACTCTGA TCCCAGCCCC ATAATGTCCT CAGTGGAAGG361 TGACTGGGGG CCGGTGCTGT GGGGAGAGTA GAAAGAGGGG TTGGCATGAC TAAAAATACC421 AGTATGTGTA TTAAGTATTT TGAGAATGAA ATGCCAAGGA GTGCCTACTG TATGCCAGCT481 CTGCTCTAGG AATGGAGTAG ACAGTGGACA CAAGAAGGAC TTACGCCCTG AGCACAGGTG541 CCAACAGTGA CAAGACTGGC AAGACGTGAG GGCATGAATG GTTCATTCAG GCAGCTGCTG601 CAGGTGTGGT CACCTGGTGC CATCTGCTGC TCCCTTTTCC ACTTTTCTAT GTCCTCCTTC661 CACCCCAAGT CCCGGATCAC TCGCTGTTTT CTGGCTAGCT CTTGGCATCT CCATCTGAGC721 CTAAAGTTGC CCACTGGCAC CAATAGATTC TGTTTGACCT GCTGTGCCCA TGCTCATCTT781 TGTCGGGGCT TGGCTTGGCA GCGAGTGAGG CTGGCATGGG GTGCTGAAGT GGGGTCTCAG841 TGAGGGGTGA CAGCGTGCTG GCAGTCCTCA CAGCCCTCGC TCGCTCTCGG CGCCTCCTCT901 GCCTGGGCTC CCACTTTGGC GGCACTTGAG GAGCCCTTCA GCCCACCGCT GCACTGTGGG961 GAGCCCCTTT CTGGGCTGGC CAAGGCCAGA GCAGGCTCCC TCAGCTTGCA GGGAGGTGTG1021 GATCGAGGAG GCGCGAAGCG GGAACCGGGG CTGCGTGCAG CGCTTGCGGG CCAGCTGGAG1081 TTCCGGGTGG GCATGGGGCT TGGCGGGCCT GCACTCGGAG CAGCCGGCCG GCCCTTCCGG1141 CCCCGGGCAG TGAGGGACTT GGCACCCGGG CCAGCGGGCT GCAGAGGGTG TACTGGGTCC1201 CCCAGCAGTG CCGGCCCACC TGCGCTGTGC TTGATTTCTC GCTGGGCCTT AGCTGCCTTC1261 CCGCGGGGCA GGGCTCGGGA CCTGCAGCCC GCCGTGCCTG AGCCTCCCAC CCGCTCCATG1321 GGCTCCTGTG GGGCCCGAGC CTCCCCGACG AGTACCACCC CCTGCTCCAG GGCGCCCAGT1381 CCCATCGACC ACCCAAGGGC TGAGGAGTGC GAGCGCACGG CGCGGGACTG GCAGGCAGCT1441 CCACCTGCAG CCCCGGTGCG GGATCCACTA GGTGAAGCCA GCTGGGCTCC TGAGTCTGAT1501 GGGGACGTGG AGAGTCCTTA TGTCCTGCTC AGGGATTGTA AACACACCAA TCAGCACCCT1561 GTGTTTAGCT CAAGGTTTGT GAGTGCACCA GTCGACACTC TGTATCTAGC TGCTCTGGTG1621 GGGCCTCGGA GAACCTTTAT ATCTAGCTCA GGGATTGTAA ATACACCCAT CGGCACTGTG1681 TATCTAGCTC AAGGTTTATA AACACACCAA TCAACACCCT GTGTCTAGCT CAGGGTTTGT1741 GAGTGCACCA ATCAACACTC TGTATCTAGC TGCTCTGGTG GGGCCTTGGA GAACCTGTGT1801 GTCGAAACTC TGTATCTAAC TAATCTGATG GGGACGTGGA GAACCTTTGT ATCTAGCTCA1861 GGGATTGTAA ACGCACCAAT CAACGACCTG TCAAAACAGG CCACTCGGCT CTACCAATCA1921 GCAGGATGTG GGTGGGGCCA GATAAGAGAA TAAAAGCAGG CTGCCCGAGC CAGCATTGGC1981 AACTCGCTCG GGTCCCCTTC CACGCTGTGG GAGCTTTGTT CTTTGCAATA AATCTTGCTA2041 CTGCTCAAAA AAAAAAAAAA AAAAAAAB核苷酸序列(SEQ ID NO17)长度2021 MGLGGPALGA AGRPFRPRAV RDLAPGPAGC RGCTGSPSSA GPPALCLISR WALAAFPRGR61 ARDLQPAVPE PPTRSMGSCG ARASPTSTTP CSRAPSPIDH PRAEECERTA RDWQAAPPAA121 PVRDPLGEAS WAPESDGDVE SPYVLLRDCK HTNQHPVFSS RFVSAPVDTL YLAALVGPRR181 TFISSSGIVN TPIGTVYLAQ GLC.核苷酸及氨基酸组合序列(SEQ ID NO18) 克隆号PP11662起始编码子1093 ATG 终止编码子1699 TAA 蛋白质分子量21042.591 GTG GAA AAT GGG CAT CTC TCC CTC CCA TGT TAA GCT TTA ACC TCT GTA 4849 ATC TGC CTG TAT CTA TAG GTG GGC ATC TCA CTC CAT CAA AGG AGC CCA 9697 GCC TCT CTT TGT CCC TCT ATC CAT GCA ACA GTC TTC TCT GTG CAT TTC 144145 CCC AAG CTG GGC CCT CTT CTA CTC TCC ATT TAG GCC TGT TGA TAA CTC 192193 CAT TAC CCA CCC ATC ACT GCT GTT CCT CCA GGG CCA GCA CTC GGG CGA 240241 GGC AGG GGA GCT GCC TTC GGT ACA TAA TTT GAA GGG GCA CTC CCT CTT 288289 GGG CAC ATG CCG GCC CTG AGT GCC TCC CTT GCC TCA CTC TGA TCC CAG 336337 CCC CAT AAT GTC CTC AGT GGA AGG TGA CTG GGG GCC GGT GCT GTG GGG 384385 AGA GTA GAA AGA GGG GTT GGC ATG ACT AAA AAT ACC AGT ATG TGT ATT 432433 AAG TAT TTT GAG AAT GAA ATG CCA AGG AGT GCC TAC TGT ATG CCA GCT 480481 CTG CTC TAG GAA TGG AGT AGA CAG TGG ACA CAA GAA GGA CTT ACG CCC 528529 TGA GCA CAG GTG CCA ACA GTG ACA AGA CTG GCA AGA CGT GAG GGC ATG 576577 AAT GGT TCA TTC AGG CAG CTG CTG CAG GTG TGG TCA CCT GGT GCC ATC 624625 TGC TGC TCC CTT TTC CAC TTT TCT ATG TCC TCC TTC CAC CCC AAG TCC 672673 CGG ATC ACT CGC TGT TTT CTG GCT AGC TCT TGG CAT CTC CAT CTG AGC 720721 CTA AAG TTG CCC ACT GGC ACC AAT AGA TTC TGT TTG ACC TGC TGT GCC 768769 CAT GCT CAT CTT TGT CGG GGC TTG GCT TGG CAG CGA GTG AGG CTG GCA 816817 TGG GGT GCT GAA GTG GGG TCT CAG TGA GGG GTG ACA GCG TGC TGG CAG 854865 TCC TCA CAG CCC TCG CTC GCT CTC GGC GCC TCC TCT GCC TGG GCT CCC 912913 ACT TTG GCG GCA CTT GAG GAG CCC TTC AGC CCA CCG CTG CAC TGT GGG 960961 GAG CCC CTT TCT GGG CTG GCC AAG GCC AGA GCA GGC TCC CTC AGC TTG10081009 CAG GGA GGT GTG GAT CGA GGA GGC GCG AAG CGG GAA CCG GGG CTG CGT10561057 GCA GCG CTT GCG GGC CAG CTG GAG TTC CGG GTG GGC ATG GGG CTT GGC11041 Met Gly Leu Gly 41105 GGG CCT GCA CTC GGA GCA GCC GGC CGG CCC TTC CGG CCC CGG GCA GTG11525 Gly Pro Ala Leu Gly Ala Ala Gly Arg Pro Phe Arg Pro Arg Ala Val 201153 AGG GAC TTG GCA CCC GGG CCA GCG GGC TGC AGA GGG TGT ACT GGG TCC120021 Arg Asp Leu Ala Pro Gly Pro Ala Gly Cys Arg Gly Cys Thr Gly Ser 361201 CCC AGC AGT GCC GGC CCA CCT GCG CTG TGC TTG ATT TCT CGC TGG GCC124837 Pro Ser Ser Ala Gly Pro Pro Ala Leu Cys Leu Ile Ser Arg Trp Ala 521249 TTA GCT GCC TTC CCG CGG GGC AGG GCT CGG GAC CTG CAG CCC GCC GTG129653 Leu Ala Ala Phe Pro Arg Gly Arg Ala Arg Asp Leu Gln Pro Ala Val 681297 CCT GAG CCT CCC ACC CGC TCC ATG GGC TCC TGT GGG GCC CGA GCC TCC134469 Pro Glu Pro Pro Thr Arg Ser Met Gly Ser Cys Gly Ala Arg Ala Ser 841345 CCG ACG AGT ACC ACC CCC TGC TCC AGG GCG CCC AGT CCC ATC GAC CAC139285 Pro Thr Ser Thr Thr Pro Cys Ser Arg Ala Pro Ser Pro Ile Asp His 1001393 CCA AGG GCT GAG GAG TGC GAG CGC ACG GCG CGG GAC TGG CAG GCA GCT1440101 Pro Arg Ala Glu Glu Cys Glu Arg Thr Ala Arg Asp Trp Gln Ala Ala 1161441 CCA CCT GCA GCC CCG GTG CGG GAT CCA CTA GGT GAA GCC AGC TGG GCT1488117 Pro Pro Ala Ala Pro Val Arg Asp Pro Leu Gly Glu Ala Ser Trp Ala 1321489 CCT GAG TCT GAT GGG GAC GTG GAG AGT CCT TAT GTC CTG CTC AGG GAT1536133 Pro Glu Ser Asp Gly Asp Val Glu Ser Pro Tyr Val Leu Leu Arg Asp 1481537 TGT AAA CAC ACC AAT CAG CAC CCT GTG TTT AGC TCA AGG TTT GTG AGT1584149 Cys Lys His Thr Asn Gln His Pro Val Phe Ser Ser Arg Phe Val Ser 1641585 GCA CCA GTC GAC ACT CTG TAT CTA GCT GCT CTG GTG GGG CCT CGG AGA1632165 Ala Pro Val Asp Thr Leu Tyr Leu Ala Ala Leu Val Gly Pro Arg Arg 1801633 ACC TTT ATA TCT AGC TCA GGG ATT GTA AAT ACA CCC ATC GGC ACT GTG1680181 Thr Phe Ile Ser Ser Ser Gly Ile Val Asn Thr Pro Ile Gly Thr Val 1961681 TAT CTA GCT CAA GGT TTA TAA ACA CAC CAA TCA ACA CCC TGT GTC TAG1728197 Tyr Leu Ala Gln Gly Leu *** 2031729 CTC AGG GTT TGT GAG TGC ACC AAT CAA CAC TCT GTA TCT AGC TGC TCT17761777 GGT GGG GCC TTG GAG AAC CTG TGT GTC GAA ACT CTG TAT CTA ACT AAT18241825 CTG ATG GGG ACG TGG AGA ACC TTT GTA TCT AGC TCA GGG ATT GTA AAC18721873 GCA CCA ATC AAC GAC CTG TCA AAA CAG GCC ACT CGG CTC TAC CAA TCA19201921 GCA GGA TGT GGG TGG GGC CAG ATA AGA GAA TAA AAG CAG GCT GCC CGA19681969 GCC AGC ATT GGC AAC TCG CTC GGG TCC CCT TCC ACG CTG TGG GAG CTT20162017 TGT TCT TTG CAA TAA ATC TTG CTA CTG CTC AAA AAA AAA AAA AAA AAA20642065 AAA20677.PP11741A核苷酸序列(SEQ ID NO19)长度32221 GTTGGGAAGG ACTTGGGGAC TCCACCTCTT GGCCTGGTTC CCATGGCCCC TAGGGGTCTA61 ACCTACCTGA TCCTGGGTTG GAGAAGCAGG ACCTTCTGGA AGCCCATGTT CCAGCGCTTG121 GGCCCCAGTC CTGATGGGGA TCAGGAATAG GCCCCCTTGC ACAGACCCCC ACCTGGCCAG181 CTCAGTGCCA GCAGACATCT TTCTACCTCA TGGTTCATCT ATGGAATTCT GGGGGTCCAC241 TGGATCCCTC ATCTTCCCTG GCTATGCCTG CTTCTATGCC AGGCACACCA TCCTCCAAGT301 GACCACAGAC AGACCTGAGT GTATGTGGCT GCGGCACACA CACCCCTGTG ACCAAGTGCA361 CTTCTGTGCA TTGGGGCACA GATTGTGTGT TCATCGTGTG AGTGCATGTG TGGGTCTGTG421 ACACGTGGCC GTTGCTCCTC TGTGAGCCAT CTGCTGATGA GCTACATCTC TGCCTTTACG481 CGTGACTTTG TATCCATGTC CAGGTGTCCA TGCGCCTGTG TGTGCAGATG TGTCCTGTCC541 CTGGGTGTGT CTGTGCCTGT GTGTGCGTTG ATATCTGTGC CTGCCTCTTC ACACATAGGT601 GGGAATGCAG AGTGTGTATT CTTTGTATGC ACCTGTACAC AGGCTGGGCG GGCAAGTGAG661 GATGCGTATG TGGGTGGCTG TGTCTGTATC TGCATTTGCA TGGTGTATTG GAGATTGGAG721 CTGTGTGTCT GTGCGTGTGT GGGTAGTGTG TACCGTGTGC ACATGTATGT GTGTGCCTGT781 GGACCAGCAC CTGTGTTGCC ACATTTGGGT GACGGTACAT CCATGCACTG GGTCTGCAGG841 TGTATTTGCG AGTGCGTGTG TCTGTCTAAC ACACTCTGTA GATGTCGCCG CCTGAATGAG901 AGCCAGAGCA GAGCTCTCCC CAGCCCTTCC CAAGTACTGT TCCCCTCTAC CGACGACTCC961 CCAGTTCTCT CCTTCCCTGA TGCAATGCAC GCCTAGTGGG CTACGTGTGC CAACCCTCCA1021 GGCCTTCTCC TGCCACAGGC TCTGTCTCTG TCCCGTCGCT GTGCCTCCTG CCCCTGCTAA1081 CCCAGCCCTC CGTGCCCTGG ATGCGCCCGG ACATGGCCAC CCTGCATGTG TGTCCGCCTG1141 CCCTCCCGCC CCACCCTGCC CCTCAGATCC ACCTCAGAGG CCCTGGGTCT GGTTTTCACT1201 GCTGTCCCTC CCTGGTCCCT GCCCTCCACT CCCACCCCTT GGTCCCTTTT CTCCTTCTCT1261 CTCTCGTTTC AGAAAAGAGG CCAGCTCTGC AGCCCCCTCG GGACGCCCCC ACCAGCTCAA1321 ATTCCGAGTG CAGAAAAGAA ACCGGACCCC CCAGTGAGGC CTGCCAGGCC TCCCGGACCC1381 CTTGTTACTC AGGAACCTCA CCTTGGACGG AATGGGATGG GGGCTTCGGT GCCCACCAAC1441 CCCCCACCTC CACTCTGCCA TTCCGGCCCA CCTCCCTCTG GCCGGACAGA ACTGGTGCTC1501 TCTTCTCCCC ACTGTGCCCG TCCGCGGACC GGGGACCCTT CCCCGTGCCC TACCCCCTCC1561 CATTTTGATG GTGTCTGTGA CATTTCCTGT TGCGAAGTAA AAGAGGGACC CCTGCGTCCT1621 GCTCCTTTCT CTTGCAGTCT GCTTGTCCAT GTGTCTATTT TTCCACTTGT CCATCTGTCC1681 AGTAAGGAGG TAATGGTGAC CCATGCTGGT CCGCTCGGAC CCCCATCCTC CTCTCCCCAC1741 AGCTGGGCCC TGCTCAGCTG GTCCTGCTGG ATGCAGTGCC CCTTTGGACC CCCTTGTCGC1801 CTGGCCTCCC ACTCCCGGCC ACCTGGCCTG GCAGCTCTGC AGCTGTTGCT CTGTCCCGGT1861 GGGAGAAAGT CCAGCCAGGC CTCCACTTCC CCTGGGGCAT CCCAACCTCA GCCCTGCACA1921 GACCCAGCGT CTGCCCTTAT TTGCTCCCCT GCAGACAAGG ACGAGTGCTC CAAGGATAAC1981 GGCGGCTGCC AGCAGGACTG CGTCAACACG TTCGGCAGTT ATGAGTGCCA ATGCCGCAGT2041 GGCTTCTGTC CTCCATGACA ACAAGCACGA CTGCAAAGAG GTACGGGCTG CATGCCAGGG2101 GCATCTGGGC TTGAAGGACC TGCTGCTGGG AGTGGAAGCC CAGAGGATCA TCTCCATCAG2161 CCTCCGTTTA GATTCTGGGG CCTGTATGAT CTCTAAGGCC CCCTCATTCC CCCACCCACC2221 TGGTACATAG ATCCTCCTCC CGCAGTGTCG GAGCCACACG CTCACTTCTG TTGCCCACAT2281 TAGGAGAGGA GGAGCTCACG GCTGCTCTGA GGCTTCATTT TCAGACTTTT CTAGTTTGTG2341 CTTCTTAAAA CCATGTCCAA GTCTCTTTGT GACTTCCTAC CGGCACAGAG GCGAGAAAGG2401 ATAGTGGGTA AGAGCACAGC CTCCAGAGCC AGGTGGCCTG GCCCAGCCCT GCCGCTTCAC2461 TAGCTGTGTG CCTTTGAGTG ACTCCTTGAC CCTCTCTGTG CCTTGGTTTG CTCCTGGGTA2521 AAATGTAGAT AATAATAATA GTACCCACCT CAGAGAGCAT TGGGAGCTTG AAGGGCCCCA2581 AGCAGGGCCT GGCTCACCGC AAGCACAATG GCATCTGTTA CCACTATCAG TCACACTTAT2641 AACCCCTGGG GATGGTCAGA ACAGGGCCAC TTGCTTCCTG GCAGTGAAGC CCTGCACACA2701 TTTAAAAATA GCTCTAGGCC GGGCACGATG GCTCATGCCT GTAATCCCAG CACTTTGGGA2761 GGCCGAGGCA AGGAGGATCG CTTGAGCTCA GGCATTCAAG ACCAGCCTGA GCAACATAGT2821 GAGACTCTGT CTCTATTTTA CTTTTAAACA GGTTTTTAAA CTAGAAATAA AGTAAAATAG2881 GCCAGTGCGG TGGTTCACAC CTGTAATCCC AGCACTTTGG GAGGCTGAGG TGGGCATGAT2941 TGCGTCAGCC CAGGAGTTTA AGACCAACCT GGGCAACATG GCGAAACCCC ATCTCTACAA3001 TAAATACAAA AAATTAGCTG GATGTGGTGG TGCATGCCTA TAGTCCCAGC TACCCTGGAG3061 GCTGAGGTGG GAGAATCACC TGAGTCTGGG GAGGCTGAGG CTGCATGAGC CGAGATCACA3121 CCACTGTACT CCAGCCTGGG TGACAGAGTG GGAAAAAACA AATAAAAATA TAAATAAATA3181 AATAAAGCAA AATAAAACCA AAAAAAAAAA AAAAAAAAAA AAB核苷酸序列(SEQ ID NO20)长度3101 MCVRLPSRPT LPLRSTSEAL GLVFTAVPPW SLPSTPTPWS LFSFSLSFQK RGQLCSPLGT61 PPPAQIPSAE KKPDPPVRPA RPPGPLVTQE PHLGRNGMGA SVPTNPPPPL CHSGPPPSGR121 TELVLSSPHC ARPRTGDPSP CPTPSHFDGV CDISCCEVKE GPLRPAPFSC SLLVHVSIFP181 LVHLSSKEVM VTHAGPLGPP SSSPHSWALL SWSCWMQCPF GPPCRLASHS RPPGLAALQL241 LLCPGGRKSS QASTSPGASQ PQPCTDPASA LICSPADKDE CSKDNGGCQQ DCVNTFGSYE301 CQCRSGFCPPC.核苷酸及氨基酸组合序列(SEQ ID NO21) 克隆号DP11741起始编码子1126 ATG 终止编码子2056 TGA 蛋白质分子量32605.641 GTT GGG AAG GAC TTG GGG ACT CCA CCT CTT GGC CTG GTT CCC ATG GCC 4849 CCT AGG GGT CTA ACC TAC CTG ATC CTG GGT TGG AGA AGC AGG ACC TTC 9697 TGG AAG CCC ATG TTC CAG CGC TTG GGC CCC AGT CCT GAT GGG GAT CAG 144145 GAA TAG GCC CCC TTG CAC AGA CCC CCA CCT GGC CAG CTC AGT GCC AGC 192193 AGA CAT CTT TCT ACC TCA TGG TTC ATC TAT GGA ATT CTG GGG GTC CAC 240241 TGG ATC CCT CAT CTT CCC TGG CTA TGC CTG CTT CTA TGC CAG GCA CAC 288289 CAT CCT CCA AGT GAC CAC AGA CAG ACC TGA GTG TAT GTG GCT GCG GCA 336337 CAC ACA CCC CTG TGA CCA AGT GCA CTT CTG TGC ATT GGG GCA CAG ATT 384385 GTG TGT TCA TCG TGT GAG TGC ATG TGT GGG TCT GTG ACA CGT GGC CGT 432433 TGC TCC TCT GTG AGC CAT CTG CTG ATG AGC TAC ATC TCT GCC TTT ACG 480481 CGT GAC TTT GTA TCC ATG TCC AGG TGT CCA TGC GCC TGT GTG TGC AGA 528529 TGT GTC CTG TCC CTG GGT GTG TCT GTG CCT GTG TGT GCG TTG ATA TCT 576577 GTG CCT GCC TCT TCA CAC ATA GGT GGG AAT GCA GAG TGT GTA TTC TTT 624625 GTA TGC ACC TGT ACA CAG GCT GGG CGG GCA AGT GAG GAT GCG TAT GTG 672673 GGT GGC TGT GTC TGT ATC TGC ATT TGC ATG GTG TAT TGG AGA TTG GAG 720721 CTG TGT GTC TGT GCG TGT GTG GGT AGT GTG TAC CGT GTG CAC ATG TAT 768769 GTG TGT GCC TGT GGA CCA GCA CCT GTG TTG CCA CAT TTG GGT GAC GGT 816817 ACA TCC ATG CAC TGG GTC TGC AGG TGT ATT TGC GAG TGC GTG TGT CTG 864865 TCT AAC ACA CTC TGT AGA TGT CGC CGC CTG AAT GAG AGC CAG AGC AGA 912913 GCT CTC CCC AGC CCT TCC CAA GTA CTG TTC CCC TCT ACC GAC GAC TCC 960961 CCA GTT CTC TCC TTC CCT GAT GCA ATG CAC GCC TAG TGG GCT ACG TGT10081009 GCC AAC CCT CCA GGC CTT CTC CTG CCA CAG GCT CTG TCT CTG TCC CGT10561057 CGC TGT GCC TCC TGC CCC TGC TAA CCC AGC CCT CCG TGC CCT GGA TGC11041105 GCC CGG ACA TGG CCA CCC TGC ATG TGT GTC CGC CTG CCC TCC CGC CCC11521 Met Cys Val Arg Leu Pro Ser Arg Pro 91153 ACC CTG CCC CTC AGA TCC ACC TCA GAG GCC CTG GGT CTG GTT TTC ACT120010 Thr Leu Pro Leu Arg Ser Thr Ser Glu Ala Leu Gly Leu Val Phe Thr 251201 GCT GTC CCT CCC TGG TCC CTG CCC TCC ACT CCC ACC CCT TGG TCC CTT124826 Ala Val Pro Pro Trp Ser Leu Pro Ser Thr Pro Thr Pro Trp Ser Leu 411249 TTC TCC TTC TCT CTC TCG TTT CAG AAA AGA GGC CAG CTC TGC AGC CCC129642 Phe Ser Phe Ser Leu Ser Phe Gln Lys Arg Gly Gln Leu Cys Ser Pro 571297 CTC GGG ACG CCC CCA CCA GCT CAA ATT CCG AGT GCA GAA AAG AAA CCG134458 Leu Gly Thr Pro Pro Pro Ala Gln Ile Pro Ser Ala Glu Lys Lys Pro 731345 GAC CCC CCA GTG AGG CCT GCC AGG CCT CCC GGA CCC CTT GTT ACT CAG139274 Asp Pro Pro Val Arg Pro Ala Arg Pro Pro Gly Pro Leu Val Thr Gln 891393 GAA CCT CAC CTT GGA CGG AAT GGG ATG GGG GCT TCG GTG CCC ACC AAC144090 Glu Pro His Leu Gly Arg Asn Gly Met Gly Ala Ser Val Pro Thr Asn 1051441 CCC CCA CCT CCA CTC TGC CAT TCC GGC CCA CCT CCC TCT GGC CGG ACA1488106 Pro Pro Pro Pro Leu Cys His Ser Gly Pro Pro Pro Ser Gly Arg Thr 1211489 GAA CTG GTG CTC TCT TCT CCC CAC TGT GCC CGT CCG CGG ACC GGG GAC1536122 Glu Leu Val Leu Ser Ser Pro His Cys Ala Arg Pro Arg Thr Gly Asp 1371537 CCT TCC CCG TGC CCT ACC CCC TCC CAT TTT GAT GGT GTC TGT GAC ATT1584138 Pro Ser Pro Cys Pro Thr Pro Ser His Phe Asp Gly Val Cys Asp Ile 1531585 TCC TGT TGC GAA GTA AAA GAG GGA CCC CTG CGT CCT GCT CCT TTC TCT1632154 Ser Cys Cys Glu Val Lys Glu Gly Pro Leu Arg Pro Ala Pro Phe Ser 1691633 TGC AGT CTG CTT GTC CAT GTG TCT ATT TTT CCA CTT GTC CAT CTG TCC1680170 Cys Ser Leu Leu Val His Val Ser Ile Phe Pro Leu Val His Leu Ser 1851681 AGT AAG GAG GTA ATG GTG ACC CAT GCT GGT CCG CTC GGA CCC CCA TCC1728186 Ser Lys Glu Val Met Val Thr His Ala Gly Pro Leu Gly Pro Pro Ser 2011729 TCC TCT CCC CAC AGC TGG GCC CTG CTC AGC TGG TCC TGC TGG ATG CAG1776202 Ser Ser Pro His Ser Trp Ala Leu Leu Ser Trp Ser Cys Trp Met Gln 2171777 TGC CCC TTT GGA CCC CCT TGT CGC CTG GCC TCC CAC TCC CGG CCA CCT1824218 Cys Pro Phe Gly Pro Pro Cys Arg Leu Ala Ser His Ser Arg Pro Pro 2331825 GGC CTG GCA GCT CTG CAG CTG TTG CTC TGT CCC GGT GGG AGA AAG TCC1872234 Gly Leu Ala Ala Leu Gln Leu Leu Leu Cys Pro Gly Gly Arg Lys Ser 2491873 AGC CAG GCC TCC ACT TCC CCT GGG GCA TCC CAA CCT CAG CCC TGC ACA1920250 Ser Gln Ala Ser Thr Ser Pro Gly Ala Ser Gln Pro Gln Pro Cys Thr 2651921 GAC CCA GCG TCT GCC CTT ATT TGC TCC CCT GCA GAC AAG GAC GAG TGC1968266 Asp Pro Ala Ser Ala Leu Ile Cys Ser Pro Ala Asp Lys Asp Glu Cys 2811969 TCC AAG GAT AAC GGC GGC TGC CAG CAG GAC TGC GTC AAC ACG TTC GGC2016282 Ser Lys Asp Asn Gly Gly Cys Gln Gln Asp Cys Val Asn Thr Phe Gly 2972017 AGT TAT GAG TGC CAA TGC CGC AGT GGC TTC TGT CCT CCA TGA CAA CAA2064298 Ser Tyr Glu Cys Gln Cys Arg Ser Gly Phe Cys Pro Pro *** 3112065 GCA CGA CTG CAA AGA GGT ACG GGC TGC ATG CCA GGG GCA TCT GGG CTT21122113 GAA GGA CCT GCT GCT GGG AGT GGA AGC CCA GAG GAT CAT CTC CAT CAG21602161 CCT CCG TTT AGA TTC TGG GGC CTG TAT GAT CTC TAA GGC CCC CTC ATT22082209 CCC CCA CCC ACC TGG TAC ATA GAT CCT CCT CCC GCA GTG TCG GAG CCA22562257 CAC GCT CAC TTC TGT TGC CCA CAT TAG GAG AGG AGG AGC TCA CGG CTG23042305 CTC TGA GGC TTC ATT TTC AGA CTT TTC TAG TTT GTG CTT CTT AAA ACC23522353 ATG TCC AAG TCT CTT TGT GAC TTC CTA CCG GCA CAG AGG CGA GAA AGG24002401 ATA GTG GGT AAG AGC ACA GCC TCC AGA GCC AGG TGG CCT GGC CCA GCC24482449 CTG CCG CTT CAC TAG CTG TGT GCC TTT GAG TGA CTC CTT GAC CCT CTC24962497 TGT GCC TTG GTT TGC TCC TGG GTA AAA TGT AGA TAA TAA TAA TAG TAC25442545 CCA CCT CAG AGA GCA TTG GGA GCT TGA AGG GCC CCA AGC AGG GCC TGG25922593 CTC ACC GCA AGC ACA ATG GCA TCT GTT ACC ACT ATC AGT CAC ACT TAT26402641 AAC CCC TGG GGA TGG TCA GAA CAG GGC CAC TTG CTT CCT GGC AGT GAA26882689 GCC CTG CAC ACA TTT AAA AAT AGC TCT AGG CCG GGC ACG ATG GCT CAT27362737 GCC TGT AAT CCC AGC ACT TTG GGA GGC CGA GGC AAG GAG GAT CGC TTG27842785 AGC TCA GGC ATT CAA GAC CAG CCT GAG CAA CAT AGT GAG ACT CTG TCT28322833 CTA TTT TAC TTT TAA ACA GGT TTT TAA ACT AGA AAT AAA GTA AAA TAG28802881 GCC AGT GCG GTG GTT CAC ACC TGT AAT CCC AGC ACT TTG GGA GGC TGA29282929 GGT GGG CAT GAT TGC GTC AGC CCA GGA GTT TAA GAC CAA CCT GGG CAA29762977 CAT GGC GAA ACC CCA TCT CTA CAA TAA ATA CAA AAA ATT AGC TGG ATG3025 TGG TGG TGC ATG CCT ATA GTC CCA GCT ACC CTG GAG GCT GAG GTG GGA3073 GAA TCA CCT GAG TCT GGG GAG GCT GAG GCT GCA TGA GCC GAG ATC ACA3121 CCA CTG TAC TCC AGC CTG GGT GAC AGA GTG GGA AAA AAC AAA TAA AAA3169 TAT AAA TAA ATA AAT AAA GCA AAA TAA AAC CAA AAA AAA AAA AAA AAA3217 AAA AAA8.PP12301A核苷酸序列(SEQ ID NO22)长度14041 GCCGGATTGC AGCACCTGGG ATTGGAGTTT GGAATCCTGC CTTCGATGTC ACCCCCCACG61 ACCTCATCAC TGGTGGCATC ATCACAGAAC TGGGGGTCTT TGCCCCTGAG GAGCTCCGGA121 CAGCCCTAAC CACCACCATC TCTTCCAGGG ATGGAACCCT AGATGGACCC CAGATGTAAC181 CAACTCAGCT CTCCCTAGCC TGCCTCTCTA GGTTTTTCAA TACATTTCTT GAATGGCTAC241 CCAAAAGCTG ACCGTCCAGC CCCTGACCAC ACTTGTTCCT AGTGCAGGGA GCTCAGACAG301 GGCCTTCCAT CTAGAGCCCA GCACCTAGAG CCAGGCTGCC CAGATTCAAA TCCTGACTCC361 GCCACTTTTC CCAAAGTGCT GGGACTACAG GCATGAGCCA CTGTGCCTGA CCTTACAGCA421 GTATTTTTTA AAAATCAAAA TTAATGCAAA AATCCATGAT GAGGCCAGGC TTGGTGGCTC481 ATGCCTGTGA TTCCAGCACT TTGGGAGGAT CCCTTGAGCC CAGGTGTTTG AGACCAGTTT541 GGGTAACATA GGAAGAGCTT GTCTCTACAA ACAAAAATTT AAAAACAATG AGCTGGGCAT601 GGAACTCACA CCTCTAGCCC CAGCTACTCG GGCTGAGGTG GGAGGATGGC TTGAGCCCAG661 GAGTTCAAGG ATGCAGTGTG CTTTGATTGC ACTACTGCGC TTCACCCTGG GCAACAGAGT721 GAGACCCCAT CTCTTTAAAA AAAAAAAAAA ATCCATGATG AACAAAACAA GTATTTGTTT781 GAGACGGGGT CTCGCTCTGT CGCCCAGGCT GGAGTGCAGT GGTGCCATCT CAGCTCACTG841 CAACCTCCGC CTTCTGGGTT CAAGCGACTC TCCTGCCTCA GCCTCCCGAG TAGCTGGGAT901 TGCAGGAGCC TGGCACTATG CCTGGCTAAT TTTTGTATTT TTATTGGAGA CACCATGTTG961 GTCGTGGCTG GTCTCCAACT CCTGACCTCG GGTGATCCGC GCCCCGCGGC CTCCGAAAGT1021 GCTGGGATTA CAGGCGTGAG CCACCGTGCC CGGCCTAAAT AAAATTTTGA AGAGGCTAGA1081 ACCCCGCACT TGTGCCTTGA GCTTACTGAC CTCAACACCC TGGTTCCACT AAAACTTTAT1141 TTACAAAATT ATGCTGCCGG TCTGCAGGAT GTAGTTTAAC AATTTGATTA TTTTGGATAT1201 TAAAATATTT TTTAAGTCTT GAAAATATTG TTTACTATTA CCAAAGTTTT TGAACCTTCT1261 TAAATTCTGT ACCAGAGGTG AGTGCCACAC CCTAACCTAG TCTGAGTTTT TATGTGTAAA1321 GATCATAAAA CGTTGTAAGT TTTCTAAAAC ACATAAGCTC TCAATAAACG TTAGCTTATC1381 ATTGAAAAAA AAAAAAAAAA AAAAB核苷酸序列(SEQ ID NO23)长度1281MELTPLAPAT RAEVGGWLEP RSSRMQCALI ALLRFTLGNR VRPHLFKKKK KSMMNKTSIC6 LRRGLALSPR LECSGAISAH CNLRLLGSSD SPASASRVAG IAGAWHYAWL IFVFLLETPC121WSWLVSNSC.核苷酸及氨基酸组合序列(SEQ ID NO24) 克隆号PP12301起始编码子599 ATG 终止编码子983 TGA 蛋白质分子量14138.861G CCG GAT TGC AGC ACC TGG GAT TGG AGT TTG GAA TCC TGC CTT CGA 4647 TGT CAC CCC CCA CGA CCT CAT CAC TGG TGG CAT CAT CAC AGA ACT GGG 9495 GGT CTT TGC CCC TGA GGA GCT CCG GAC AGC CCT AAC CAC CAC CAT CTC 142143 TTC CAG GGA TGG AAC CCT AGA TGG ACC CCA GAT GTA ACC AAC TCA GCT 190191 CTC CCT AGC CTG CCT CTC TAG GTT TTT CAA TAC ATT TCT TGA ATG GCT 238239 ACC CAA AAG CTG ACC GTC CAG CCC CTG ACC ACA CTT GTT CCT AGT GCA 286287 GGG AGC TCA GAC AGG GCC TTC CAT CTA GAG CCC AGC ACC TAG AGC CAG 334335 GCT GCC CAG ATT CAA ATC CTG ACT CCG CCA CTT TTC CCA AAG TGC TGG 382383 GAC TAC AGG CAT GAG CCA CTG TGC CTG ACC TTA CAG CAG TAT TTT TTA 430431 AAA ATC AAA ATT AAT GCA AAA ATC CAT GAT GAG GCC AGG CTT GGT GGC 478479 TCA TGC CTG TGA TTC CAG CAC TTT GGG AGG ATC CCT TGA GCC CAG GTG 526527 TTT GAG ACC AGT TTG GGT AAC ATA GGA AGA GCT TGT CTC TAC AAA CAA 574575 AAA TTT AAA AAC AAT GAG CTG GGC ATG GAA CTC ACA CCT CTA GCC CCA 6221 Met Glu Leu Thr Pro Leu Ala Pro 8623 GCT ACT CGG GCT GAG GTG GGA GGA TGG CTT GAG CCC AGG AGT TCA AGG 6709 Ala Thr Arg Ala Glu Val Gly Gly Trp Leu Glu Pro Arg Ser Ser Arg 24671 ATG CAG TGT GCT TTG ATT GCA CTA CTG CGC TTC ACC CTG GGC AAC AGA 71825 Met Gln Cys Ala Leu Ile Ala Leu Leu Arg Phe Thr Leu Gly Asn Arg 40719 GTG AGA CCC CAT CTC TTT AAA AAA AAA AAA AAA TCC ATG ATG AAC AAA 76641 Val Arg Pro His Leu Phe Lys Lys Lys Lys Lys Ser Met Met Asn Lys 56767 ACA AGT ATT TGT TTG AGA CGG GGT CTC GCT CTG TCG CCC AGG CTG GAG 81457 Thr Ser Ile Cys Leu Arg Arg Gly Leu Ala Leu Ser Pro Arg Leu Glu 72815 TGC AGT GGT GCC ATC TCA GCT CAC TGC AAC CTC CGC CTT CTG GGT TCA 86273 Cys Ser Gly Ala Ile Ser Ala His Cys Asn Leu Arg Leu Leu Gly Ser 88863 AGC GAC TCT CCT GCC TCA GCC TCC CGA GTA GCT GGG ATT GCA GGA GCC 91089 Ser Asp Ser Pro Ala Ser Ala Ser Arg Val Ala Gly Ile Ala Gly Ala 104911 TGG CAC TAT GCC TGG CTA ATT TTT GTA TTT TTA TTG GAG ACA CCA TGT 958105 Trp His Tyr Ala Trp Leu Ile Phe Val Phe Leu Leu Glu Thr Pro Cys 120959 TGG TCG TGG CTG GTC TCC AAC TCC TGA CCT CGG GTG ATC CGC GCC CCG1006121 Trp Ser Trp Leu Val Ser Asn Ser *** 1291007 CGG CCT CCG AAA GTG CTG GGA TTA CAG GCG TGA GCC ACC GTG CCC GGC10541055 CTA AAT AAA ATT TTG AAG AGG CTA GAA CCC CGC ACT TGT GCC TTG AGC11021103 TTA CTG ACC TCA ACA CCC TGG TTC CAC TAA AAC TTT ATT TAC AAA ATT11501151 ATG CTG CCG GTC TGC AGG ATG TAG TTT AAC AAT TTG ATT ATT TTG GAT11981199 ATT AAA ATA TTT TTT AAG TCT TGA AAA TAT TGT TTA CTA TTA CCA AAG12461247 TTT TTG AAC CTT CTT AAA TTC TGT ACC AGA GGT GAG TGC CAC ACC CTA12941295 ACC TAG TCT GAG TTT TTA TGT GTA AAG ATC ATA AAA CGT TGT AAG TTT13421343 TCT AAA ACA CAT AAG CTC TCA ATA AAC GTT AGC TTA TCA TTG AAA AAA13901391 AAA AAA AAA AAA AA 14049.PP12616A核苷酸序列(SEQ ID NO25)长度9931 GCCGCAGTCC CATCATTCAG TTCCGTAGGG TCACCGGCGC GGCAGTGGCC TCGCAGGGCG61 CTGGGTCCCT CTCCCCAGCT CTCCTCCCCC TGGCCCCGTC GCCCCGCCCT CGCCGGGCTG121 GGCTGCGGGG TCAGGGGCCG AGCGGAGAGG GGTGAGTATT CCCCACAGCC CTTGCCGGTT181 GCCTCCTCCC GGCTCTGCTT CCCACACGGT CCTTGCCCCA CTCCTAGGAC AGGGAGGAAG241 GGCACGCGCG GGTAGGCGGG AAACAGCCCA GTCCTGAACA AAAGGCCGGG GAAGCGGGTC301 CCCGCCGGTA ACTGCAGGCC TGTGCTGGCC GCCGCGAGCG GGAAGGGCGA GGACACTCCC361 TCCTCGGGGA CCCGGTCCCC GTCGCGCACA CGGTGTCACC AGCACACCTG GCCCAGTACC421 CAAAGCACCC TCGAATTATC ATTTAACATG GAAGAAGATG AGTTCATTGG AGAAAAAACA481 TTCCAACGTT ATTGTGCAGA ATTCATTAAA CATTCACAAC AGATAGGTGA TAGTTGGGAA541 TGGAGACCAT CAAAGGACTG TTCTGATGGC TACATGTGCA AAATACACTT TCAAATTAAG601 AATGGGTCTG TGATGTCACA TCTAGGAGCA TCTACCCATG GACAGACATG TCTTCCCATG661 GAGGTGAAGT CTTGCTCTGT CACCCAGGCT GGAGTGCAGT TGCGTGATCT CAGCTCACTG721 CAACCTCCGC CTTCTGGGTT CAAGCAGTTC TCCTGCCTCA GCCTTCCGAG TAACTGGGAC781 TACAGGGGTT CACCACTACA CCTGGCTAAT TTTTTGTATT TTTAGTAGAG ATAAGGTTTC841 ACCATGTTGG TCAGGCTGGT CTTGAACTCC TGACATCAAG TAATCCATCC GCCTCAGCCT901 CCCAAAGTGC TGAGATTACA GGCATGAGCC ACTGTGCCTG GCCCTGAGCT TAAAATAAAA961 GTTAAATTAA AAAAAAAAAA AAAAAAAAAA AAAB核苷酸序列(SEQ ID NO26)长度1251 MEEDEFIGEK TFQRYCAEFI KHSQQIGDSW EWRPSKDCSD GYMCKIHFQI KNGSVMSHLG61 ASTHGQTCLP MEVKSCSVTQ AGVQLRDLSS LQPPPSGFKQ FSCLSLPSNW DYRGSPLHLA121 NFLYFC.核苷酸及氨基酸组合序列(SEQ ID NO27) 克隆号PP12616起始编码子448 ATG 终止编码子823 TAG 蛋白质分子量14216.381 GCC GCA GTC CCA TCA TTC AGT TCC GTA GGG TCA CCG GCG CGG CAG TGG 4849 CCT CGC AGG GCG CTG GGT CCC TCT CCC CAG CTC TCC TCC CCC TGG CCC 9697 CGT CGC CCC GCC CTC GCC GGG CTG GGC TGC GGG GTC AGG GGC CGA GCG 144145 GAG AGG GGT GAG TAT TCC CCA CAG CCC TTG CCG GTT GCC TCC TCC CGG 192193 CTC TGC TTC CCA CAC GGT CCT TGC CCC ACT CCT AGG ACA GGG AGG AAG 240241 GGC ACG CGC GGG TAG GCG GGA AAC AGC CCA GTC CTG AAC AAA AGG CCG 288289 GGG AAG CGG GTC CCC GCC GGT AAC TGC AGG CCT GTG CTG GCC GCC GCG 336337 AGC GGG AAG GGC GAG GAC ACT CCC TCC TCG GGG ACC CGG TCC CCG TCG 384385 CGC ACA CGG TGT CAC CAG CAC ACC TGG CCC AGT ACC CAA AGC ACC CTC 432433 GAA TTA TCA TTT AAC ATG GAA GAA GAT GAG TTC ATT GGA GAA AAA ACA 4801 Met Glu Glu Asp Glu Phe Ile Gly Glu Lys Thr 11481 TTC CAA CGT TAT TGT GCA GAA TTC ATT AAA CAT TCA CAA CAG ATA GGT 52812 Phe Gln Arg Tyr Cys Ala Glu Phe Ile Lys His Ser Gln Gln Ile Gly 27529 GAT AGT TGG GAA TGG AGA CCA TCA AAG GAC TGT TCT GAT GGC TAC ATG 57628 Asp Ser Trp Glu Trp Arg Pro Ser Lys Asp Cys Ser Asp Gly Tyr Met 43577 TGC AAA ATA CAC TTT CAA ATT AAG AAT GGG TCT GTG ATG TCA CAT CTA 62444 Cys Lys Ile His Phe Gln Ile Lys Asn Gly Ser Val Met Ser His Leu 59625 GGA GCA TCT ACC CAT GGA CAG ACA TGT CTT CCC ATG GAG GTG AAG TCT 67260 Gly Ala Ser Thr His Gly Gln Thr Cys Leu Pro Met Glu Val Lys Ser 75673 TGC TCT GTC ACC CAG GCT GGA GTG CAG TTG CGT GAT CTC AGC TCA CTG 72076 Cys Ser Val Thr Gln Ala Gly Val Gln Leu Arg Asp Leu Ser Ser Leu 91721 CAA CCT CCG CCT TCT GGG TTC AAG CAG TTC TCC TGC CTC AGC CTT CCG 76892 Gln Pro Pro Pro Ser Gly Phe Lys Gln Phe Ser Cys Leu Ser Leu Pro 107769 AGT AAC TGG GAC TAC AGG GGT TCA CCA CTA CAC CTG GCT AAT TTT TTG 816108 Ser Asn Trp Asp Tyr Arg Gly Ser Pro Leu His Leu Ala Asn Phe Leu 123817 TAT TTT TAG TAG AGA TAA GGT TTC ACC ATG TTG GTC AGG CTG GTC TTG 864124 Tyr Phe *** 126865 AAC TCC TGA CAT CAA GTA ATC CAT CCG CCT CAG CCT CCC AAA GTG CTG 912913 AGA TTA CAG GCA TGA GCC ACT GTG CCT GGC CCT GAG CTT AAA ATA AAA 960961 GTT AAA TTA AAA AAA AAA AAA AAA AAA AAA AAA 99310. PP12723A核苷酸序列(SEQ ID NO28)长度15481 GCAGAGTTTG GGGGTTGTTT GGGATTAGTG AAGCTACTGC CTTTGCCGCC AGCGCAGCCT61 CAGAGTTTGA TTATTTGCAA TGTCAGGCTT TGAAAACTTA AACACGGATT TCTACCAGAC121 AAGTTACAGC ATCGATGATC AGTCACAGCA GTCCTATGAT TATGGAGGAA GTGGAGGACC181 CTATAGCAAA CAGTATGCTG GCTATGACTA TTCGCAGCAA GGCAGATTTG TCCCTCCAGA241 CATGATGCAG CCACAACAGC CATACACCGG GCAGATTTAC CAGCCAACTC AGGCATATAC301 TCCAGCTTCA CCTCAGCCTT TCTATGGAAA CAACTTTGAG GATGAGCCAC CTTTATTAGA361 AGAGTTAGGT ATCAATTTTG ACCACATCTG GCAAAAAACA CTAACAGTAT TACATCCGTT421 AAAAGTAGCA GATGGCAGCA TCATGAATGA AACTGATTTG GCAGGTCCAA TGGTTTTTTG481 CCTTGCTTTT GGAGCCACAT TGCTACTGGC TGGCAAAATC CAGTTTGGCT ATGTATACGG541 GATCAGTGCA ATTGGATGTC TAGGAATGTT TTGTTTATTA AACTTAATGA GTATGACAGG601 TGTTTCATTT GGTTGTGTGG CAAGTGTCCT TGGATATTGT CTTCTGCCCA TGATCCTACT661 TTCCAGCTTT GCAGTGATAT TTTCTTTGCA AGGAATGGTA GGAATCATTC TCACTGCTGG721 GATTATTGGA TGGTGTAGTT TTTCTGCTTC CAAAATATTT ATTTCTGCAT TAGCCATGGA781 AGGACAGCAA CTTTTAGTAG CATATCCTTG CGCTTTGTTA TATGGAGTCT TTGCCCTGAT841 TTCCGTCTTT TGAAAATTTA TCTGGGATGT GGACATCAGT GGGCCAGATG TACAAAAAGG901 ACCTTGAACT CTTACATTGG ACCAGCAAAC TGCTGCAGCG CAACTCTCAT GCAGATTTTA961 CATTTGACTG TTGGAGCAAT GAAAGTAAAC GTGTATCTCT TGTTCATTTT TATAGAACTT1021 TTGCATACTA TATTGGATTT ACCTGCGGTG TGACTAGCTT TAAATGTTTG TGTTTATACA1081 GATAAGAAAT GCTATTTCTT TCTGGTTCCT GCAGCCATTG AAAAACCTTT TTCCTTGCAA1141 ATTATAATGT TTTTGATAGA TTTTTATCAA CTGTGGGAAA CCAAACACAA AGCTGATAAC1201 CTTTCTTAAA AACGACCCAG TCACAGTAAA GAAGACACAA GACGGCCGGG CGTGGTAGCT1261 CACGCCTGTA ATCCCAGCAC TTTGGGAGGC CGAGGCGGGC GGATCACAAG GGCAGGAGAT1321 CGAGACCATC CTGGTTAACA CGGTGAAACC CCGACTCTAC TAAAACTACA AAAAAATTAG1381 CTGGGCGTGG TGGCGGGCGC CTGTAGTCCC AGCTACTCAG GAGGCTGAGG CAGGAGAAAA1441 GTGTGAACCC AGGAGGCGGA GCTTGCAGTG AGCCGAGATC ACACCACTGC ACTCCATACC1501 AGCCTGGGTG ACAGGGTGAG ACTCTGTTTC AAAAAAAAAA AAAAAAAAB核苷酸序列 (SEQ ID NO29) 长度2571 MSGFENLNTD FYQTSYSIDD QSQQSYDYGG SGGPYSKQYA GYDYSQQGRF VPPDMMQPQQ61 PYTGQIYQPT QAYTPASPQP FYGNNFEDEP PLLEELGINF DHIWQKTLTV LHPLKVADGS121 IMNETDLAGP MVFCLAFGAT LLLAGKIQFG YVYGISAIGC LGMFCLLNLM SMTGVSFGCV181 ASVLGYCLLP MILLSSFAVI FSLQGMVGII LTAGIIGWCS FSASKIFISA LAMEGQQLLV241 AYPCALLYGV FALISVFC.核苷酸及氨基酸组合序列(SEQ ID NO30) 克隆号PP12723起始编码子80 ATG 终止编码子851 TGA 蛋白质分子量27987.811G CAG AGT TTG GGG GTT GTT TGG GAT TAG TGA AGC TAC TGC CTT TGC 4647 CGC CAG CGC AGC CTC AGA GTT TGA TTA TTT GCA ATG TCA GGC TTT GAA 941 Met Ser Gly Phe Glu 595 AAC TTA AAC ACG GAT TTC TAC CAG ACA AGT TAC AGC ATC GAT GAT CAG 1426 Asn Leu Asn Thr Asp Phe Tyr Gln Thr Ser Tyr Ser Ile Asp Asp Gln 21143 TCA CAG CAG TCC TAT GAT TAT GGA GGA AGT GGA GGA CCC TAT AGC AAA 19022 Ser Gln Gln Ser Tyr Asp Tyr Gly Gly Ser Gly Gly Pro Tyr Ser Lys 37191 CAG TAT GCT GGC TAT GAC TAT TCG CAG CAA GGC AGA TTT GTC CCT CCA 23838 Gln Tyr Ala Gly Tyr Asp Tyr Ser Gln Gln Gly Arg Phe Val Pro Pro 53239 GAC ATG ATG CAG CCA CAA CAG CCA TAC ACC GGG CAG ATT TAC CAG CCA 28654 Asp Met Met Gln Pro Gln Gln Pro Tyr Thr Gly Gln Ile Tyr Gln Pro 69287 ACT CAG GCA TAT ACT CCA GCT TCA CCT CAG CCT TTC TAT GGA AAC AAC 33470 Thr Gln Ala Tyr Thr Pro Ala Ser Pro Gln Pro Phe Tyr Gly Asn Asn 85335 TTT GAG GAT GAG CCA CCT TTA TTA GAA GAG TTA GGT ATC AAT TTT GAC 38286 Phe Glu Asp Glu Pro Pro Leu Leu Glu Glu Leu Gly Ile Asn Phe Asp 101383 CAC ATC TGG CAA AAA ACA CTA ACA GTA TTA CAT CCG TTA AAA GTA GCA 430102 His Ile Trp Gln Lys Thr Leu Thr Val Leu His Pro Leu Lys Val Ala 117431 GAT GGC AGC ATC ATG AAT GAA ACT GAT TTG GCA GGT CCA ATG GTT TTT 478118 Asp Gly Ser Ile Met Asn Glu Thr Asp Leu Ala Gly Pro Met Val Phe 133479 TGC CTT GCT TTT GGA GCC ACA TTG CTA CTG GCT GGC AAA ATC CAG TTT 526134 Cys Leu Ala Phe Gly Ala Thr Leu Leu Leu Ala Gly Lys Ile Gln Phe 149527 GGC TAT GTA TAC GGG ATC AGT GCA ATT GGA TGT CTA GGA ATG TTT TGT 574150 Gly Tyr Val Tyr Gly Ile Ser Ala Ile Gly Cys Leu Gly Met Phe Cys 165575 TTA TTA AAC TTA ATG AGT ATG ACA GGT GTT TCA TTT GGT TGT GTG GCA 622166 Leu Leu Asn Leu Met Ser Met Thr Gly Val Ser Phe Gly Cys Val Ala 181623 AGT GTC CTT GGA TAT TGT CTT CTG CCC ATG ATC CTA CTT TCC AGC TTT 670182 Ser Val Leu Gly Tyr Cys Leu Leu Pro Met Ile Leu Leu Ser Ser Phe 197671 GCA GTG ATA TTT TCT TTG CAA GGA ATG GTA GGA ATC ATT CTC ACT GCT 718198 Ala Val Ile Phe Ser Leu Gln Gly Met Val Gly Ile Ile Leu Thr Ala 213719 GGG ATT ATT GGA TGG TGT AGT TTT TCT GCT TCC AAA ATA TTT ATT TCT 766214 Gly Ile Ile Gly Trp Cys Ser Phe Ser Ala Ser Lys Ile Phe Ile Ser 229767 GCA TTA GCC ATG GAA GGA CAG CAA CTT TTA GTA GCA TAT CCT TGC GCT 814230 Ala Leu Ala Met Glu Gly Gln Gln Leu Leu Val Ala Tyr Pro Cys Ala 245815 TTG TTA TAT GGA GTC TTT GCC CTG ATT TCC GTC TTT TGA AAA TTT ATC 862246 Leu Leu Tyr Gly Val Phe Ala Leu Ile Ser Val Phe *** 258863 TGG GAT GTG GAC ATC AGT GGG CCA GAT GTA CAA AAA GGA CCT TGA ACT 910911 CTT ACA TTG GAC CAG CAA ACT GCT GCA GCG CAA CTC TCA TGC AGA TTT 958959 TAC ATT TGA CTG TTG GAG CAA TGA AAG TAA ACG TGT ATC TCT TGT TCA10061007 TTT TTA TAG AAC TTT TGC ATA CTA TAT TGG ATT TAC CTG CGG TGT GAC 10541055 TAG CTT TAA ATG TTT GTG TTT ATA CAG ATA AGA AAT GCT ATT TCT TTC 11021103 TGG TTC CTG CAG CCA TTG AAA AAC CTT TTT CCT TGC AAA TTA TAA TGT 11501151 TTT TGA TAG ATT TTT ATC AAC TGT GGG AAA CCA AAC ACA AAG CTG ATA 11981199 ACC TTT CTT AAA AAC GAC CCA GTC ACA GTA AAG AAG ACA CAA GAC GGC 12461247 CGG GCG TGG TAG CTC ACG CCT GTA ATC CCA GCA CTT TGG GAG GCC GAG 12941295 GCG GGC GGA TCA CAA GGG CAG GAG ATC GAG ACC ATC CTG GTT AAC ACG 13421343 GTG AAA CCC CGA CTC TAC TAA AAC TAC AAA AAA ATT AGC TGG GCG TGG 13901391 TGG CGG GCG CCT GTA GTC CCA GCT ACT CAG GAG GCT GAG GCA GGA GAA 14381439 AAG TGT GAA CCC AGG AGG CGG AGC TTG CAG TGA GCC GAG ATC ACA CCA 14861487 CTG CAC TCC ATA CCA GCC TGG GTG ACA GGG TGA GAC TCT GTT TCA AAA 15341535 AAA AAA AAA AAA AA 154811.PP14356A核苷酸序列(SEQ ID NO31)长度12501 GAAAATCCTC AACAAAAATT TGCAAGTAGA ATCCAATAGT GTATAAAAAA AATTATACAC61 CACAACCAAA TACTGTAGCA TACCAAGTGT GTAGTATCCC AAGTATGTAA AACTGGTTCA121 GCATTCTAAA GTCAATTAAT GTCATCCATC ACATCGACAA ACTAAGGAAG AAAAAATGAC181 ATGATCATAT CAATAGATAC AGACAAAGTA TTTGTCAAAA TCCAACATCT ATATATGACA241 AAAGCTCTCA GTAAACTAGA AATATAGGGG AACTTCCTCA ACTTGATAAG GAATGTCTAT301 TAAAAAAACT ACAGTTAACA TCATACTTAA TGACGATAAA CTGTACAGAA GCTTTCTCAC361 TAAGATCAGA AACAAGCCAA ATATGTCATC TCTAATAAAC TTCTTTTCAA TGCCATGCTA421 GAAGCCCTCG CTAATACAAT AAATAAGACA AGTAAAGAAA ATAACAGGTA TACTGATTGG481 AAAGGAAGAA ATAAAAACTG TCTTTGTTCA CAGATGTCAT GATTGTCTAT GTAGAAAATC541 AAAAGAATTA ACAACAACAA CAACCAAAAA AAAAACTCCT GAAACTAATA AGTGAGTATA601 GTGAAGTTGC AGGGTACAAG GCTAATACAC AAAAGTCAAG TGCTTTCCTA TGTACCAACA661 ATGAACAAGT AGGATTTGAA TTTAAACACA TAATGCCATT TACATTAGCA CCACAAGAAT721 ACACAACACT TAGATATAAA AATCTAACAA CATATGTACA AGATTTATGT GAGGAAAAGT781 GCAAAACTCT AATGAAAGAA ATTAGAGATG ATCTAAATAA ATGGAGAGAT ATTCAACATT841 CATGGATAGG AAGACTCAAT ATTGTCAAGA TGTCAGTTCT TCCCAACTTG ATGTATATAT901 TCAATACAAT ACTAATCAAA ATCCTACAGA GTTATTTTGT GGATATTGAC AAACTAGTTC961 TAAAGTTTAT ATGTAGAGAC AAAAGACCCA GAATAGCCAA CGCAGTACTG AAGGAGAAGA1021 ACAAAGCCAG AGGACTGGCA CTACTTAACG TCAAGACTTA CCGTAAAGCG ACAGTAATCA1081 CGACAGTGTG GTATTTGTGA AAGAATAGAC CTCTACCAAT AGTTCAGTGG AATAAAATAG1141 AGGGCCTAGA AATAGACCCA CATAAATATA GTCAACTGAC CTTTGACAAA GCAGAAAACA1201 AAAGGTACTG GAACAACTGG ACAACCACAT GCAAAAAAAA AAAAAAAAAAB核苷酸序列(SEQ ID NO32)长度1351 MPFTLAPQEY TTLRYKNLTT YVQDLCEEKC KTLMKEIRDD LNKWRDIQHS WIGRLNIVKM61 SVLPNLMYIF NTILIKILQS YFVDIDKLVL KFICRDKRPR IANAVLKEKN KARGLALLNV121 KTYRKATVIT TVWYLC.核苷酸及氨基酸组合序列(SEQ ID NO33) 克隆号PP14356起始编码子693 ATG 终止编码子1098 TGA 蛋白质分子量16072.351 GA AAA TCC TCA ACA AAA ATT TGC AAG TAG AAT CCA ATA GTG TAT AAA 4748 AAA AAT TAT ACA CCA CAA CCA AAT ACT GTA GCA TAC CAA GTG TGT AGT 9596 ATC CCA AGT ATG TAA AAC TGG TTC AGC ATT CTA AAG TCA ATT AAT GTC 143144 ATC CAT CAC ATC GAC AAA CTA AGG AAG AAA AAA TGA CAT GAT CAT ATC 191192 AAT AGA TAC AGA CAA AGT ATT TGT CAA AAT CCA ACA TCT ATA TAT GAC 239240 AAA AGC TCT CAG TAA ACT AGA AAT ATA GGG GAA CTT CCT CAA CTT GAT 287288 AAG GAA TGT CTA TTA AAA AAA CTA CAG TTA ACA TCA TAC TTA ATG ACG 335336 ATA AAC TGT ACA GAA GCT TTC TCA CTA AGA TCA GAA ACA AGC CAA ATA 383384 TGT CAT CTC TAA TAA ACT TCT TTT CAA TGC CAT GCT AGA AGC CCT CGC 431432 TAA TAC AAT AAA TAA GAC AAG TAA AGA AAA TAA CAG GTA TAC TGA TTG 479480 GAA AGG AAG AAA TAA AAA CTG TCT TTG TTC ACA GAT GTC ATG ATT GTC 527528 TAT GTA GAA AAT CAA AAG AAT TAA CAA CAA CAA CAA CCA AAA AAA AAA 575576 CTC CTG AAA CTA ATA AGT GAG TAT AGT GAA GTT GCA GGG TAC AAG GCT 623624 AAT ACA CAA AAG TCA AGT GCT TTC CTA TGT ACC AAC AAT GAA CAA GTA 671672 GGA TTT GAA TTT AAA CAC ATA ATG CCA TTT ACA TTA GCA CCA CAA GAA 7191 Mer Pro Phe Thr Leu Ala Pro Gln Glu 9720 TAC ACA ACA CTT AGA TAT AAA AAT CTA ACA ACA TAT GTA CAA GAT TTA 76710 Tyr Thr Thr Leu Arg Tyr Lys Asn Leu Thr Thr Tyr Val Gln Asp Leu 25768 TGT GAG GAA AAG TGC AAA ACT CTA ATG AAA GAA ATT AGA GAT GAT CTA 81526 Cys Glu Glu Lys Cys Lys Thr Leu Met Lys Glu Ile Arg Asp Asp Leu 41816 AAT AAA TGG AGA GAT ATT CAA CAT TCA TGG ATA GGA AGA CTC AAT ATT 86342 Asn Lys Trp Arg Asp Ile Gln His Ser Trp Ile Gly Arg Leu Asn Ile 57864 GTC AAG ATG TCA GTT CTT CCC AAC TTG ATG TAT ATA TTC AAT ACA ATA 91158 Val Lys Met Ser Val Leu Pro Asn Leu Met Tyr Ile Phe Asn Thr Ile 73912 CTA ATC AAA ATC CTA CAG AGT TAT TTT GTG GAT ATT GAC AAA CTA GTT 95974 Leu Ile Lys Ile Leu Gln Ser Tyr Phe Val Asp Ile Asp Lys Leu Val 89960 CTA AAG TTT ATA TGT AGA GAC AAA AGA CCC AGA ATA GCC AAC GCA GTA100790 Leu Lys Phe Ile Cys Arg Asp Lys Arg Pro Arg Ile Ala Asn Ala Val 1051008 CTG AAG GAG AAG AAC AAA GCC AGA GGA CTG GCA CTA CTT AAC GTC AAG1055106 Leu Lys Glu Lys Asn Lys Ala Arg Gly Leu Ala Leu Leu Asn Val Lys 1211056 ACT TAC CGT AAA GCG ACA GTA ATC ACG ACA GTG TGG TAT TTG TGA AAG1103122 Thr Tyr Arg Lys Ala Thr Val Ile Thr Thr Val Trp Tyr Leu *** 1361104 AAT AGA CCT CTA CCA ATA GTT CAG TGG AAT AAA ATA GAG GGC CTA GAA11511152 ATA GAC CCA CAT AAA TAT AGT CAA CTG ACC TTT GAC AAA GCA GAA AAC11991200 AAA AGG TAC TGG AAC AAC TGG ACA ACC ACA TGC AAA AAA AAA AAA AAA12471248 AAA125012.PP14737A核苷酸序列(SEQ ID NO34)长度10371 GGGCGGCCCC AACGGCCGTC CAGGACGTGG AGCGAAATGA GCTCGGGCGC TGACGGCGGC61 GGTGGCGCTG CGGTGGCGGC GCGGTCGGAC AAGGGCAGTC CCGGGGAGGA CGGTTTCGTC121 CCGTCGGCGC TGGGGACCCG CGAGCATTGG GATGCTGTCT ATGAGAGAGA ACTGCAAACT181 TTCCGAGAAT ATGGAGATAC AGGTGAAATC TGGTTTGGAG AAGAGAGTAT GAATCGACTA241 ATAAGGTGGA TGCAGAAACA CAAGATTCCA CTGGATGCTT CAGTGCTTGA TATTGGAACT301 GGAAATGGTG TTTTCCTGGT TGAACTTGTT GGCAAAATTT GGTTTCTCTA ATATTACTGG361 AATTGATTAC TCTCCTTCTG CAATTCAGCT TTCTGGAAGT ATTATAGAAA AAGAAGGTTT421 ATCTAACATT AAGTTAAAGG TAGAAGACTT TTTGAATCTC TCCACACAGC TGTCTGGATT481 TCATATTTGT ATTGACAAAG GGACTTTTGA TGCCATAAGC CTTAATCCTG ACAATGCAAT541 TGAGAAGAGG AAGCAATATG TGAAATCTCT CTCCAGGGTG TTGAAAGTAA AAGGCTTTTT601 TTCTAATAAC GTCATGTAAT TGGACCCAAG GAAGAGTTGC TAAATGAATT CAGTGAAGGA661 TTTGAACTTC TCGAAGAGCT ACCAACACCC AAGTTCAGCT TTGGAGGCAG ATCTGGAAAC721 AGTGTAGCAG CATTGGTTTT CCAAAAAATG TGAGACTTTT TCTTGGACGA ATTCAGGTAG781 CTACACAGAA TCTACACAGC AAAGTTAACC TGACACAGAA AATCCTTGTG CAAATAAATG841 CTTAGTAAGT ACACAGGATG CACATGTTGA ATAGAGTATA CTGGATTGGT GAAAGAAAAT901 AATAATAATG AGCATCTAAG TGGTTGGGTT TTAGAGATCA ATCAAGAATA ATTTTAATTT961 TCTTTTGTAT TTGAAATGTA AATAGTTTTC TTTTCGATTA AAAAAATTTC CTATAAAAAA1021 AAAAAAAAAA AAAAAAAB核苷酸序列 (SEQ ID NO35) 长度1141 MLQCLILELE MVFSWLNLLA KFGFSNITGI DYSPSAIQLS GSIIEKEGLS NIKLKVEDFL61 NLSTQLSGFH ICIDKGTFDA ISLNPDNAIE KRKQYVKSLS RVLKVKGFFS NNVMC.核苷酸及氨基酸组合序列(SEQ ID NO36) 克隆号PP14737起始编码子275ATG 终止编码子617 TAA 蛋白质分子量12777.241G GGC GGC CCC AAC GGC CGT CCA GGA CGT GGA GCG AAA TGA GCT CGG 4647 GCG CTG ACG GCG GCG GTG GCG CTG CGG TGG CGG CGC GGT CGG ACA AGG 9495 GCA GTC CCG GGG AGG ACG GTT TCG TCC CGT CGG CGC TGG GGA CCC GCG 142143 AGC ATT GGG ATG CTG TCT ATG AGA GAG AAC TGC AAA CTT TCC GAG AAT 190191 ATG GAG ATA CAG GTG AAA TCT GGT TTG GAG AAG AGA GTA TGA ATC GAC 238239 TAA TAA GGT GGA TGC AGA AAC ACA AGA TTC CAC TGG ATG CTT CAG TGC 2861 Met Leu Gln Cys 4287 TTG ATA TTG GAA CTG GAA ATG GTG TTT TCC TGG TTG AAC TTG TTG GCA 3345 Leu Ile Leu Glu Leu Glu Met Val Phe Ser Trp Leu Asn Leu Leu Ala 20335 AAA TTT GGT TTC TCT AAT ATT ACT GGA ATT GAT TAC TCT CCT TCT GCA 38221 Lys Phe Gly Phe Ser Asn Ile Thr Gly Ile Asp Tyr Ser Pro Ser Ala 36383 ATT CAG CTT TCT GGA AGT ATT ATA GAA AAA GAA GGT TTA TCT AAC ATT 43037 Ile Gln Leu Ser Gly Ser Ile Ile Glu Lys Glu Gly Leu Ser Asn Ile 52431 AAG TTA AAG GTA GAA GAC TTT TTG AAT CTC TCC ACA CAG CTG TCT GGA 47853 Lys Leu Lys Val Glu Asp Phe Leu Asn Leu Ser Thr Gln Leu Ser Gly 68479 TTT CAT ATT TGT ATT GAC AAA GGG ACT TTT GAT GCC ATA AGC CTT AAT 52669 Phe His Ile Cys Ile Asp Lys Gly Thr Phe Asp Ala Ile Ser Leu Asn 84527 CCT GAC AAT GCA ATT GAG AAG AGG AAG CAA TAT GTG AAA TCT CTC TCC 57485 Pro Asp Asn Ala Ile Glu Lys Arg Lys Gln Tyr Val Lys Ser Leu Ser 100575 AGG GTG TTG AAA GTA AAA GGC TTT TTT TCT AAT AAC GTC ATG TAA TTG 622101 Arg Val Leu Lys Val Lys Gly Phe Phe Ser Asn Asn Val Met *** 115623 GAC CCA AGG AAG AGT TGC TAA ATG AAT TCA GTG AAG GAT TTG AAC TTC 670671 TCG AAG AGC TAC CAA CAC CCA AGT TCA GCT TTG GAG GCA GAT CTG GAA 718719 ACA GTG TAG CAG CAT TGG TTT TCC AAA AAA TGT GAG ACT TTT TCT TGG 766767 ACG AAT TCA GGT AGC TAC ACA GAA TCT ACA CAG CAA AGT TAA CCT GAC 814815 ACA GAA AAT CCT TGT GCA AAT AAA TGC TTA GTA AGT ACA CAG GAT GCA 862863 CAT GTT GAA TAG AGT ATA CTG GAT TGG TGA AAG AAA ATA ATA ATA ATG 910911 AGC ATC TAA GTG GTT GGG TTT TAG AGA TCA ATC AAG AAT AAT TTT AAT 958959 TTT CTT TTG TAT TTG AAA TGT AAA TAG TTT TCT TTT CGA TTA AAA AAA10061007 TTT CCT ATA AAA AAA AAA AAA AAA AAA AAA A 103权利要求
1.一种分离的具有抑癌功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35;或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性(a)编码如权利要求1和2所述多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO2、5、8、11、14、17、20、23、26、29、32、35。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组SEQ ID NO3、6、9、12、15、18、21、24、27、30、33、36的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞(a)用权利要求6所述的载体转化或转导的宿主细胞;(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有抑癌功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含(a)在适合表达具有抑癌功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;(b)从培养物中分离出具有抑癌功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有抑癌功能的人蛋白特异性结合的抗体。
10.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
全文摘要
本发明公开了一类新的具有抑癌功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有抑癌功能的人蛋白的多核苷酸的用途。
文档编号C07H21/00GK1368508SQ01105309
公开日2002年9月11日 申请日期2001年2月8日 优先权日2001年2月8日
发明者顾健人 申请人:上海市肿瘤研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1