具有促进癌细胞生长功能的新的人蛋白及其编码序列的制作方法

文档序号:981619阅读:480来源:国知局
专利名称:具有促进癌细胞生长功能的新的人蛋白及其编码序列的制作方法
技术领域
本发明属于生物技术领域,具体地说,本发明涉及新的编码具有促进癌细胞生长功能的人蛋白的多核苷酸,以及此多核苷酸编码的多肽。本发明还涉及此多核苷酸和多肽的用途和制备。
人基因组学研究目前是国际上的热点,除人染色体DNA大规模测序,表达序列测序(EST)的方法外,还缺少从功能开始的筛选具有功能基因的高通量的方法。
癌症是危害人类健康的主要疾病之一。为了有效地治疗和预防肿瘤,目前人们已越来越关注肿瘤的基因治疗。因此,本领域迫切需要开发研究与癌细胞生长相关的人蛋白及其激动剂/抑制剂。
本发明的目的是提供一类新的具有促进癌细胞生长功能的人蛋白多肽以及其片段、类似物和衍生物。
本发明的另一目的是提供编码这些多肽的多核苷酸。
本发明的另一目的是提供生产这些多肽的方法以及该多肽和编码序列的用途。
在本发明的第一方面,提供新颖的分离出的具有促进癌细胞生长功能的蛋白多肽,它包含具有选自下组的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29;或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。
在本发明的第二方面,提供了一种分离的多核苷酸,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性(a)编码上述的具有促进癌细胞生长功能的蛋白多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。更佳地,该多核苷酸的序列选自下组SEQ ID NO3、SEQ ID NO6、SEQID NO9、SEQ ID NO12、SEQ ID NO15、SEQ ID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30的编码区序列或全长序列。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞或者被上述多核苷酸直接转化或转导的宿主细胞。
在本发明的第四方面,提供了制备具有促进癌细胞生长功能的蛋白活性的多肽的制备方法,该方法包含(a)在适合表达具有促进癌细胞生长功能的蛋白的条件下,培养上述被转化或转导的宿主细胞;(b)从培养物中分离出具有促进癌细胞生长功能的蛋白活性的多肽。
在本发明的第五方面,提供了与上述的具有促进癌细胞生长功能的蛋白多肽特异性结合的抗体。还提供了可用于检测的核酸分子,它含有上述的多核苷酸中连续10个核苷酸至全长核苷酸,较佳地它含有连续的约10-800个核苷酸。
在本发明的第六方面,提供了一种药物组合物,它含有安全有效量的本发明的具有促进癌细胞生长功能的蛋白多肽以及药学上可接受的载体。这些药物组合物可用于促进细胞的生长。本发明还提供了一种药物组合物,它含有安全有效量的针对本发明的具有促进癌细胞生长功能的蛋白多肽的拮抗剂(如抗体)以及药学上可接受的载体。该药物组合物可治疗癌症以及细胞异常增殖等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
本发明采用大规模cDNA克隆转染癌细胞,在获得具有促进癌细胞生长作用的基础上,经测序证明为新的基因,进一步得到全长cDNA克隆。DNA转染试验证明,本发明的具有促进癌细胞生长功能的蛋白对癌细胞(肝癌细胞)具有促进克隆形成的作用,其促进作用在50%或50%以上。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多聚核苷酸和多肽是没有分离纯化的,但同样的多聚核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
如本文所用,“分离的具有促进癌细胞生长功能的蛋白或多肽”是指具有促进癌细胞生长功能的蛋白多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化具有促进癌细胞生长功能的蛋白。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。具有促进癌细胞生长功能的蛋白多肽的纯度能用氨基酸序列分析。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括具有促进癌细胞生长功能的人蛋白的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的天然具有促进癌细胞生长功能的人蛋白相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。以PP6414蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO3所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO2的蛋白质,但与SEQ ID NO3所示的编码区序列有差别的核酸序列。以PP6968蛋白(在本申请中,蛋白质的命名采用其克隆编号)为例,编码成熟多肽的编码区序列可以与SEQ ID NO6所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO5的蛋白质,但与SEQ ID NO6所示的编码区序列有差别的核酸序列。对于其他具有促进癌细胞生长功能的蛋白,编码成熟多肽的多核苷酸包括只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ IDNO2所示的成熟多肽(以PP6414蛋白为例)有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码具有促进癌细胞生长功能的蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的DNA序列能用几种方法获得。例如,用本领域熟知的杂交技术分离DNA。这些技术包括但不局限于1)用探针与基因组或cDNA文库杂交以检出同源性核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的DNA片段。
编码具有促进癌细胞生长功能的蛋白的特异DNA片段序列产生也能用下列方法获得1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所需多肽的双链DNA。
上述提到的方法中,分离基因组DNA最不常用。当需要的多肽产物的整个氨基酸序列已知时,DNA序列的直接化学合成是经常选用的方法。如果所需的氨基酸的整个序列不清楚时,DNA序列的直接化学合成是不可能的,选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,et al.,MolecularClóning,A Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶反应技术时,即使极少的表达产物也能克隆。
可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于)(1)DNA-DNA或DNA-RNA杂交;(2)标志基因的功能出现或丧失;(3)测定具有促进癌细胞生长功能的蛋白的转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。
在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2kb之内,较佳地为1kb之内。此处所用的探针通常是在本发明的基因DNA序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
在第(4)种方法中,检测具有促进癌细胞生长功能的蛋白基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。
应用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
如上所述得到的本发明的基因,或者各种DNA片段等的核苷酸序列的测定可用常规方法如双脱氧链终止法(Sanger et al.PNAS,1977,745463-5467)。这类核苷酸序列测定也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或具有促进癌细胞生长功能的蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。
通过常规的重组DNA技术(Science,1984;2241431),可利用本发明的多聚核苷酸序列可用来表达或生产重组的具有促进癌细胞生长功能的蛋白多肽。一般来说有以下步骤(1).用本发明的编码具有促进癌细胞生长功能的人蛋白的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养的宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。
本发明中,具有促进癌细胞生长功能的人蛋白多核苷酸序列可插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。在本发明中适用的载体包括但不限于在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56125);在哺乳动物细胞中表达的pMSXND表达载体(Lee and Nathans,J Bio Chem.2633521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。
本领域的技术人员熟知的方法能用于构建含具有促进癌细胞生长功能的人蛋白编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,et al.Molecular Cloning,a LaboratoryManual,cold Spring Harbor Laboratory.New York,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。可供选择的是用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
重组的具有促进癌细胞生长功能的人蛋白或多肽有多方面的用途。这些用途包括(但不限于)直接做为药物治疗具有促进癌细胞生长功能的蛋白功能低下或丧失所致的疾病,和用于筛选促进或对抗具有促进癌细胞生长功能的蛋白功能的抗体、多肽或其它配体。例如,该抗体可用于治疗癌症或细胞异常增殖。用表达的重组具有促进癌细胞生长功能的人蛋白筛选多肽库可用于寻找有治疗价值的能抑制或刺激具有促进癌细胞生长功能的人蛋白功能的多肽分子。
本发明也提供了筛选药物以鉴定提高(激动剂)或阻遏(拮抗剂)具有促进癌细胞生长功能的人蛋白的药剂的方法。激动剂提高具有促进癌细胞生长功能的人蛋白刺激细胞增殖等生物功能,而拮抗剂阻止和治疗与细胞过度增殖有关的紊乱如各种癌症。例如,能在药物的存在下,将哺乳动物细胞或表达具有促进癌细胞生长功能的人蛋白的膜制剂与标记的具有促进癌细胞生长功能的人蛋白一起培养。然后测定药物提高或阻遏此相互作用的能力。
具有促进癌细胞生长功能的人蛋白的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。具有促进癌细胞生长功能的人蛋白的拮抗剂可以与具有促进癌细胞生长功能的人蛋白结合并消除其功能,或是抑制具有促进癌细胞生长功能的人蛋白的产生,或是与多肽的活性位点结合使多肽不能发挥生物学功能。具有促进癌细胞生长功能的人蛋白的拮抗剂可用于治疗用途。
在筛选作为拮抗剂的化合物时,可以将具有促进癌细胞生长功能的蛋白加入生物分析测定中,通过测定化合物影响具有促进癌细胞生长功能的蛋白和其受体之间的相互作用来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。
本发明的多肽可直接用于疾病治疗,例如,各种恶性肿瘤、和细胞异常增殖等。
本发明的多肽,及其片段、衍生物、类似物或它们的细胞可以用来作为抗原以生产抗体。这些抗体可以是多克隆或单克隆抗体。多克隆抗体可以通过将此多肽直接注射动物的方法得到。制备单克隆抗体的技术包括杂交瘤技术,三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。具有促进癌细胞生长功能的蛋白或其特异性抗体,可按有效地治疗和/或预防具体的适应症的量来给药。施用于患者的具有促进癌细胞生长功能的蛋白的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
具有促进癌细胞生长功能的人蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于具有促进癌细胞生长功能的蛋白的无表达或异常/无活性的具有促进癌细胞生长功能的蛋白的表达所致的细胞发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有促进癌细胞生长功能的蛋白,以抑制内源性的具有促进癌细胞生长功能的蛋白活性。例如,一种变异的具有促进癌细胞生长功能的蛋白可以是缩短的、缺失了信号传导功能域的具有促进癌细胞生长功能的蛋白,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗具有促进癌细胞生长功能的蛋白表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将具有促进癌细胞生长功能的蛋白基因转移至细胞内。构建携带具有促进癌细胞生长功能的蛋白基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组具有促进癌细胞生长功能的人蛋白基因可包装到脂质体中转移至细胞内。
抑制具有促进癌细胞生长功能的人蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。由于本发明蛋白具有促进癌细胞生长的功能,因此本发明蛋白编码序列的反义序列,可被引入细胞以抑制细胞的异常增殖(如癌变)。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对具有促进癌细胞生长功能的人蛋白抗原决定簇的抗体。这些抗体包括(但不限于)多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗具有促进癌细胞生长功能的人蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的具有促进癌细胞生长功能的人蛋白。
与具有促进癌细胞生长功能的人蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与具有促进癌细胞生长功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有促进癌细胞生长功能的人蛋白的产生或活性,从而抑制癌细胞的生长和/或细胞的异常增殖。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如具有促进癌细胞生长功能的人蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭具有促进癌细胞生长功能的人蛋白阳性的细胞。
多克隆抗体的生产可用具有促进癌细胞生长功能的人蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
具有促进癌细胞生长功能的人蛋白单克隆抗体可用杂交瘤技术生产(Kohler andMilstein.Nature,1975,256495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison et al,PNAS,1985,816851)。而已有的生产单链抗体的技术(U.S.Pat No.4946778)也可用于生产抗具有促进癌细胞生长功能的人蛋白的单链抗体。
能与具有促进癌细胞生长功能的人蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对具有促进癌细胞生长功能的人蛋白分子进行标记。
本发明还涉及定量和定位检测具有促进癌细胞生长功能的人蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的具有促进癌细胞生长功能的人蛋白水平,可以用作解释具有促进癌细胞生长功能的人蛋白在各种疾病中的重要性和用于诊断具有促进癌细胞生长功能的蛋白起作用的疾病。
具有促进癌细胞生长功能的蛋白的多聚核苷酸可用于具有促进癌细胞生长功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有促进癌细胞生长功能的蛋白的多聚核苷酸可用于检测具有促进癌细胞生长功能的蛋白的表达与否或在疾病状态下具有促进癌细胞生长功能的蛋白的异常表达。如具有促进癌细胞生长功能的蛋白DNA序列可用于对活检标本的杂交以判断具有促进癌细胞生长功能的蛋白的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用具有促进癌细胞生长功能的蛋白特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测具有促进癌细胞生长功能的蛋白的转录产物。
检测具有促进癌细胞生长功能的蛋白基因的突变也可用于诊断具有促进癌细胞生长功能的蛋白相关的疾病。具有促进癌细胞生长功能的蛋白突变的形式包括与正常野生型具有促进癌细胞生长功能的蛋白DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。现在,只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。
简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。
体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。
将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,Human Chromosomesa Manual of BasicTechniques,Pergamon Press,New York(1988)。
一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,Mendelian Inheritance in Man(可通过与Johns Hopkins University Welch Medical Library联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。
接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。
本发明的具有促进癌细胞生长功能的蛋白核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
此外,由于本发明的具有促进癌细胞生长功能的蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New YorkCold Spring Harbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1cDNA基因的获得及对癌细胞克隆形成的促进作用SP2114b来自于从GIBCO BRL公司购得的肝cDNA文库(目录号10422-012),PP6414、PP6968、PP7122、PP7157、PP7517、PP7683、PP7879、PP8376和PP10029是通过用常规方法构建人胎盘cDNA文库获得的。取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用pCMV-script TMXR cDNA文库构建试剂盒(Stratagene公司)构建上述mRNA的cDNA文库。其中反转录酶改用MMLV-RT-Superscript II(GIBCO BRL),反转录反应在42℃进行。转化XL 10-Gold感受细胞,获得了1×106cfu/μg滴度的cDNA文库。第一轮随机挑取cDNA克隆,其后以高丰度cDNA克隆和已证明有抑癌细胞生长功能的cDNA克隆为探针,杂交筛选cDNA文库,挑取弱阳性及阴性克隆。用Qiagen 96孔板质粒抽提试剂盒,按厂家说明书进行质粒DNA的提取。质粒DNA和空载体同时转染肝癌细胞系3T3。100ng DNA酒精沉淀干燥后,加6μl H2O溶解,待转染。每份DNA样品中加0.74μl脂质体及9.3μl无血清培液,混匀后,室温放置10分钟。每管中加150μl无血清培液,均分加入3孔生长于96孔板的7721细胞中,37℃放置2小时,每孔再加50μl无血清培液,37℃24小时。每孔换100μl全培液,37℃24小时,换含G418的全培液100μl,37℃24-48小时,边观察,边换G418浓度不等的培液。约2-3次后,直到镜检细胞有克隆形成,计数。发现以上2个克隆有促进细胞克隆形成作用,结果如下表所示。
cDNA克隆转染细胞(3T3)克隆形成情况
对cDNA克隆采用双脱氧终止法,在ABI377 DNA自动测序仪上测定其一端近500bp的核苷酸序列。分析后,确定为新基因克隆,进行另一端测序,仍未获得全长cDNA序列,设计引物,再次进行测序,直到获得全长序列(SEQ ID NO1、4、7、10、13、16、19、22、25、28)。
实施例2从胎盘cDNA中PCR获得全长基因取3、6、10月龄的胎盘组织,用Trizol试剂(GIBCO BRL公司)按厂方说明书提取总RNA,用mRNA提纯试剂盒(Pharmacia公司)提取mRNA。用MMLV-RT-SuperscriptII(GIBCO BRL),反转录酶在42℃进行反转录反应,获得胎盘cDNA。利用各个基因的转异引物(如下表所示),按97℃3分钟、1个循环;94℃30秒→60℃30秒→72℃1分钟,共35个循环;72℃10分钟,1个循环,进行PCR扩增,获得含有完整开放阅读框序列的各蛋白基因的扩增产物。扩增产物经测序验证,与实施例1测得的序列相符。(注对于SP2114b,可使用从GIBCO BRL公司购得的肝cDNA文库(目录号10422-012)作为模板)。随后用常规技术将扩增产物转入宿主细胞,从而获得重组蛋白。
基因特异引物
实施例3cDNA克隆序列分析1.PP6414A核苷酸序列(SEQ ID NO1)长度1914bp1GCCGGGGACC ACACAGAGAA TAACTTGTCT GACTACCAGT ATTCTTGGAT GCAGAAGTGC61TGAAGATGAG CACACACACG TACGGAGAAT TTCTGGAGAA TTCAGCTGCT CAGAACAAGA121ACTGAGATCC AGAGAGATGA TGACTTTGCC CATAGACCAA ACAAAGAAAT ACATGTTTCA181GTCCTGTGTC CTCCTGCTAT GTGTGTCCGG AATTGGTGGG TTCTTGGTCT CACTGACTTC241AAGAATGAAG CTGCGGACCC TCGCGGTGAG TGTTACAGTT CTTAAAGGCA GTGTGTCCAG301AGTTTGTTCC TACTGATGTG TGGATGTGTT CGGAGTATCT TCCTTCTGGT GGGTTCGTGG361TCTCGCTGGC TCAGGAGTGA AGCTGCAGAC CTTCGTGGTG AGTGTTACAG CTCTTAAGGT421GGTGCGTCTG GAGTTGTTCA TTCCTCCCAG CGGGCTCGTG GTCTCACTGG CTTCAGGAGT481GAAGCTGCAG ACCTTCGCGG TGAGTGTTAC AGCTCATAAA GGCAGCGTGG ACCCAAAGAG541TGAGAAGTAG CAAGATTTAT TGCGAAGAGC GAAAGAACAA AGCTTCCACG ATGTGGAAGG601AGACCCCAGC AGATTGCCAC TGCTGGCTTG GGCAGCCTGC TTTTATTCTC TTATTTGGCC661CCCACCCACA TCCTGGTGAT TGGTAGAGCC CAGTGGTCTG TTTTGACAGG GCGCTGATTG721GTGCGTTTAC AATCACTGAG CCAGATACAA AGGTTCTCCA GGTCCCCACT AGATTAGCTA781GATACAGAGT GTCTATTGGT GCATTCACAA ACCCTGAGCT AGACACAGGG TGTTGATTGG841TGTGTTTACA AACCTTGAGC TAGAGACAGA GTGCCGATTG GTGTATTTAC AATCCCTGAG901CTAGACACAA AGGTTCTCCA CGTCCGCACC AGACTCAGGA GCCCAGCTGG CTTCACCCAG961TGGATCCCGC ACTGCCCCTG CAGGTGGAGC TGCCTGCCAG TCCCTCGCGG TGCGCCCGCA1021CTCCTCAGCC CTTGGGTGGT CGATGGGACT GGGCGCTGTG GAGCAGGAGG CGGCGCTTGC1081TGGGGAGGCT CCTGCGGCAC AGGTGCCCAC GGAGGGGGTG GGAGGCTCAG GCATGGCGGG1141CTGCAGGTCC CGAGCCCTGC CCCTTGGGAA GGCAGCTAGG GCCCCGGGAG AAATCGAGCG1201CAGCGCCGGT GGGTCAGCAC TGCTGGGGGA CCCAGTACAC CCTCCACAGC CACTGGCTCG1261GGTGCTAAGC CCCTCATTGC CTGGGGCCGG CAGGGCCTGC CGGCTGCTCC GAGTGCGGGC1321CGCCAAGCTC ACACCCACCC AGAACTCCAG CTGGCCTGCA AGCGTCGCGT GCAGCCCCGG1381TTCCTGCTCG CACCTCTCCC TCCACACCTC CCTGCAAGCT GAGGGAGCCG GCTCCGGCCT1441TGGCAAGCCC AGAAAGGGGC TCCCACAGTG CAGCGGTGGG CTGAAGGGCT CCTCAAGTGC1501CGCCAAAGTG GGAGCCCAGG CAGAGGAGGC ACCGAGAGCG AGTGAGGGCT CTGAGGACTG1561CCAGCACGCT GTCACCTCTC ACTAGTAGCT ATCCTACTTT TAAATAAAGA ATTAGGCTGG1621GCACGGTAGC TCACGCCTGT AATCCCAGCA CTTCGGGAGG CCAAGGGGGG TGGATCACCT1681GAGGTCAGGA ATTCGAGACC AGCCTGGCCA ACATGGCAAA ACCCCATCTC TACTAAGAAT1741ACAAAAATTT GCCAGGCATG GTGGCGGGTG CCTGTAATCC CAGCTGCTTG AGAGACTGAG1801GTGGGAGAAT CACTTGAACC CGGGAGGCGA AGGTTGCGGT AAGCCGAGAT TGCACCACGG1861TGCTTCGGCC TGGGCGGCAG AGTGAGACTC TGTTTCAAAA AAAAAAAAAA AAAAB氨基酸序列(SEQ ID NO2) 长度180个氨基酸1 MGLGAVEQEA ALAGEAPAAQ VPTEGVGGSG MAGCRSRALP LGKAARAPGE IERSAGGSAL61 LGDPVHPPQP LARVLSPSLP GAGRACRLLR VRAAKLTPTQ NSSWPASVAC SPGSCSHLSL121 HTSLQAEGAG SGLGKPRKGL PQCSGGLKGS SSAAKVGAQA EEAPRASEGS EDCQHAVTSHC.核苷酸及氨基酸组合序列(SEQ ID NO3)克隆号PP6414
起始编码子1043 ATG终止编码子1583 TAG蛋白质分子量17679.871G CCG GGG ACC ACA CAG AGA ATA ACT TGT CTG ACT ACC AGT ATT CTT 4647 GGA TGC AGA AGT GCT GAA GAT GAG CAC ACA CAC GTA CGG AGA ATT TCT 9495 GGA GAA TTC AGC TGC TCA GAA CAA GAA CTG AGA TCC AGA GAG ATG ATG 142143 ACT TTG CCC ATA GAC CAA ACA AAG AAA TAC ATG TTT CAG TCC TGT GTC 190191 CTC CTG CTA TGT GTG TCC GGA ATT GGT GGG TTC TTG GTC TCA CTG ACT 238239 TCA AGA ATG AAG CTG CGG ACC CTC GCG GTG AGT GTT ACA GTT CTT AAA 286287 GGC AGT GTG TCC AGA GTT TGT TCC TAC TGA TGT GTG GAT GTG TTC GGA 334335 GTA TCT TCC TTC TGG TGG GTT CGT GGT CTC GCT GGC TCA GGA GTG AAG 382383 CTG CAG ACC TTC GTG GTG AGT GTT ACA GCT CTT AAG GTG GTG CGT CTG 430431 GAG TTG TTC ATT CCT CCC AGC GGG CTC GTG GTC TCA CTG GCT TCA GGA 478479 GTG AAG CTG CAG ACC TTC GCG GTG AGT GTT ACA GCT CAT AAA GGC AGC 526527 GTG GAC CCA AAG AGT GAG AAG TAG CAA GAT TTA TTG CGA AGA GCG AAA 574575 GAA CAA AGC TTC CAC GAT GTG GAA GGA GAC CCC AGC AGA TTG CCA CTG 622623 CTG GCT TGG GCA GCC TGC TTT TAT TCT CTT ATT TGG CCC CCA CCC ACA 670671 TCC TGG TGA TTG GTA GAG CCC AGT GGT CTG TTT TGA CAG GGC GCT GAT 718719 TGG TGC GTT TAC AAT CAC TGA GCC AGA TAC AAA GGT TCT CCA GGT CCC 766767 CAC TAG ATT AGC TAG ATA CAG AGT GTC TAT TGG TGC ATT CAC AAA CCC 814815 TGA GCT AGA CAC AGG GTG TTG ATT GGT GTG TTT ACA AAC CTT GAG CTA 862863 GAG ACA GAG TGC CGA TTG GTG TAT TTA CAA TCC CTG AGC TAG ACA CAA 910911 AGG TTC TCC ACG TCC GCA CCA GAC TCA GGA GCC CAG CTG GCT TCA CCC 958959 AGT GGA TCC CGC ACT GCC CCT GCA GGT GGA GCT GCC TGC CAG TCC CTC10061007 GCG GTG CGC CCG CAC TCC TCA GCC CTT GGG TGG TCG ATG GGA CTG GGC10541 Met Gly Leu Gly 41055 GCT GTG GAG CAG GAG GCG GCG CTT GCT GGG GAG GCT CCT GCG GCA CAG11025 Ala Val Glu Gln Glu Ala Ala Leu Ala Gly Glu Ala Pro Ala Ala Gln 201103 GTG CCC ACG GAG GGG GTG GGA GGC TCA GGC ATG GCG GGC TGC AGG TCC115021 Val Pro Thr Glu Gly Val Gly Gly Ser Gly Met Ala Gly Cys Arg Ser 361151 CGA GCC CTG CCC CTT GGG AAG GCA GCT AGG GCC CCG GGA GAA ATC GAG119837 Arg Ala Leu Pro Leu Gly Lys Ala Ala Arg Ala Pro Gly Glu Ile Glu 521199 CGC AGC GCC GGT GGG TCA GCA CTG CTG GGG GAC CCA GTA CAC CCT CCA124653 Arg Ser Ala Gly Gly Ser Ala Leu Leu Gly Asp Pro Val His Pro Pro 681247 CAG CCA CTG GCT CGG GTG CTA AGC CCC TCA TTG CCT GGG GCC GGC AGG129469 Gln Pro Leu Ala Arg Val Leu Ser Pro Ser Leu Pro Gly Ala Gly Arg 841295 GCC TGC CGG CTG CTC CGA GTG CGG GCC GCC AAG CTC ACA CCC ACC CAG134285 Ala Cys Arg Leu Leu Arg Val Arg Ala Ala Lys Leu Thr Pro Thr Gln 1001343 AAC TCC AGC TGG CCT GCA AGC GTC GCG TGC AGC CCC GGT TCC TGC TCG1390101 Asn Ser Ser Trp Pro Ala Ser Val Ala Cys Ser Pro Gly Ser Cys Ser 1161391 CAC CTC TCC CTC CAC ACC TCC CTG CAA GCT GAG GGA GCC GGC TCC GGC1438117 His Leu Ser Leu His Thr Ser Leu Gln Ala Glu Gly Ala Gly Ser Gly 1321439 CTT GGC AAG CCC AGA AAG GGG CTC CCA CAG TGC AGC GGT GGG CTG AAG1486133 Leu Gly Lys Pro Arg Lys Gly Leu Pro Gln Cys Ser Gly Gly Leu Lys 1481487 GGC TCC TCA AGT GCC GCC AAA GTG GGA GCC CAG GCA GAG GAG GCA CCG1534149 Gly Ser Ser Ser Ala Ala Lys Val Gly Ala Gln Ala Glu Glu Ala Pro 1641535 AGA GCG AGT GAG GGC TCT GAG GAC TGC CAG CAC GCT GTC ACC TCT CAC1582165 Arg Ala Ser Glu Gly Ser Glu Asp Cys Gln His Ala Val Thr Ser His 1801583 TAG TAG CTA TCC TAC TTT TAA ATA AAG AAT TAG GCT GGG CAC GGT AGC1630181 *** 1811631 TCA CGC CTG TAA TCC CAG CAC TTC GGG AGG CCA AGG GGG GTG GAT CAC16781679 CTG AGG TCA GGA ATT CGA GAC CAG CCT GGC CAA CAT GGC AAA ACC CCA17261727 TCT CTA CTA AGA ATA CAA AAA TTT GCC AGG CAT GGT GGC GGG TGC CTG17741775 TAA TCC CAG CTG CTT GAG AGA CTG AGG TGG GAG AAT CAC TTG AAC CCG18221823 GGA GGC GAA GGT TGC GGT AAG CCG AGA TTG CAC CAC GGT GCT TCG GCC18701871 TGG GCG GCA GAG TGA GAC TCT GTT TCA AAA AAA AAA AAA AAA AA 19142.PP6968A核苷酸序列(SEQ ID NO4)长度2361bp1GCGCTGACAG AGGCAAAAAT CTGCTAACTC AGGGGGCAGA CTCAACCAAG ACTGTGAGCA61GGCCTGGGGA ATGACCCCCC GATCTCCAAC CAGTGCCTTC CGCAGCTGCA CGGCTGTCTC121CAGCTGTCTC TGCCCCTCTT CCTGGCCCTG GCTCCATCTC TCTGTCACCT CACCCTTCCC181TGTGCCACAT GGGCCCTCTC TCTCCTGCCA GGACGCTGCG GCTCTGGGGA CCTCGGAGCC241TGGGGGTGGC TCTGGGAGTC TTCATGACCA TTGGCTTTGC ACTCCAGCTC TTGGGAGGGC301CCTTCCAGAG GAGGCTACCT GGGCTACAGC TCCGACAGCC CTCGGCCCCA TCCCTACGAC361CAGCCCTTCC GTCCTGCCCA CCCCGGCAGC GACTGGTGTT CCTGAAGACA CATAAATCCG421GGAGCAGCTC TGTGCTGAGC CTGCTTCACC GCTATGGGGA CCAGCACGGG CTGCGCTTCG481CCCTCCCTGC CCGCTACCAG TTTGGCTACC CAAAGCTCTT CCAGGCCTCT AGGGTAAAAG541GCTACCGCCC ACAGGGTGGA GGCACCCAGC TCCCCTTCCA CATCCTCTGT CACCACATGA601GGTTCAACCT GAAAGAGGTA CTTCAGGTCA TGCCTTCTGA CAGCTTCTTT TTTTCCATTG661TCCGAGACCC AGCGGCTCTG GCTCGCTCTG CCTTCTCCTA CTATAAATCC ACCTCATCAG721CCTTCCGCAA GTCACCATCT TTGGCTGCCT TCCTGGCCAA TCCTCGAGGC TTCTACAGGC781CTGGGGCCGT GGGGACCACT TACGCTCGCA ACTTACTATG GTTTGACTTT GGCCTGCCCT841TTCCCCCAGA GAAGAGGGCC AAGAGAGGGA ATATTCATCC CCCCAGAGAC CCCAACCCCC901CACAGCTGCA GGTCTTGCCT TCTGGTGCTG GCCCTCGAGC CCAAACCCTC AATCCCAATG961CCCTCATCCA TCCTGTTTCC ACTGTTACTG ATCATCGCAG CCAGATATCA AGCCCTGCCT1021CTTTCGATTT GGGGTCTTCA TCCTTCATCC AGTGGGGTCT GGCCTGGCTG GACTCTGTCT1081TTGACCTGGT CATGGTGGCT GAGTACTTCG ATGAGTCATT GGTTCTGCTG GCAGATGCCC1141TGTGCTGGGG TCTAGATGAC GTGGTGGGCT TCATGCACAA TGCCCAGGCT GGACATAAGC1201AGGGCCTCAG CACTGTCAGC AACAGTGGAC TGACTGCGGA GGACCGGCAG CTGACTGCAC1261GGGCCCGAGC CTGGAACAAC CTGGACTGGG CTCTCTATGT CCACTTCAAC CGCAGTCTCT1321GGGCACGGAT AGAGAAATAC GGCCAGGGCC GGCTGCAGAC AGCTGTGGCC GAGCTCCGGG1381CTCGCCGAGA GGCCCTAGCG AAACATTGTC TGGTAGGGGG TGAGGCTTCT GACCCCAAAT1441ACATCACTGA TCGCCGGTTC CGCCCCTTCC AGTTTGGGTC AGCTAAGGTT TTGGGCTATA1501TACTTCGGAG TGGATTGAGC CCCCAAGACC AAGAGGAATG TGAGCGCCTA GCTACCCCTG1561AGCTCCAGTA CAAGGACAAG CTGGATGTCA AGCAGTTCCC CCCTACCGTC TCACTGCCCC1621TCAAGACTTC AAGGCCACTC TCCCCATAAA CATCAGACTA CAGATTTAGG TGGAAGAGCA1681GCCATGTTTG AAGGGCACAT GTGATGAGTG GGGGGCAGCA AGATGCCATT TCTGCATCTC1741CCAGAAGGGA TGAGTCTTTG TCCCGATGCA AGCCCCCTCT TCGCTGGGCT CCCAGCAGTG1801CTTCCCTCCT CCACCCTCCA CTCATTTTGT TCTTTCCCCC CAACTTTTTT TTTTTTTGAA1861ACGGAGTCTT GCTCTGTCCC CCAGGCTGGA GTGCAGTGGC ATGATCTCGG CTCACTGCAA1921CCTCTGCCTC CCAGGTTCAA GCGATTCTCC TGCCTCAGCC TCCAGAGTAG CTAGGATTAC1981AGATACGTGC CACCATACCC GGCTAATTTT TATATTTTTA GAGACAGGGA TTCAACATGT2041TGGTTAGGCT GGCCTTGAAC TCCTCACCTC AGGTGATCCA CATGACTCTG CCTCCCAAAG2101TGCTGCCATT ACAGGCGTGA GCCACTAGGC CTGACCTCCC CTTCCCCTTT CCTGCCCCAA2161GGCAGATCCA CATCACCGAA GCTCCCTAGA GGGGCAAAAG ATGGAGTGAG CCACAGGAAG2221TTTGGGGCGT GGTGAGTTGG AATGATACGT CCATTTCTCT ATGAAATATT TGCTACTAGA2281CTGTTCATTT CTCTCTGACA TGTTTGTTGA ATGAATAAAT AATTTGAAAC TTCAAAAAAA2341AAAAAAAAAA AAAAAAAAAA AB氨基酸序列(SEQ ID NO5) 长度486个氨基酸1MGPLSPARTL RLWGPRSLGV ALGVFMTIGF ALQLLGGPFQ RRLPGLQLRQ PSAPSLRPAL61PSCPPRQRLV FLKTHKSGSS SVLSLLHRYG DQHGLRFALP ARYQFGYPKL FQASRVKGYR121PQGGGTQLPF HILCHHMRFN LKEVLQVMPS DSFFFSIVRD PAALARSAFS YYKSTSSAFR181KSPSLAAFLA NPRGFYRPGA VGTTYARNLL WFDFGLPFPP EKRAKRGNIH PPRDPNPPQL241QVLPSGAGPR AQTLNPNALI HPVSTVTDHR SQISSPASFD LGSSSFIQWG LAWLDSVFDL301AMVAEYFDES LVLLADALCW GLDDVVGFMH NAQAGHKQGL STVSNSGLTA EDRQLTARAR361AWNNLDWALY VHFNRSLWAR IEKYGQGRLQ TAVAELRARR EALAKHCLVG GEASDPKYIT421DRRFRPFQFG SAKVLGYILR SGLSPQDQEE CERLATPELQ YKDKLDVKQF PPTVSLPLKT481SRPLSPC.核苷酸及氨基酸组合序列(SEQ ID NO6)克隆号 PP6968起始编码子189 ATG终止编码子1647 TAA蛋白质分子量54084.131 GC GCT GAC AGA GGC AAA AAT CTG CTA ACT CAG GGG GCA GAC TCA ACC 4748 AAG ACT GTG AGC AGG CCT GGG GAA TGA CCC CCC GAT CTC CAA CCA GTG 9596 CCT TCC GCA GCT GCA CGG CTG TCT CCA GCT GTC TCT GCC CCC CTT CCT 143144 GGC CCT GGC TCC ATC TCT CTG TCA CCT CAC CCT TCC CTG TGC CAC ATG 1911 Met 1192 GGC CCT CTC TCT CCT GCC AGG ACG CTG CGG CTC TGG GGA CCT CGG AGC 2392 Gly Pro Leu Ser Pro Ala Arg Thr Leu Arg Leu Trp Gly Pro Arg Ser 17240 CTG GGG GTG GCT CTG GGA GTC TTC ATG ACC ATT GGC TTT GCA CTC CAG 28718 Leu Gly Val Ala Leu Gly Val Phe Met Thr Ile Gly Phe Ala Leu Gln 33288 CTC TTG GGA GGG CCC TTC CAG AGG AGG CTA CCT GGG CTA CAG CTC CGA 33534 Leu Leu Gly Gly Pro Phe Gln Arg Arg Leu Pro Gly Leu Gln Leu Arg 49336 CAG CCC TCG GCC CCA TCC CTA CGA CCA GCC CTT CCG TCC TGC CCA CCC 38350 Gln Pro Ser Ala Pro Ser Leu Arg Pro Ala Leu Pro Ser Cys Pro Pro 65384 CGG CAG CGA CTG GTG TTC CTG AAG ACA CAT AAA TCC GGG AGC AGC TCT 43166 Arg Gln Arg Leu Val Phe Leu Lys Thr His Lys Ser Gly Ser Ser Ser 81432 GTG CTG AGC CTG CTT CAC CGC TAT GGG GAC CAG CAC GGG CTG CGC TTC 47982 Val Leu Ser Leu Leu His Arg Tyr Gly Asp Gln His Gly Leu Arg Phe 97480 GCC CTC CCT GCC CGC TAC CAG TTT GGC TAC CCA AAG CTC TTC CAG GCC 52798 Ala Leu Pro Ala Arg Tyr Gln Phe Gly Tyr Pro Lys Leu Phe Gln Ala 113528 TCT AGG GTA AAA GGC TAC CGC CCA CAG GGT GGA GGC ACC CAG CTC CCC 575114 Ser Arg Val Lys Gly Tyr Arg Pro Gln Gly Gly Gly Thr Gln Leu Pro 129576 TTC CAC ATC CTC TGT CAC CAC ATG AGG TTC AAC CTG AAA GAG GTA CTT 623130 Phe His Ile Leu Cys His His Met Arg Phe Asn Leu Lys Glu Val Leu 145624 CAG GTC ATG CCT TCT GAC AGC TTC TTT TTT TCC ATT GTC CGA GAC CCA 671146 Gln Val Met Pro Ser Asp Ser Phe Phe Phe Ser Ile Val Arg Asp Pro 161672 GCG GCT CTG GCT CGC TCT GCC TTC TCC TAC TAT AAA TCC ACC TCA TCA 719162 Ala Ala Leu Ala Arg Ser Ala Phe Ser Tyr Tyr Lys Ser Thr Ser Ser 177720 GCC TTC CGC AAG TCA CCA TCT TTG GCT GCC TTC CTG GCC AAT CCT CGA 767178 Ala Phe Arg Lys Ser Pro Ser Leu Ala Ala Phe Leu Ala Asn Pro Arg 193768 GGC TTC TAC AGG CCT GGG GCC GTG GGG ACC ACT TAC GCT CGC AAC TTA 815194 Gly Phe Tyr Arg Pro Gly Ala Val Gly Thr Thr Tyr Ala Arg Asn Leu 209816 CTA TGG TTT GAC TTT GGC CTG CCC TTT CCC CCA GAG AAG AGG GCC AAG 863210 Leu Trp Phe Asp Phe Gly Leu Pro Phe Pro Pro Glu Lys Arg Ala Lys 225864 AGA GGG AAT ATT CAT CCC CCC AGA GAC CCC AAC CCC CCA CAG CTG CAG 911226 Arg Gly Asn Ile His Pro Pro Arg Asp Pro Asn Pro Pro Gln Leu Gln 241912 GTC TTG CCT TCT GGT GCT GGC CCT CGA GCC CAA ACC CTC AAT CCC AAT 959242 Val Leu Pro Ser Gly Ala Gly Pro Arg Ala Gln Thr Leu Asn Pro Asn 257960 GCC CTC ATC CAT CCT GTT TCC ACT GTT ACT GAT CAT CGC AGC CAG ATA1007258 Ala Leu Ile His Pro Val Ser Thr Val Thr Asp His Arg Ser Gln Ile 2731008 TCA AGC CCT GCC TCT TTC GAT TTG GGG TCT TCA TCC TTC ATC CAG TGG1055274 Ser Ser Pro Ala Ser Phe Asp Leu Gly Ser Ser Ser Phe Ile Gln Trp 2891056 GGT CTG GCC TGG CTG GAC TCT GTC TTT GAC CTG GTC ATG GTG GCT GAG1103290 Gly Leu Ala Trp Leu Asp Ser Val Phe Asp Leu Val Met Val Ala Glu 3051104 TAC TTC GAT GAG TCA TTG GTT CTG CTG GCA GAT GCC CTG TGC TGG GGT1151306 Tyr Phe Asp Glu Ser Leu Val Leu Leu Ala Asp Ala Leu Cys Trp Gly 3211152 CTA GAT GAC GTG GTG GGC TTC ATG CAC AAT GCC CAG GCT GGA CAT AAG1199322 Leu Asp Asp Val Val Gly Phe Met His Asn Ala Gln Ala Gly His Lys 3371200 CAG GGC CTC AGC ACT GTC AGC AAC AGT GGA CTG ACT GCG GAG GAC CGG1247338 Gln Gly Leu Ser Thr Val Ser Asn Ser Gly Leu Thr Ala Glu Asp Arg 3531248 CAG CTG ACT GCA CGG GCC CGA GCC TGG AAC AAC CTG GAC TGG GCT CTC1295354 Gln Leu Thr Ala Arg Ala Arg Ala Trp Asn Asn Leu Asp Trp Ala Leu 3691296 TAT GTC CAC TTC AAC CGC AGT CTC TGG GCA CGG ATA GAG AAA TAC GGC1343370 Tyr Val His Phe Asn Arg Ser Leu Trp Ala Arg Ile Glu Lys Tyr Gly 3851344 CAG GGC CGG CTG CAG ACA GCT GTG GCC GAG CTC CGG GCT CGC CGA GAG1391386 Gln Gly Arg Leu Gln Thr Ala Val Ala Glu Leu Arg Ala Arg Arg Glu 4011392 GCC CTA GCG AAA CAT TGT CTG GTA GGG GGT GAG GCT TCT GAC CCC AAA1439402 Ala Leu Ala Lys His Cys Leu Val Gly Gly Glu Ala Ser Asp Pro Lys 4171440 TAC ATC ACT GAT CGC CGG TTC CGC CCC TTC CAG TTT GGG TCA GCT AAG 1487418 Tyr Ile Thr Asp Arg Arg Phe Arg Pro Phe Gln Phe Gly Ser Ala Lys 4331488 GTT TTG GGC TAT ATA CTT CGG AGT GGA TTG AGC CCC CAA GAC CAA GAG 1535434 Val Leu Gly Tyr Ile Leu Arg Ser Gly Leu Ser Pro Gln Asp Gln Glu 4491536 GAA TGT GAG CGC CTA GCT ACC CCT GAG CTC CAG TAC AAG GAC AAG CTG 1583450 Glu Cys Glu Arg Leu Ala Thr Pro Glu Leu Gln Tyr Lys Asp Lys Leu 4651584 GAT GTC AAG CAG TTC CCC CCT ACC GTC TCA CTG CCC CTC AAG ACT TCA 1631466 Asp Val Lys Gln Phe Pro Pro Thr Val Ser Leu Pro Leu Lys Thr Ser 4811632 AGG CCA CTC TCC CCA TAA ACA TCA GAC TAC AGA TTT AGG TGG AAG AGC 1679482 Arg Pro Leu Ser Pro *** 4871680 AGC CAT GTT TGA AGG GCA CAT GTG ATG AGT GGG GGG CAG CAA GAT GCC 17271728 ATT TCT GCA TCT CCC AGA AGG GAT GAG TCT TTG TCC CGA TGC ACG CCC 17751776 CCT CTT CGC TGG GCT CCC AGC AGT GCT TCC CTC CTC CAC CCT CCA CTC 18231824 ATT TTG TTC TTT CCC CCC AAC TTT TTT TTT TTT TGA AAC GGA GGTC TTG18711872 CTC TGT CCC CCA GGC TGG AGT GCA GTG GCA TGA TCT CGG CTC ACT GCA 19191920 ACC TCT GCC TCC CAG GTT CAA GCG ATT CTC CTG CCT CAG CCT CCA GAG 19671968 TAG CTA GGA TTA CAG ATA CGT GCC ACC ATA CCC GGC TAA TTT TTA TAT 20152016 TTT TAG AGA CAG GGA TTC AAC ATG TTG GTT AGG CTG GCC TTG AAC TCC 20632064 TCA CCT CAG GTG ATC CAC ATG ACT CTG CCT CCC AAA GTG CTG CCA TTA 21112112 CAG GCG TGA GCC ACT AGG CCT GAC CTC CCC TTC CCC TTT CCT GCC CCA 21592160 AGG CAG ATC CAC ATC ACC GAA GCT CCC TAG AGG GGC AAA AGA TGG AGT 22072208 GAG CCA CAG GAA GTT TGG GGC GTG GTG AGT TGG AAT GAT ACG TCC ATT 22552256 TCT CTA TGA AAT ATT TGC TAC TAG ACT GTT CAT TTC TCT CTG ACA TGT 23032304 TTG TTG AAT GAA TAA ATA ATT TGA AAC TTC AAA AAA AAA AAA AAA AAA 23512352 AAA AAA AAA A 23613.PP7122A核苷酸序列(SEQ ID NO7)长度1987bp1 GGTACATTTG CCCAGCTTCC CTGCCAGCCT TTAACCCCAG GAACCTCTCA GTCTACCTCC61 TCTTTTCTGC CTCTGAATCC CTACCTTTAA AGTCAGAACA GGCCAGGCCC GGTGGCTCAC121 GCCTGTAATC CCAGCACTTT GGGAGGCTGA GGTGGGTGGA TCACTTGACA TCAGTAGTTC181 AAGACCAGCC TGGCCAACAT GGTGAAACCC CATCCTTACT AAAAATACAA AAATTAGCCA241 GGTGTGGTGG CGGGCACCTG TAATCCCAGC TACTCAGGAG GCTGAGGCAG GAGAATCACT301 TGAACCCAGG AGGCAGAGTT TGCAGTCAGC CAAGATCACG CCACTGTACT CCAGCCTGGA361 TGACACAGCG AGACTCCGTC TCAAAATAAA TAAATAAAAA TAAAGTCAGA ACACCTGGCT421 TAATAGGCCT CACTGTGCAG ATGAGGAAAC TGAGGCCCAG GGAGGAAGAG CGATCTGTGG481 AGATATTTCT AGAACCCCTG CAAGCTGACC CCAGTGAAGG AGAGAAGGTC CAGTAGGAGC541 TTGCTAAGCT CAAAATCGAA GAAAGGTTCA GCAAGACTGT CAGGGTGACC TCAAAGCAAT601 GGCAGCCATC AGAGGAGCCC CATTGCTATT AGGAGGCTCC TATTGCCCTC CCCTTCAGCC661 TCTGACTTTC ACCTGTGCTA CCCAATTCTG GTTCCTTCAC TCCCATTCAA AAATGGACCC721 CAGAAAAGCC TTATTTTGTG GAGTACCTAG TTCCCTTTTG GGTTTGTCTC TTGACTGCTA781 CGGGCATTGC CCCAGGGCAA CCATGACAGT GAAGATGACT GGCCAAGCTT GTGGACTGGC841 CAGCAAGCTT GGGCTGCCTG AGACGCTTTG AAATGGCTGC CTTCTGAGTT GGTCTTGAGG901 GTGAAGACTG ACCACCCTTC TCACCTGCAC AGTCACAGTC CCTCTCCTGC TGGCCTGACT961 GCAGCTGTCC TCCCAGCTGG CCACCTGACC AGAGACCAGG AGAGAGGCCA CAGCCTCCAG1021 ACCCTCCAGA GTCCCACGGA GGAAGAAGGC TTACCAGAGA GACCCTCTGA TGCATGAGCC1081 AGGCCCCAGC CCTTCTCCCT GCATCCAGGT GTGTTTCCAC CGCAAAATGC CTCCACACAA1141TGAGCGACTT TGGCCCTGCG TGGGTCAGCA TGTGGTCTGA GGTAACCCTC AAATGCCTCC1201ACCACACATC TGTCCACCTG CACGGGTTCA AGGTGAGCAC TTGCCCCCTT CTCTCCTCCA1261GACCAGTCGC CTGAAATTCT GAGCAACATT CCTTCAAGAC TATCATGTAA CCCTTGGTGA1321TGCTGAGTCC AGACAGGAAA TGCAGACTTG GGACCCACCT GTATCAGCAG AAAGAGGCCT1381TGTGCCCCGT TTGTCCGAGT CCCAGAACGG AGCAAATGAG AAAACCGGCG AGCTGTCCCC1441CGAGGAGCTG TAGGGAGATT GGTTTTTAGT ATAAATTACA ATAAAATTTT GTGTATGTGT1501ACAGCTGTGT TCACATCCAC AGTGTAAGCT GTGATATGGT TTGGATGTTT GTCCCCTCCA1561AATCTCATGT TGAAATGTGA TCCCCAGCAT TGGAGGTGGG GCCTGATGGG AGGTGATTGG1621GTGATGGGGG AAGTTGCCTC ATGAATGACT TGGTGCCCTC CTGGAAGTGA TGAGTGAGTT1681CTCGCTGAGC TCACTCAAGA TGTGGTTGTT TAAAAGAGTG TGGCACGTCC CTCCCCCAAC1741TCTCCCTCTC ACTCCCGCTC TCACCATGTG ACACACCTGC TCCCCCTTCA CCTTCCACCA1801TGATTGGAAG CTTCCTGAAG CCCTTACCAG AAGCAGATGC CAGCCCCACA CTTCCTGTAC1861CACCTGCAGA ACCATAAACC AAAATAAAGC TCTTTTCTTT ATCAATTAAAA AAAAAAAAAA1921AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAAA AAAAAAAAAA1981AAAAAAAB氨基酸序列(SEQ ID NO8) 长度90个氨基酸1 MAAIRGAPLL LGGSYCPPLQ PLTFTCATQF WFLHSHSKCMD PRKALFCGVP SSLLGLSLDC61 YGHCPRATMT VKMTGQACGL ASKLGLPETLC.核苷酸及氨基酸组合序列(SEQ ID NO9)克隆号PP7122起始编码子599 ATG终止编码子869 TGA蛋白质分子量9583.881G GTA CAT TTG CCC AGC TTC CCT GCC AGC CTT TAA CCC CAG GAA CCT 4647 CTC AGT CTA CCT CCT CTT TTC TGC CTC TGA ATC CCT ACC TTT AAA GTC 9495 AGA ACA GGC CAG GCC CGG TGG CTC ACG CCT GTA ATC CCA GCA CTT TGG 142143 GAG GCT GAG GTG GGT GGA TCA CTT GAC ATC AGT AGT TCA AGA CCA GCC 190191 TGG CCA ACA TGG TGA AAC CCC ATC CTT ACT AAA AAT ACA AAA ATT AGC 238239 CAG GTG TGG TGG CGG GCA CCT GTA ATC CCA GCT ACT CAG GAG GCT GAG 286287 GCA GGA GAA TCA CTT GAA CCC AGG AGG CAG AGT TTG CAG TCA GCC AAG 334335 ATC ACG CCA CTG TAC TCC AGC CTG GAT GAC ACA GCG AGA CTC CGT CTC 382383 AAA ATA AAT AAA TAA AAA TAA AGT CAG AAC ACC TGG CTT AAT AGG CCT 430431 CAC TGT GCA GAT GAG GAA ACT GAG GCC CAG GGA GGA AGA GCG ATC TGT 478479 GGA GAT ATT TCT AGA ACC CCT GCA AGC TGA CCC CAG TGA AGG AGA GAA 526527 GGT CCA GTA GGA GCT TGC TAA GCT CAA AAT CGA AGA AAG GTT CAG CAA 574575 GAC TGT CAG GGT GAC CTC AAA GCA ATG GCA GCC ATC AGA GGA GCC CCA 6221 Met Ala Ala Ile Arg Gly Ala Pro 8623 TTG CTA TTA GGA GGC TCC TAT TGC CCT CCC CTT CAG CCT CTG ACT TTC 6709 Leu Leu Leu Gly Gly Ser Tyr Cys Pro Pro Leu Gln Pro Leu Thr Phe 24671 ACC TGT GCT ACC CAA TTC TGG TTC CTT CAC TCC CAT TCA AAA ATG GAC 71825 Thr Cys Ala Thr Gln Phe Trp Phe Leu His Ser His Ser Lys Met Asp 40719 CCC AGA AAA GCC TTA TTT TGT GGA GTA CCT AGT TCC CTT TTG GGT TTG 76641 Pro Arg Lys Ala Leu Phe Cys Gly Val Pro Ser Ser Leu Leu Gly Leu 56767 TCT CTT GAC TGC TAC GGG CAT TGC CCC AGG GCA ACC ATG ACA GTG AAG 81457 Ser Leu Asp Cys Tyr Gly His Cys Pro Arg Ala Thr Met Thr Val Lys 72815 ATG ACT GGC CAA GCT TGT GGA CTG GCC AGC AAG CTT GGG CTG CCT GAG 86273 Met Thr Gly Gln Ala Cys Gly Leu Ala Ser Lys Leu Gly Leu Pro Glu 88863 ACG CTT TGA AAT GGC TGC CTT CTG AGT TGG TCT TGA GGG TGA AGA CTG 91089 Thr Leu *** 91911 ACC ACC CTT CTC ACC TGC ACA GTC ACA GTC CCT CTC CTG CTG GCC TGA 958959 CTG CAG CTG TCC TCC CAG CCG GCC ACC TGA CCA GAG ACC AGG AGA GAG10061007 GCC ACA GCC TCC AGA CCC TCC AGA GTC CCA CGG AGG AAG AAG GCT TAG10541055 CAG AGA GAC CCT CTG ATG CAT GAG CCA GGC CCC AGC CCT TCT CCC TGC11021103 ATC CAG GTG TGT TTC CAC CGC AAA ATG CCT CCA CAC AAT GAG CGA CTT11501151 TGG CCC TGC GTG GGT CAG CAT GTG GTC TGA GGT AAC CCT CAA ATG CCT11981199 CCA CCA CAC ATC TGT CCA CCT GCA CGG GTT CAA GGT GAG CAC TTG CCC12461247 CCT TCT CTC CTC CAG ACC AGT CGC CTG AAA TTC TGA GCA ACA TTC CTT12941295 CAA GAC TAT CAT GTA ACC CTT GGT GAT GCT GAG TCC AGA CAG GAA ATG13421343 CAG ACT TGG GAC CCA CCT GTA TCA GCA GAA AGA GGC CTT GTG CCC CGT13901391 TTG TCC GAG TCC CAG AAC GGA GCA AAT GAG AAA ACC GGC GAG CTG TCC14381439 CCC GAG GAG CTG TAG GGA GAT TGG TTT TTA GTA TAA ATT ACA ATA AAA14861487 TTT TGT GTA TGT GTA CAG CTG TGT TCA CAT CCA CAG TGT AAG CTG TGA15341535 TAT GGT TTG GAT GTT TGT CCC CTC CAA ATC TCA TGT TGA AAT GTG ATC15821583 CCC AGC ATT GGA GGT GGG GCC TGA TGG GAG GTG ATT GGG TGA TGG GGG16301631 AAG TTG CCT CAT GAA TGA CTT GGT GCC CTC CTG GAA GTG ATG AGT GAG16781679 TTC TCG CTG AGC TCA CTC AAG ATG TGG TTG TTT AAA AGA GTG TGG CAC17261727 GTC CCT CCC CCA ACT CTC CCT CTC ACT CCC GCT CTC ACC ATG TGA CAC17741775 ACC TGC TCC CCC TTC ACC TTC CAC CAT GAT TGG AAG CTT CCT GAA GCC18221823 CTT ACC AGA AGC AGA TGC CAG CCC CAC ACT TCC TGT ACC ACC TGC AGA18701871 ACC ATA AAC CAA AAT AAA GCT CTT TTC TTT ATC AAT TAA AAA AAA AAA19181919 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA19661967 AAA AAA AAA AAA AAA AAA AAA19874.PP7157A核苷酸序列(SEQ ID NO10)长度1017bp1 GCACGGACGC CGTCCCTCCT CGGCGCGGCC TGAGCGCCCG GCCCGACCCC GGCCATGGGG61 TGCTGCTACA GCAGCGAGAA CGAGGACTCG GACCAGGACC GAGAGGAGCG GAAGCTGCTG121 CTGGACCCTA GCAGCCCCCC TACCAAAGCT CTCAATGGAG CCGAGCCCAA CTACCACAGC181 CTGCCTTCCG CTCGCACTGA TGAGCAGGCC CTGCTCTCTT CCATCCTTGC CAGGACAGCC241 AGCAACATCA TTGATGTGTC TGCTGCAGAC TCACAGGGCA TGGAGCAGCA TGAGTACATG301 GACCGTGCCA GGCAGTACAG CACCCGCTTG GCTGTGCTGA GCAGCAGCCT GACCCATTGG361 AAGAAGCTGC CACCGCTGCC GTCTCTTACC AGCCAGCCCC ACCAAGTGCT GGCCAGTGAG421 CCCATCCCGT TCTCTGATTT GCAGCAGGTC TCCAGGATAG CTGCTTATGC CTACAGTGCA481 CTTTCTCAGA TCCGTGTGGA CGCAAAAGAG GAGCTGGTTG TACAGTTTGG GATCCCATGA541 AGAGAGGGGT CCTTGGACAG CTCTTCTCCT CTCTTCATCC CATCTCTACC CCACCCCCTT601 GGCCCCCAGC CTCACTGCGG CTTATACAGT ACCCTAACCT GCTACTAATC ACAGAGAAAA661 ATGTGAAGAA GGAGGAGAAG AGGAAGGCTA GAAGCCTGAG CAAGTGAGGG TAGAACCTTT721 TGGGACTGGC CTTTGAAGCT CTGGCCAGGG ATGGGGTTGG GGCCAAAAGG ACAGAGCCTG781 GTATGTCTTC ATAGTCATTG AGAATGTGGA GATACCAGTT TGGGTGGGGG GTGATCACCA841 GGGGACCTAG GGAGATCCCC TTCCCACCCT CTCTGTTGGC CTCAGAGTCA CTCCTGCCCC901 CCCTCCCTGA CTTGGTGCTC ACATGCACCC CACTAGGGTT TGTGACCAGG GTCTGGATGA961 GCTTGAATTT GAATGAATTG AGTTTGTATT TCTAGAAAAA AAAAAAAAAA AAAAAAAB氨基酸序列(SEQ ID NO11) 长度161个氨基酸1MGCCYSSENE DSDQDREERK LLLDPSSPPT KALNGAEPNY HSLPSARTDE QALLSSILAR61TASNIIDVSA ADSQGMEQHE YMDRARQYST RLAVLSSSLT HWKKLPPLPS LTSQPHQVLA121SEPIPFSDLQ QVSRIAAYAY SALSQIRVDA KEELVVQFGI PC.核苷酸及氨基酸组合序列(SEQ ID NO12)克隆号PP7157起始编码子55 ATG终止编码子538 TGA蛋白质分子量17771.811 GCA CGG ACG CCG TCC CTC CTC GGC GCG GCC TGA GCG CCC GGC CCG ACC 4849 CCG GCC ATG GGG TGC TGC TAC AGC AGC GAG AAC GAG GAC TCG GAC CAG 961 Met Gly Cys Cys Tyr Ser Ser Glu Asn Glu Asp Ser Asp Gln 1497 GAC CGA GAG GAG CGG AAG CTG CTG CTG GAC CCT AGC AGC CCC CCT ACC 14415 Asp Arg Glu Glu Arg Lys Leu Leu Leu Asp Pro Ser Ser Pro Pro Thr 30145 AAA GCT CTC AAT GGA GCC GAG CCC AAC TAC CAC AGC CTG CCT TCC GCT 19231 Lys Ala Leu Asn Gly Ala Glu Pro Asn Tyr His Ser Leu Pro Ser Ala 46193 CGC ACT GAT GAG CAG GCC CTG CTC TCT TCC ATC CTT GCC AGG ACA GCC 24047 Arg Thr Asp Glu Gln Ala Leu Leu Ser Ser Ile Leu Ala Arg Thr Ala 62241 AGC AAC ATC ATT GAT GTG TCT GCT GCA GAC TCA CAG GGC ATG GAG CAG 28863 Ser Asn Ile Ile Asp Val Ser Ala Ala Asp Ser Gln Gly Met Glu Gln 78289 CAT GAG TAC ATG GAC CGT GCC AGG CAG TAC AGC ACC CGC TTG GCT GTG 33679 His Glu Tyr Met Asp Arg Ala Arg Gln Tyr Ser Thr Arg Leu Ala Val 94337 CTG AGC AGC AGC CTG ACC CAT TGG AAG AAG CTG CCA CCG CTG CCG TCT 38495 Leu Ser Ser Ser Leu Thr His Trp Lys Lys Leu Pro Pro Leu Pro Ser 110385 CTT ACC AGC CAG CCC CAC CAA GTG CTG GCC AGT GAG CCC ATC CCG TTC 432111 Leu Thr Ser Gln Pro His Gln Val Leu Ala Ser Glu Pro Ile Pro Phe 126433 TCT GAT TTG CAG CAG GTC TCC AGG ATA GCT GCT TAT GCC TAC AGT GCA 480127 Ser Asp Leu Gln Gln Val Ser Arg Ile Ala Ala Tyr Ala Tyr Ser Ala 142481 CTT TCT CAG ATC CGT GTG GAC GCA AAA GAG GAG CTG GTT GTA CAG TTT 528143 Leu Ser Gln Ile Arg Val Asp Ala Lys Glu Glu Leu Val Val Gln Phe 158529 GGG ATC CCA TGA AGA GAG GGG TCC TTG GAC AGC TCT TCT CCT CTC TTC 576159 Gly Ile Pro *** 162577 ATC CCA TCT CTA CCC CAC CCC CTT GGC CCC CAG CCT CAC TGC GGC TTA 624625 TAC AGT ACC CTA ACC TGC TAC TAA TCA CAG AGA AAA ATG TGA AGA AGG 672673 AGG AGA AGA GGA AGG CTA GAA GCC TGA GCA AGT GAG GGT AGA ACC TTT 720721 TGG GAC TGG CCT TTG AAG CTC TGG CCA GGG ATG GGG TGG GGG CCA AAA 768769 GGA CAG AGC CTG GTA TGT CTT CAT AGT CAT TGA GAA TGT GGA GAT ACC 816817 AGT TTG GGT GGG GGG TGA TCA CCA GGG GAC CTA GGG AGA TCC CCT TCC 864865 CAC CCT CTC TGT TGG CCT CAG AGT CAC TCC TGC CCC CTC TCC CTG ACT 912913 TGG TGC TCA CAT GCA CCT CAC TAG GGT TTG TGA CCA GGG TCT GGA TGA 960961 GCT TGA ATT TGA ATG AAT TGA GTT TGT ATT TCT AGA AAA AAA AAA AAA10081009 AAA AAA AAA10175.PP7517A核苷酸序列(SEQ ID NO13)长度2712bp1 GTTCACGGCA ACAGCATCCA GCGCCTGGGG GAGGTGAATA AGCTGGCTGT CCTTCCTCGG61 CTCCGTAGCC TGACACTCCA TGGGAACCCC ATGGAGGAAG AGAAAGGGTA TAGCAGGCCC121 TGGACTCCCC GACCTGTCCT GTGCTCTGGT CCTCCAGCCC AGCCTCCGAG ACTGCCTGTC181 AGGGCTGCGG ATCGAGGAGC GGGCCTTCAG CTACGTGCTC ACCCATGCCC TGCCCGGTGA241 CCCTGGTCAC ATCCTCACCA CCCTGGACCA CTGGAGCAGC CGCTGCGAGT ACTTGAGCCA301 CATGGGGCCT GTCAAAGGTC AGATCCTGAT GCGGCTGGTG GAGGAGAAGC CCCTGCTTGT361 GTGCTGGAAT TGGGAACCTA CTGTGGATAC TCTACCCTGC TTATTGCCCG AGCCCTGCCC421 CCTGGGGGTC GCCTTCTTAC TGTGGAGCGG GACCCACGCA CGGCAGCAGT GGCTGAAAAA481 CTCATCCGCC TGGCCGGCTT TGATGAGCAC ATGGTGGAGC TCATCGTGGG CAGCTCAGAG541 GACGTGATCC CGTGCCTACG CACCCAGTAT CAGCTGAGTC GGGCAGACCT GGTGCTCCTG601 GCACACCGGC CACGATGTTA CCTGAGGGAC CTGCAGCTGC TGGAGGCCCA TGCCCTACTG661 CCAGCAGGTG CCACCGTGCT GGCTGACCAT GTGCTCTTCC CTGGTGCACC CCGCTTCTTG721 CAGTATGCTA AGAGCTGTGG CCGCTACCGC TGCCGCCTCC ACCACACTGG CCTTCCAGAC781 TTCCCTGCCA TCAAGGATGG AATAGCTCAG CTCACCTATG CTGGACCAGG CTGAGGTCCA841 GGCCCAGGGG TACTTACTGA TGCCCACCCC CACCCCCACC CAAGCAGGGA CCTCAAAATC901 CCCTCCCTTT CCTGTTTGGG GCCTTGACAC ACGCTGGGCT CAGGGCTAGG GAGTCTCTCT961 TCCCACCTCT GACCTCTTTC AGCCTCTACA CTGACCTCAA GTGTCAAGTT CTATCAGGCT1021 GCTTGGTCTC ACTAGGCCCC CTCTTTCCAG AGAGAACCAT GGACTGACAG CAAGAAGCCT1081 GAGCTCCCGA CCCAGCTCTG TCACTGATTT GCTGAGTGAC TCCAAGGGAA TCCCCACCTT1141 GCTCTGAGAT TTAATCTTCT CTCTTAACAC GAAGGAAGCT GGATGGGAGA GCTCCAGGGG1201 CCTCCCAGTT CTCGGCCTCA GAAAGCCTCC CATCCTCAGC CCATGCCATT CTGGGTGGGA1261 TCAGAGGAAG TGGCAATGAG TTAGACGCCC TGCAGGAATA GCTGGATGCA AGCTGGGCCA1321 GAGAAAATGG CACAGAACCC TGGACCCAGG GCCAGGGATG CCCTGGCCTT CCCTAACTCT1381 GGCCCACCTA GCCAATTAGG TGTGGCTGAT GTCCCTTGAG TGCCCTCTTC CTAAAGCCCA1441 AAAGAAGATG CTGGACTCCT CTGGGCCCCA CCAACAAATA GGGAATAGAC ATGGGTGGAA1501 AATCACTCCT TTGTCTTTAT TAAAGAAACT TAGACCAGAC CTGGCAATCA AGGGGTGAGG1561 TACTGGCCAG GAAGGTGGAG TAGGTTTCAG GCCCTGGGGA TTTCAAGTGC AGACTGATGG1621 CCTGGGAGGG GCCAAAGAGA CCAGATCCTG GCAGCAGCTG AGGAGGTGCC CAAGGGCACT1681 TTCAGGCACT GGGGCCATCA GCTGGTTCTG TGGGCAGGGG TTGGGGGTTG GGATGCAGGG1741 TAGTTTGGGC TGGCCTGGAA TCTCCCTGAG GCCACCCTGC CTTGTCTACC TAGATCATCC1801 ACTGGTCCTG ATCCTGTTCG TTGCCTTCCA TGTCCACCTG GAGAGGAGGC TGGGTGTGGG1861 TGGGGAGGGG CCTCAGCCAG CCTCAGCCCC AGATCCTGCC CCTGGCTGGA TCCAGGGTTT1921 CTGTACCCCT TGCCATCAAC TGGGTCAGGA GCAAGGGTCC AGGAACAGAG GCCCTCCCCC1981 ATACCCCTTG CCTACCTCAT TGACCTCTCC ATCATCCGGT GACTCATTGT AGTCATTCAT2041 CTCGTCCATG TCCTGCATAT CCTCATCATC CTCTGAGTCC TCTTTCACTA TCCTCATCGT2101 CTTCATCATC TTCTTCTTCC TCGTCATCAT AGTGCTGGTG GGCAGGACAG AGCCTGTAAG2161 CCCTACAGGC CTGCATGGAC CAGTTCAAGA ACTGACCCAC TTGAGCCTCT CTCTAGGGCC2221 AATGAATGAC CCCCTACCCC GACACTCCCT CCTTGAGTCT AGCAGGCTGG TGCATGTTCT2281 GCAGGACCTT AATGCTAGGC CCAATGCCCA CCCCTTCTAT CTCCCCTTTT AGGCTTTTAC2341 CCAGATCTGA GAACCACAAC TGCTCTGGGT CAGAGACAGG ACATTCAGAA TTAGAGCAGA2401 GCCTCGGTCC ACTGCGGCCC CCACACAGGC CCCACCTGCT AGAGCCACTC ACCTCTGAGG2461 CTGGCTTGCC AATAGGAACC AGGTTGTTGT CTTTCTCCGC GATGCTTTGG AGCTGTGGGC2521 AAAGGCACAG AGGAACAAGG CCAGAGCCCA AGTAGGGCAG GTCAGGGGCA TGGGACTGGC2581 CCATTCTGCC CAGAAGACAA CCCACACGTG TTGGGGAGAA GCTTCCTCCC AGTTCTCAGG2641 GAGATACAAT CCCTTTCTTG TCATCTGCCA TTTATGAACT TGATCCAAAT AAAAAAAAAA2701 AAAAAAAAAA AAB氨基酸序列(SEQ ID NO14)长度155个氨基酸1 MGTPWRKRKG IAGPGLPDLS CALVLQPSLR DCLSGLRIEE RAFSYVLTHA LPGDPGHILT61 TLDHWSSRCE YLSHMGPVKG QILMRLVEEK PLLVCWNWEP TVDTLPCLLP EPCPLGVAFL121 LWSGTHARQQ WLKNSSAWPA LMSTWWSSSW AAQRTC.核苷酸及氨基酸组合序列(SEQ ID NO15)克隆号 PP7517起始编码子80 ATG终止编码子545 TGA蛋白质分子量17413.271G TTC ACG GCA ACA GCA TCC AGC GCC TGG GGG AGG TGA ATA AGC TGG 4647 CTG TCC TTC CTC GGC TCC GTA GCC TGA CAC TCC ATG GGA ACC CCA TGG 941 Met Gly Thr Pro Trp 595 AGG AAG AGA AAG GGT ATA GCA GGC CCT GGA CTC CCC GAC CTG TCC TGT 1426 Arg Lys Arg Lys Gly Ile Ala Gly Pro Gly Leu Pro Asp Leu Ser Cys 21143 GCT CTG GTC CTC CAG CCC AGC CTC CGA GAC TGC CTG TCA GGG CTG CGG 19022 Ala Leu Val Leu Gln Pro Ser Leu Arg Asp Cys Leu Ser Gly Leu Arg 37191 ATC GAG GAG CGG GCC TTC AGC TAC GTG CTC ACC CAT GCC CTG CCC GGT 23838 Ile Glu Glu Arg Ala Phe Ser Tyr Val Leu Thr His Ala Leu Pro Gly 53239 GAC CCT GGT CAC ATC CTC ACC ACC CTG GAC CAC TGG AGC AGC CGC TGC 28654 Asp Pro Gly His Ile Leu Thr Thr Leu Asp His Trp Ser Ser Arg Cys 69287 GAG TAC TTG AGC CAC ATG GGG CCT GTC AAA GGT CAG ATC CTG ATG CGG 33470 Glu Tyr Leu Ser His Met Gly Pro Val Lys Gly Gln Ile Leu Met Arg 85335 CTG GTG GAG GAG AAG CCC CTG CTT GTG TGC TGG AAT TGG GAA CCT ACT 38286 Leu Val Glu Glu Lys Pro Leu Leu Val Cys Trp Asn Trp Glu Pro Thr 101383 GTG GAT ACT CTA CCC TGC TTA TTG CCC GAG CCC TGC CCC CTG GGG GTC 430102 Val Asp Thr Leu Pro Cys Leu Leu Pro Glu Pro Cys Pro Leu Gly Val 117431 GCC TTC TTA CTG TGG AGC GGG ACC CAC GCA CGG CAG CAG TGG CTG AAA 478118 Ala Phe Leu Leu Trp Ser Gly Thr His Ala Arg Gln Gln Trp Leu Lys 133479 AAC TCA TCC GCC TGG CCG GCT TTG ATG AGC ACA TGG TGG AGC TCA TCG 526134 Asn Ser Ser Ala Trp Pro Ala Leu Met Ser Thr Trp Trp Ser Ser Ser 149527 TGG GCA GCT CAG AGG ACG TGA TCC CGT GCC TAC GCA CCC AGT ATC AGC 574150 Trp Ala Ala Gln Arg Thr *** 156575 TGA GTC GGG CAG ACC TGG TGC TCC TGG CAC ACC GGC CAC GAT GTT ACC 622623 TGA GGG ACC TGC AGC TGC TGG AGG CCC ATG CCC TAC TGC CAG CAG GTG 670671 CCA CCG TGC TGG CTG ACC ATG TGC TCT TCC CTG GTG CAC CCC GCT TCT 718719 TGC AGT ATG CTA AGA GCT GTG GCC GCT ACC GCT GCC GCC TCC ACC ACA 766767 CTG GCC TTC CAG ACT TCC CTG CCA TCA AGG ATG GAA TAG CTC AGC TCA 814815 CCT ATG CTG GAC CAG GCT GAG GTC CAG GCC CAG GGG TAC TTA CTG ATG 862863 CCC ACC CCC ACC CCC ACC CAA GCA GGG ACC TCA AAA TCC CCT CCC TTT 910911 CCT GTT TGG GGC CTT GAC ACA CGC TGG GCT CAG GGC TAG GGA GTC TCT 958959 CTT CCC ACC TCT GAC CTC TTT CAG CCT CTA CAC TGA CCT CAA GTG TCA10061007 AGT TCT ATC AGG CTG CTT GGT CTC ACT AGG CCC CCT CTT TCC AGA GAG10541055 AAC CAT GGA CTG ACA GCA AGA AGC CTG AGC TCC CGA CCC AGC TCT GTC11021103 ACT GAT TTG CTG AGT GAC TCC AAG GGA ATC CCC ACC TTG CTC TGA GAT11501151 TTA ATC TTC TCT CTT AAC ACG AAG GAA GCT GGA TGG GAG AGC TCC AGG11981199 GGC CTC CCA GTT CTC GGC CTC AGA AAG CCT CCC ATC CTC AGC CCA TGC12461247 CAT TCT GGG TGG GAT CAG AGG AAG TGG CAA TGA GTT AGA CGC CCT GCA12941295 GGA ATA GCT GGA TGC AAG CTG GGC CAG AGA AAA TGG CAC AGA ACC CTG13421343 GAC CCA GGG CCA GGG ATG CCC TGG CCT TCC CTA ACT CTG GCC CAC CTA13901391GCC AAT TAG GTG TGG CTG ATG TCC CTT GAG TGC CCT CTT CCT AAA GCC14381439CAA AAG AAG ATG CTG GAC TCC TCT GGG CCC CAC CAA CAA ATA GGG AAT14861487AGA CAT GGG TGG AAA ATC ACT CCT TTG TCT TTA TTA AAG AAA CTT AGA15341535CCA GAC CTG GCA ATC AAG GGG TGA GGT ACT GGC CAG GAA GGT GGA GTA15821583GGT TTC AGG CCC TGG GGA TTT CAA GTG CAG ACT GAT GGC CTG GGA GGG16301631GCC AAA GAG ACC AGA TCC TGG CAG CAG CTG AGG AGG TGC CCA AGG GCA16781679CTT TCA GGC ACT GGG GCC ATC AGC TGG TTC TGT GGG CAG GGG TTG GGG17261727GTT GGG ATG CAG GGT AGT TTG GGC TGG CCT GGA ATC TCC CTG AGG CCA17741775CCC TGC CTT GTC TAC CTA GAT CAT CCA CTG GTC CTG ATC CTG TTC GTT18221823GCC TTC CAT GTC CAC CTG GAG AGG AGG CTG GGT GTG GGT GGG GAG GGG18701871CCT CAG CCA GCC TCA GCC CCA GAT CCT GCC CCT GGC TGG ATC CAG GGT19181919TTC TGT ACC CCT TGC CAT CAA CTG GGT CAG GAG CAA GGG TCC AGG AAC19661967AGA GGC CCT CCC CCA TAC CCC TTG CCT ACC TCA TTG ACC TCT CCA TCA20142015TCC GGT GAC TCA TTG TAG TCA TTC ATC TCG TCC ATG TCC TGC ATA TCC20622063TCA TCA TCC TCT GAG TCC TCT TTC ACT ATC CTC ATC GTC TTC ATC ATC21102111TTC TTC TTC CTC GTC ATC ATA GTG CTG GTG GGC AGG ACA GAG CCT GTA21582159AGC CCT ACA GGC CTG CAT GGA CCA GTT CAA GAA CTG ACC CAC TTG AGC22062207CTC TCT CTA GGG CCA ATG AAT GAC CCC CTA CCC CGA CAC TCC CTC CTT22542255GAG TCT AGC AGG CTG GTG CAT GTT CTG CAG GAC CTT AAT GCT AGG CCC23022303AAT GCC CAC CCC TTC TAT CTC CCC TTT TAG GCT TTT ACC CAG ATC TGA23502351GAA CCA CAA CTG CTC TGG GTC AGA GAC AGG ACA TTC AGA ATT AGA GCA23982399GAG CCT CGG TCC ACT GCG GCC CCC ACA CAG GCC CCA CCT GCT AGA GCC24462447ACT CAC CTC TGA GGC TGG CTT GCC AAT AGG AAC CAG GTT GTT GTC TTT24942495CTC CGC GAT GCT TTG GAG CTG TGG GCA AAG GCA CAG AGG AAC AAG GCC25422543AGA GCC CAA GTA GGG CAG GTC AGG GGC ATG GGA CTG GCC CAT TCT GCC25902591CAG AAG ACA ACC CAC ACG TGT TGG GGA GAA GCT TCC TCC CAG TTC TCA26382639GGG AGA TAC AAT CCC TTT CTT GTC ATC TGC CAT TTA TGA ACT TGA TCC26862687AAA TAA AAA AAA AAA AAA AAA AAA AA27126.PP7283A核苷酸序列(SEQ ID NO16)长度1937bp1 GGGAGTGGAG AACTGGAGTC ATATTTCTGG GTTTTATGGC AGGGTTTGGG GAAGCCTCTC61 AGAGGAGGAG GAGCTGGAGA CAGGAGGGTG GGAGCAGGAC AGAGAAACTT TTGTTTCTGA121 GGCTTCCACG TTGGGGTGTT GTTTTTTGAG CCCCGGCACT TACCAAACCC AAATCACCCA181 CAGGGCTTAG ACGGCACAAA GGCTCCTGGG ACTCTGGGCA GAGTCAGGGA CAGTCACACC241 CCTCCCCGTC TCTATAGCGG AGGTACTCAG AGGGTCTGTG CTTGGGAGGC TGAGCGAGTC301 CTGGAGAGCA TGGAGGTAGG GGCCTGTGTT CACATCCTGC CCCGGTCAAA GTAGGCCCAC361 ACTCAAAGGC CTCTCTCTCA GCAGAGATCT TCCAGAGTGT CAGCCTCCAG CAAGTTCCCT421 AACCTCTCCC AACACAGCCT TCACCAGCAC ATGGGCCGAG ACTCTCCCCA CGGGGCTGTG481 GCTCAACATA GAAAAACCTT GGTGCACGAT GGCAGCAGCA GGTCTCACAA GAGCCGGCTT541 TCTCAGAACA CACTGCCTCT GCCCAGGTGT CCTGCAGTGG AGGCTCAGAC TGGCCCCACT601 GGTGACCCCT TGGGGAGCAG GGACAGGTCC ATTCTGCTCA CTCCTGAGCT GGGCAGTTCC661 CTCTTGGGAT AAGGTCGCAC AGCACAGGCC ACCATCATAC CACCCCAGCC AGAGAAGTGG721 GAGAGACAAG GAGGCTCCCT ACCCCAGAGG CAGTGCTCCT CAGGAAGGGC ATTCACTGCG781 TTATATAGAT ATATACACAC ACACACACAC ACACACATAT ATATACACAT ATATACACAT841 ATATGTATAC ACACATATAT ACACACACAC ATATATACAC ACACACATAT GTATATACAC901 ACACATATAT ATATAGATAT ACACACACAT ATATTTTTTG TTTGTTTGTT TGTTTGTTTG961 CGATGGAGTC TCACTCCAGC CTGGCCGACA GAGCAAGACT CCGTCTCAAA AAAAAAAAAG1021 ATTGCAGTGA GCCACGATAG CACCACTGCA TTCCAGACTG GGTGACAGGG CAAGGCCGTC1081 TCTCAAAGAA AAAAAGAAAC AAAGATTTCC ATTCTGGCAG TCCACCCCTT TTGTTTCCCC1141 CATTATTAAC TTTACTTCTC CCTCATTATT AGTTTTTACT TTATTTAAAT GTGTGTATCT1201 GCTCCCATCT AACCTAACAC GACTCTCTCT CTAGCAAAAA TATTTGCAAT CTGCAGTCCC1261 TTCCCCAAAG AGGGATCCAC CCAAGCCTCG TATTGTTGTG TCCACCTCCA AGTTCAGGAT1321 CTTTTGGTGA TAGATCTTCT CTAGTGAAAA TGTCTTCAAA CATAGCAAGA GGCTTTAAAT1381 ACTGGGTATC CAAAAAATGA TAGGGGTCCT AAAACCAGAT CCAGTTACCT ACCTATCATC1441 CAAGACCTCG CTTGAGTCCT TTTGGGTGCT CCCAACATTA GTGTCGTAAA ACTAAATACA1501 GGTGATGTGA GCAGTTGTTC ACTGATGATT CTAATGCTCT CTTGGAATTC ATTGTTTCTC1561 TGTTAGGGTG TTTCATAGTC TTTGTGGCAA AAATAGCATT GCATCATTAA AAGTATGTTA1621 CTGTCTGGGC GTGGTGGCTG AAGCCTGTAA TCCCAGCACT TTGGGAGGCC GAGGTGGGTG1681 GATCACGAGC TCAGGAGATC GAGACCATCC TGGCTAACAC GGTGAAACCC TGTCTCTACT1741 AAAAATACAA AAAATTAGCC GGGCGTGGTG GTGGGCACCT GTAGTCCCAG CTACTCAGGA1801 GGTTGAGGCA GGAGAATGGC GTGAACCTGG GAGGCGGAGC TGGCAGTGAG CCAAGATCGC1861 ACCATTGCAC TCCAGCCTGG GCAACACAGT GAGACTCCGT CTCAAAAAAA AAAAAAAAAA1921 AAAAAAAAAA AAAAAAAB氨基酸序列(SEQ ID NO17) 长度135个氨基酸1 MAAAGLTRAG FLRTHCLCPG VLQWRLRLAP LVTPWGAGTG PFCSLLSWAV PSWDKVAQHR61 PPSYHPSQRS GRDKEAPYPR GSAPQEGHSL RYIDIYTHTH THTYIYTYIH IYVYTHIYTH121 TYIHTHICIY THIYIC.核苷酸及氨基酸组合序列(SEQ ID NO18)克隆号 PP7683起始编码子509 ATG终止编码子914 TAG蛋白质分子量15559.001G GGA GTG GAG AAC TGG AGT CAT ATT TCT GGG TTT TAT GGC AGG GTT 4647 TGG GGA AGC CTC TCA GAG GAG GAG GAG CTG GAG ACA GGA GGG TGG GAG 9495 CAG GAC AGA GAA ACT TTT GTT TCT GAG GCT TCC ACG TTG GGG TGT TGT 142143 TTT TTG AGC CCC GGC ACT TAC CAA ACC CAA ATC ACC CAC AGG GCT TAG 190191 ACG GCA CAA AGG CTC CTG GGA CTC TGG GCA GAG TCA GGG ACA GTC ACA 238239 CCC CTC CCC GTC TCT ATA GCG GAG GTA CTC AGA GGG TCT GTG CTT GGG 286287 AGG CTG AGC GAG TCC TGG AGA GCA TGG AGG TAG GGG CCT GTG TTC ACA 334335 TCC TGC CCC GGT CAA AGT AGG CCC ACA CTC AAA GGC CTC TCT CTC AGC 382383 AGA GAT CTT CCA GAG TGT CAG CCT CCA GCA AGT TCC CTA ACC TCT CCC 430431 AAC ACA GCC TTC ACC AGC ACA TGG GCC GAG ACT CTC CCC ACG GGG CTG 478479 TGG CTC AAC ATA GAA AAA CCT TGG TGC ACG ATG GCA GCA GCA GGT CTC 5261 Met Ala Ala Ala Gly Leu 6527 ACA AGA GCC GGC TTT CTC AGA ACA CAC TGC CTC TGC CCA GGT GTC CTG 5747 Thr Arg Ala Gly Phe Leu Arg Thr His Cys Leu Cys Pro Gly Val Leu 22575 CAG TGG AGG CTC AGA CTG GCC CCA CTG GTG ACC CCT TGG GGA GCA GGG 62223 Gln Trp Arg Leu Arg Leu Ala Pro Leu Val Thr Pro Trp Gly Ala Gly 38623 ACA GGT CCA TTC TGC TCA CTC CTG AGC TGG GCA GTT CCC TCT TGG GAT 67039 Thr Gly Pro Phe Cys Ser Leu Leu Ser Trp Ala Val Pro Ser Trp Asp 54671 AAG GTC GCA CAG CAC AGG CCA CCA TCA TAC CAC CCC AGC CAG AGA AGT 71855 Lys Val Ala Gln His Arg Pro Pro Ser Tyr His Pro Ser Gln Arg Ser 70719 GGG AGA GAC AAG GAG GCT CCC TAC CCC AGA GGC AGT GCT CCT CAG GAA 76671 Gly Arg Asp Lys Glu Ala Pro Tyr Pro Arg Gly Ser Ala Pro Gln Glu 86767 GGG CAT TCA CTG CGT TAT ATA GAT ATA TAC ACA CAC ACA CAC ACA CAC 81487 Gly His Ser Leu Arg Tyr Ile Asp Ile Tyr Thr His Thr His Thr His 102815 ACA TAT ATA TAC ACA TAT ATA CAC ATA TAT GTA TAC ACA CAT ATA TAC 862103 Thr Tyr Ile Tyr Thr Tyr Ile His Ile Tyr Val Tyr Thr His Ile Tyr 118863 ACA CAC ACA TAT ATA CAC ACA CAC ATA TGT ATA TAC ACA CAC ATA TAT 910119 Thr His Thr Tyr Ile His Thr His Ile Cys Ile Tyr Thr His Ile Tyr 134911 ATA TAG ATA TAC ACA CAC ATA TAT TTT TTG TTT GTT TGT TTG TTT GTT 958135 Ile *** 136959 TGC GAT GGA GTC TCA CTC CAG CCT GGC CGA CAG AGC AAG ACT CCG TCT10061007 CAA AAA AAA AAA AGA TTG CAG TGA GCC ACG ATA GCA CCA CTG CAT TCC10541055 AGA CTG GGT GAC AGG GCA AGG CCG TCT CTC AAA GAA AAA AAG AAA CAA11021103 AGA TTT CCA TTC TGG CAG TCC ACC CCT TTT GTT TCC CCC ATT ATT AAC11501151 TTT ACT TCT CCC TCA TTA TTA GTT TTT ACT TTA TTT AAA TGT GTG TAT11981199 CTG CTC CCA TCT AAC CTA ACA CGA CTC TCT CTC TAG CAA AAA TAT TTG12461247 CAA TCT GCA GTC CCT TCC CCA AAG AGG GAT CCA CCC AAG CCT CGT ATT12941295 GTT GTG TCC ACC TCC AAG TTC AGG ATC TTT TGG TGA TAG ATC TTC TCT13421343 AGT GAA AAT GTC TTC AAA CAT AGC AAG AGG CTT TAA ATA CTG GGT ATC13901391 CAA AAA ATG ATA GGG GTC CTA AAA CCA GAT CCA GTT ACC TAC CTA TCA14381439 TCC AAG ACC TCG CTT GAG TCC TTT TGG GTG CTC CCA ACA TTA GTG TCG14861487 TAA AAC TAA ATA CAG GTG ATG TGA GCA GTT GTT CAC TGA TGA TTC TAA15341535 TGC TCT CTT GGA ATT CAT TGT TTC TCT GTT AGG GTG TTT CAT AGT CTT15821583 TGT GGC AAA AAT AGC ATT GCA TCA TTA AAA GTA TGT TAC TGT CTG GGC16301631 GTG GTG GCT GAA GCC TGT AAT CCC AGC ACT TTG GGA GGC CGA GGT GGG16781679 TGG ATC ACG AGC TCA GGA GAT CGA GAC CAT CCT GGC TAA CAC GGT GAA17261727 ACC CTG TCT CTA CTA AAA ATA CAA AAA ATT AGC CGG GCG TGG TGG TGG17741775 GCA CCT GTA GTC CCA GCT ACT CAG GAG GTT GAG GCA GGA GAA TGG CGT18221823 GAA CCT GGG AGG CGG AGC TGG CAG TGA GCC AAG ATC GCA CCA TTG CAC18701871 TCC AGC CTG GGC AAC ACA GTG AGA CTC CGT CTC AAA AAA AAA AAA AAA19181919 AAA AAA AAA AAA AAA AAA A 19377.PP7879A核苷酸序列(SEQ ID NO19)长度1545bp1 GGTGGAAGAG AGTATGTGTA TGTGTGTTCC TGTACATAGC ATGGGTGCAG CTGTGGATGT61 GTGCAAAAGA GTGTGAGTGT GTGTGTGTGT GTGTGTGTGT AAAGGGGTCT GTCCTAGAGC121 CCACATCAGT TTGTTGTGAA TCTGGAAAAA GGGTCGGTGA GGGCCGGGAG ATGTTGACCC181 TGGTGGGAGC AGGCTGAGGC TGCCCCGTTC TCCACATCCT CTGGTTTGCC CAGTCTCTGA241 TTCCATTAGG GGGAGTGTGC TGAAGCCATT CTCGGATGCT TCCCAGACCA GGCTCCCTCT301 GCCAGAGTCA CATGCATCCG AGCTGCTGGT CTCCATTGTC CAGCAGGAAG GCGGAAAGGC361 AGGCAAGATG GTGTGAAGCT TAAAGCTTGT ATTTGATGGA AAAGGTCTCC CCTGTTCATC421 TGAGAGGCCA AGCCTGGCCA CCCCAGGCTC AGAACCTGGG CTTCAAGAAA TGTGCTGGGA481 GCTCCTAACT TACACATCCC TCCAGCCTTC CTTGAATCCT CCCACCACCC CCTATTTTCC541 TTTAATTTCT CAGGTCTGCT CCCTCCTCCC CCAACCCCAC AGCTGGGCAA GAAGTCTGCA601 AAAGCTGCAT CTGCAGCTGT CTCTAACTCT TCCCAGCCAT CTCCCGTATT TTTTGGTACC661 TTGATTCCTT GACTCTTAAT AAGCCAAGCC ACCTTATCTC TGTAGTTCTT ATTTTTTTGT721 TGACTAAATT TGGGGGGTTC TTTTTTATGG TCATGTCACT GACCTATTAA ATTGGGGCTT781 GGTGCTTTTC CACCTTCCCC CTCTGAATGA AAGCCAAGGA ATGGGGGAAG AGCGGGAACT841 CTGCCACGGA GGTGGAGCAA GAACGGTGAA GGGCCCTGGT CCCAGAGAGG CTGGTGGGTC901 CCTCTCCCAA AGGAAGGCAG ACAGTCTCTG CTTTGCCTTG GACCTTGGTG CTTGGGGGTG961 GGGAGGCCCT GGGGGGGACA CTCCCCACTC CCATTCCCCT TCCTTTGTCC TAATCCTGGA1021 ATTAAGTACA GGGGTTTATA GGTTCTATTT CTTCCCAAGA GCCCTGCAAA GAACCCCAGT1081 TTCCTATTTG GATGCCCCTA CACTGTTGTG TTTCAGTGGA ATGTATTTTC ATTTAAAAAC1141 AACTTTGAAT GGGGCACTTT TTCTTTCCTG TTTTAAAAAT TGAAAAATTC TTACAGTACA1201AACAGGACTG TCAGGGTGGG GGTGTTGGTG CTGTAAGAGG TCACTCTTGA GTGCATTTTG1261GCACTGGGAT GGGATGGCTG GGGTGGGAAG ACCCCCATCC CCACCCCCAA CTTCTTTTCT1321AATATTTAAG GAGTGTTTTG TAGGATTCAA CAACCACCAC AACTTGAATT TGTATCATGG1381GAGGTGGGAG GGAGTGGCTT AGAGGTGTCT GCCTATGCTT AAAGCCAACT GTGGAAGTTT1441TGTTTTCCCT TTTTTGTATA ATAAAGTGAA AAACAAAGGT TTAAAAAAAA AAAAAAAAAA1501AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAB氨基酸序列(SEQ ID NO20) 长度120个氨基酸1 MGEERELCHG GGARTVKGPG PRFAGGSLSQ RKADSLCFAL DLGAWGWGGP GGDTPHSHSP61 SFVLILELST GVYRFYFFPR ALQRTPVSYL DAPTLLCFSG MYFHLKTTLN GALFLSCFKNC.核苷酸及氨基酸组合序列(SEQ ID NO21)克隆号 PP7879起始编码子821 ATG终止编码子1181 TGA蛋白质分子量13001.161 G GTG GAA GAG AGT ATG TGT ATG TGT GTT CCT GTA CAT AGC ATG GGT 4647 GCA GCT GTG GAT GTG TGC AAA AGA GTG TGA GTG TGT GTG TGT GTG TGT 9495 GTG TGT AAA GGG GTC TGT CCT AGA GCC CAC ATC AGT TTG TTG TGA ATC 142143 TGG AAA AAG GGT CGG TGA GGG CCG GGA GAT GTT GAC CCT GGT GGG AGC 190191 AGG CTG AGG CTG CCC CGT TCT CCA CAT CCT CTG GTT TGC CCA GTC TCT 238239 GAT TCC ATT AGG GGG AGT GTG CTG AAG CCA TTC TCG GAT GCT TCC CAG 286287 ACC AGG CTC CCT CTG CCA GAG TCA CAT GCA TCC GAG CTG CTG GTC TCC 334335 ATT GTC CAG CAG GAA GGC GGA AAG GCA GGC AAG ATG GTG TGA AGC TTA 382383 AAG CTT GTA TTT GAT GGA AAA GGT CTC CCC TGT TCA TCT GAG AGG CCA 430431 AGC CTG GCC ACC CCA GGC TCA GAA CCT GGG CTT CAA GAA ATG TGC TGG 478479 GAG CTC CTA ACT TAC ACA TCC CTC CAG CCT TCC TTG AAT CCT CCC ACC 526527 ACC CCC TAT TTT CCT TTA ATT TCT CAG GTC TGC TCC CTC CTC CCC CAA 574575 CCC CAC AGC TGG GCA AGA AGT CTG CAA AAG CTG CAT CTG CAG CTG TCT 622623 CTA ACT CTT CCC AGC CAT CTC CCG TAT TTT TTG GTA CCT TGA TTC CTT 670671 GAC TCT TAA TAA GCC AAG CCA CCT TAT CTC TGT AGT TCT TAT TTT TTT 718719 GTT GAC TAA ATT TGG GGG GTT CTT TTT TAT GGT CAT GTC ACT GAC CTA 766767 TTA AAT TGG GGC TTG GTG CTT TTC CAC CTT CCC CCT CTG AAT GAA AGC 814815 CAA GGA ATG GGG GAA GAG CGG GAA CTC TGC CAC GGA GGT GGA GCA AGA 8621 Met Gly Glu Glu Arg Glu Leu Cys His Gly Gly Gly Ala Arg 14863 ACG GTG AAG GGC CCT GGT CCC AGA GAG GCT GGT GGG TCC CTC TCC CAA 91015 Thr Val Lys Gly Pro Gly Pro Arg Glu Ala Gly Gly Ser Leu Ser Gln 30911 AGG AAG GCA GAC AGT CTC TGC TTT GCC TTG GAC CTT GGT GCT TGG GGG 95831 Arg Lys Ala Asp Ser Leu Cys Phe Ala Leu Asp Leu Gly Ala Trp Gly 46959 TGG GGA GGC CCT GGG GGG GAC ACT CCC CAC TCC CAT TCC CCT TCC TTT100647 Trp Gly Gly Pro Gly Gly Asp Thr Pro His Ser His Ser Pro Ser Phe 621007 GTC CTA ATC CTG GAA TTA AGT ACA GGG GTT TAT AGG TTC TAT TTC TTC105463 Val Leu Ile Leu Glu Leu Ser Thr Gly Val Tyr Arg Phe Tyr Phe Phe 781055 CCA AGA GCC CTG CAA AGA ACC CCA GTT TCC TAT TTG GAT GCC CCT ACA110279 Pro Arg Ala Leu Gln Arg Thr Pro Val Ser Tyr Leu Asp Ala Pro Thr 941103 CTG TTG TGT TTC AGT GGA ATG TAT TTT CAT TTA AAA ACA ACT TTG AAT115095 Leu Leu Cys Phe Ser Gly Met Tyr Phe His Leu Lys Thr Thr Leu Asn 1101151 GGG GCA CTT TTT CTT TCC TGT TTT AAA AAT TGA AAA ATT CTT ACA GTA1198111 Gly Ala Leu Phe Leu Ser Cys Phe Lys Asn *** 1211199 CAA ACA GGA CTG TCA GGG TGG GGG TGT TGG TGC TGT AAG AGG TCA CTC12461247 TTG AGT GCA TTT TGG CAC TGG GAT GGG ATG GCT GGG GTG GGA AGA CCC12941295 CCA TCC CCA CCC CCA ACT TCT TTT CTA ATA TTT AAG GAG TGT TTT GTA13421343 GGA TTC AAC AAC CAC CAC AAC TTG AAT TTG TAT CAT GGG AGG TGG GAG13901391 GGA GTG GCT TAG AGG TGT CTG CCT ATG CTT AAA GCC AAC TGT GGA AGT14381439 TTT GTT TTC CCT TTT TTG TAT AAT AAA GTG AAA AAC AAA GGT TTA AAA14861487 AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA AAA15341535 AAA AAA AAA AA 15458.PP8376A核苷酸序列(SEQ ID NO22)长度1841bp1GTCTGATTGG GTGGTGTGGC GCAATGCGCG CGACCCTCAA GATACCAAAC TGTACGCATC61TCTGACCCTT TCCTCTCCTT GCTCCTGCTG GTAAACCGAA GCCCAGGAGA CTTCCAGGTT121TGGGCATCTG CAGAGGGCGA GGAACTGGTC ACGGCGCCGG GTGGGCTTGC AGCTGTGACG181CTTATGTGGA CACCTCAGTG TCGCTGGTGG TTCACCTCGG CTTCCCAGTT TATTTATTGA241CGTCAACAAA TAAATGTTGA ATAAGGAAGA AGAGTTAGAA TTGCTTGAAG CCCTCTGGAG301TTTTAGCACT AGTCCCGCCC ACTCCCTTCT ACTTCCAGGT CGGGGGGGGG CGGGTCCAAT361AGAAAGGCGG AAGCCAGTGT CCCAGGCGTT CTCACGCCCG CAACAATTCC TGAGTAGGGC421CTTGCTTGAG TTCTTCGGAA AGTCTCATCC ACCCCCACAT CGCCTCTTTA GGAAGTCACT481TAATGTTGGG CTTCATTATT CCCACATCCC TTTCCTTACT ACTTGCCTGC ACTTCTTGAG541AAAAAGACTG CAGAAAGGAG AGGTGGGGCT TTCAGTAGAA ACAAGCAAAC CGCAGGTCCC601TGTGGGGGGA CTCTCCAGGA AGAAGGTTCC GCAAGAACCG TGGGCGACAG TTATGGAGAA661GCGTCTGCAG GAGGCTCAGC TGTACAAGGA GGAAGGGAAC CAGCGCTACC GGGAAGGGAA721GTACCGAGAT GCTGTGAGTA GGTACCATCG AGCTCTGCTT CAGCTGCGGG GTCTGGATCC781GAGTCTGCCC TCTCCGTTAC CTAATCTCGG ACCTCAGGGC CCGGCCCTCA CGCCTGAACA841AGAAAACATA TTGCATACCA CCCAGACAGA CTGCTATAAC AATCTAGCTG TTGTGAAATA901GGGAGTGTTT CCCTTCTTAA TCATAAAAAG GCAGAACATT GACCTGAATT GCCTGAATTG961ACTCCTCTGC AGCTTGTCTC CTTCAGATGG AGCCCGTGAA CTACGAACGA GTGAGAGAAT1021ATAGTCAGAA AGTCCTGGAA CGACAGCCTG ATAATGCCAA GGCCTTGTAT CGGGCCGGAG1081TGGCCTTTTT CCATCTGCAG GACTATGACC AGGCCCGCCA CTACCTCCTG GCTGCCGTGA1141ATAGGCAGCC TAAAGGTAAG CAAGAAGGGC TTTGAAATGG TAAAGACAAA ATTGTCTTGC1201TGGGGTGGAT CTGTGGAAAG GGGGTTTTAT TTTACTTTGC CAATGTATTA TTTTCAATAA1261GTAATACATT CACATGGTTG AGAATTCGAA CTGAAAAAGT ATACGATGAA CAGACCTTTT1321TCCACTCTTG TGTTCTTGTC TCCACAGAAA AGCAGTATTA TTAGTTTCAT GTGTAGGGGG1381TTGATGCTTA ATCAGACATA CACAATATAT ATGTTGGTAT GTCTGTTTCA TATATGTATG1441TATGCCTATT CTAATATATA AATATATGTA TATCAACGTG CTTTTATTTA TAAATATACA1501GTGTATATAT TTATACATAT ACATGAATAT ATATATAAAA TAGGCAGGCC AGGTGGGGTG1561GCTCACATCT GTTATCTCAG CACTTTGGGA GACCAAAGTG GGTGGATCAC CTGAGGTCAG1621GAGTTTGAGA CCAGCCTGAC CAACATGGAG AAACCCCATC TCTACTAAAA ATACAAAATT1681AGCCAGGCAT GGTGGCGCAT GCCTGTAAAC CCAGCTACTC GGGAGGCTGA GGCAGGAGAA1741TTGCTTGAAC CCAGGAGGCG GAGGTTGCGG TGAGCCGAGA TCCTGGGCAA CAAGAACGAG1801ATTCTGTCTC CAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AB氨基酸序列(SEQ ID NO23) 长度215个氨基酸1MLNKEEELEL LEALWSFSTS PAHSLLLPGR GGAGPIERRK PVSQAFSRPQ QFLSRALLEF61FGKSHPPPHR LFRKSLNVGL HYSHIPFLTT CLHFLRKRLQ KGEVGLSVET SKPQVPVGGL121SRKKVPQEPW ATVMEKRLQE AQLYKEEGNQ RYREGKYRDA VSRYHRALLQ LRGLDPSLPS181PLPNLGPQGP ALTPEQENIL HTTQTDCYNN LAVVKC.核苷酸及氨基酸组合序列(SEQ ID NO24)克隆号PP8376起始编码子254 ATG终止编码子899 TAG蛋白质分子量24371.771G TCT GAT TGG GTG GTG TGG CGC AAT GCG CGC GAC CCT CAA GAT ACC 4647 AAA CTG TAC GCA TCT CTG ACC CTT TCC TCT CCT TGC TCC TGC TGG TAA 9495 ACC GAA GCC CAG GAG ACT TCC AGG TTT GGG CAT CTG CAG AGG GCG AGG 142143 AAC TGG TCA CGG CGC CGG GTG GGC TTG CAG CTG TGA CGC TTA TGT GGA 190191 CAC CTC AGT GTC GCT GGT GGT TCA CCT CGG CTT CCC AGT TTA TTT ATT 238239 GAC GTC AAC AAA TAA ATG TTG AAT AAG GAA GAA GAG TTA GAA TTG CTT 2861 Met Leu Asn Lys Glu Glu Glu Leu Glu Leu Leu 11287 GAA GCC CTC TGG AGT TTT AGC ACT AGT CCC GCC CAC TCC CTT CTA CTT 33412 Glu Ala Leu Trp Ser Phe Ser Thr Ser Pro Ala His Ser Leu Leu Leu 27335 CCA GGT CGG GGG GGG GCG GGT CCA ATA GAA AGG CGG AAG CCA GTG TCC 38228 Pro Gly Arg Gly Gly Ala Gly Pro Ile Glu Arg Arg Lys Pro Val Ser 43383 CAG GCG TTC TCA CGC CCG CAA CAA TTC CTG AGT AGG GCC TTG CTT GAG 43044 Gln Ala Phe Ser Arg Pro Gln Gln Phe Leu Ser Arg Ala Leu Leu Glu 59431 TTC TTC GGA AAG TCT CAT CCA CCC CCA CAT CGC CTC TTT AGG AAG TCA 47860 Phe Phe Gly Lys Ser His Pro Pro Pro His Arg Leu Phe Arg Lys Ser 75479 CTT AAT GTT GGG CTT CAT TAT TCC CAC ATC CCT TTC CTT ACT ACT TGC 52676 Leu Asn Val Gly Leu His Tyr Ser His Ile Pro Phe Leu Thr Thr Cys 91527 CTG CAC TTC TTG AGA AAA AGA CTG CAG AAA GGA GAG GTG GGG CTT TCA 57492 Leu His Phe Leu Arg Lys Arg Leu Gln Lys Gly Glu Val Gly Leu Ser 107575 GTA GAA ACA AGC AAA CCG CAG GTC CCT GTG GGG GGA CTC TCC AGG AAG 622108 Val Glu Thr Ser Lys Pro Gln Val Pro Val Gly Gly Leu Ser Arg Lys 123623 AAG GTT CCG CAA GAA CCG TGG GCG ACA GTT ATG GAG AAG CGT CTG CAG 670124 Lys Val Pro Gln Glu Pro Trp Ala Thr Val Met Glu Lys Arg Leu Gln 139671 GAG GCT CAG CTG TAC AAG GAG GAA GGG AAC CAG CGC TAC CGG GAA GGG 718140 Glu Ala Gln Leu Tyr Lys Glu Glu Gly Asn Gln Arg Tyr Arg Glu Gly 155719 AAG TAC CGA GAT GCT GTG AGT AGG TAC CAT CGA GCT CTG CTT CAG CTG 766156 Lys Tyr Arg Asp Ala Val Ser Arg Tyr His Arg Ala Leu Leu Gln Leu 171767 CGG GGT CTG GAT CCG AGT CTG CCC TCT CCG TTA CCT AAT CTC GGA CCT 814172 Arg Gly Leu Asp Pro Ser Leu Pro Ser Pro Leu Pro Asn Leu Gly Pro 187815 CAG GGC CCG GCC CTC ACG CCT GAA CAA GAA AAC ATA TTG CAT ACC ACC 862188 Gln Gly Pro Ala Leu Thr Pro Glu Gln Glu Asn Ile Leu His Thr Thr 203863 CAG ACA GAC TGC TAT AAC AAT CTA GCT GTT GTG AAA TAG GGA GTG TTT 910204 Gln Thr Asp Cys Tyr Asn Asn Leu Ala Val Val Lys *** 216911 CCC TTC TTA ATC ATA AAA AGG CAG AAC ATT GAC CTG AAT TGC CTG AAT 958959 TGA CTC CTC TGC AGC TTG TCT CCT TCA GAT GGA GCC CGT GAA CTA CGA10061007ACG AGT GAG AGA ATA TAG TCA GAA AGT CCT GGA ACG ACA GCC TGA TAA10541055TGC CAA GGC CTT GTA TCG GGC CGG AGT GGC CTT TTT CCA TCT GCA GGA11021103CTA TGA CCA GGC CCG CCA CTA CCT CCT GGC TGC CGT GAA TAG GCA GCC11501151TAA AGG TAA GCA AGA AGG GCT TTG AAA TGG TAA AGA CAA AAT TGT CTT11981199GCT GGG GTG GAT CTG TGG AAA GGG GGT TTT ATT TTA CTT TGC CAA TGT12461247ATT ATT TTC AAT AAG TAA TAC ATT CAC ATG GTT GAG AAT TCG AAC TGA12941295AAA AGT ATA CGA TGA ACA GAC CTT TTT CCA CTC TTG TGT TCT TGT CTC13421343CAC AGA AAA GCA GTA TTA TTA GTT TCA TGT GTA GGG GGT TGA TGC TTA13901391ATC AGA CAT ACA CAA TAT ATA TGT TGG TAT GTC TGT TTC ATA TAT GTA14381439TGT ATG CCT ATT CTA ATA TAT AAA TAT ATG TAT ATC AAC GTG CTT TTA14861487TTT ATA AAT ATA CAG TGT ATA TAT TTA TAC ATA TAC ATG AAT ATA TAT15341535ATA AAA TAG GCA GGC CAG GTG GGG TGG CTC ACA TCT GTT ATC TCA GCA15821583CTT TGG GAG ACC AAA GTG GGT GGA TCA CCT GAG GTC AGG AGT TTG AGA16301631CCA GCC TGA CCA ACA TGG AGA AAC CCC ATC TCT ACT AAA AAT ACA AAA16781679TTA GCC AGG CAT GGT GGC GCA TGC CTG TAA ACC CAG CTA CTC GGG AGG17261727CTG AGG CAG GAG AAT TGC TTG AAC CCA GGA GGC GGA GGT TGC GGT GAG17741775CCG AGA TCC TGG GCA ACA AGA ACG AGA TTC TGT CTC CAA AAA AAA AAA18221823AAA AAA AAA AAA AAA AAA A 18419.PP10029A核苷酸序列(SEQ ID NO25)长度1738bp1GGGTGGGTGC CTGATGAGCG GTGCTTCCCT CATATGATAT GTGGGCACCC TGAAGCTCTC61ACGTAATGGT TCTGCTGTGC CGGGTTGTGA CCCAGCTGTC CTTGGTAGGC TCTCCTGTTT121AATGAGCAAC TGCTATATGC CAGGCCCTGT TCTAGAAACA GATGAGGCCC CTGTTCCCAT181GGAACTTAGA TCTGAGTATG TGGACAGAGT GAGTAGGTTG CCAGATAATG TCAGAGGTAA241GAAAAAAGCC AGGCAGAGGA CAGCAGTGCT GGTTTAGACA AGGGTTGGCA AGGCCTCCCT301GATAAGGGGA CGTATTTGCG CAGACACGGA AGCAGTCTGA TGGAAGGCTT GCCCTGTAGG361GACCTGGGGT GCAGACTGAG CTGGGAGGGC TCTTGGCTTG CTCCAATGAG GTAGGGGCGA421AGAGAGGGCA GAATGGCCCC CGTGCTGGTC CAGATGTGGC CAGCGCCAGA TCGTATAGAG481CCGTGGAGGC ACGGTAAGGA CTTGGGGTTT GAGGGAGATG AGGGCCCTGA GCAGGGGTGC541CATGATCTAG CCTCTGCTCC AGAAGGATCT GTCTGGCTGC CATGTGGGGG ACACGGAGTG601GAGCAAAGAC GGGAGCCCAG TGAGAGTCGA GGGAGAGGTG ACCTCAGCTT GGGCTGCGGT661GCAGGCCATG GGACTGGCAG GAGGTGGCTG GGGTTACGCT GTCTTTTCTA ACATTCAGCA721TTGGCTCAGG GGCCAGGTCA GGGCTCACAG ACTGTTGCTA TAAAGGGCTG GGTGGCTTTC781TTCCCCACAG CTACTCAGCC TAATGCCATT GCAGAGCACA TGTAGCCATG GACAACACAA841GGGGCGTATC CGTGTTCCAG GACAGCCATA TTGACAGGAA TAGGCAGGAG GCCAGATTTG901GTCCTCAGGC TGTAATTTCT TGGCCCCTTG TCTAGGGAGA GGTAAACGAG GGGAGGAGAG961ATCAGTCAAG GATGACGTGA GGGTTTGCTG GGAGCACCAG GAATCCTGGA GAAGGTAGTG1021GCAAGAGGGT GCAGCAAGCT CAGCTGGGCG GGGATCAAGT CTGAGGACTT AATGTCTCCT1081CTGATCTCCA GACCCATAAG GGAGATGCTG AGTAGACAAC TGGGGCTTAT GGGTCTGGAG1141TTCAGAGGAG AGATCGGGAA GGTGTCCATT TGGAGTCATC CACGCAGAGA TGTGTGAAGG1201CTGCTCAATG ATTTTGAGGT TTAAAGAAAA AAAGAGATGT GAAACCAGGG GCCCTGATGA1261GGCTGCCCAG GTGGTAAGGA AGACAGAAGA GAAGCCATGG GACAGCTGAG CCCGGGCACC1321CTCAAGCCTT GGAGGCATGA AGTTTGGTGG GGATCTGGCA AAGAACACCT GGGAGCAGCC1381AGCGGGCAGC AGACCCCAGA GTAGCAGGGA AGACAAGCAC TTCAAAGAGG CAGCGTCAGC1441CAGGGGCAGT GGCTCAGCTG TAATCCTAGC ACTTTGGGAG GCCAAGGATG GCAGATCACC1501TGAGGTTAGG GGTTCGAGAC TAGCCTGGCC AACATGGTGA AACCCTGTCT CTACTAAAAA1561TAAAAAATTA GCCAGGCATT GGTGGTATGT GCCTGTAATC CCAGCTACTC GAGAGGCTGA1621GGCAGGAGAA TCTCTTGAAC CCGGGAGGCA GAGGTTGCAG TGAGCCGAGA TCATGCCATT1681GCACTCCAGC CTGGGCAACA AGAGCGAAAC TCCGTCTCAA AAAAAAAAAA AAAAAAAAB氨基酸序列(SEQ ID NO26) 长度92个氨基酸1 MAPVLVQMWP APDRIEPWRH GKDLGFEGDE GPEQGCHDLA SAPEGSVWLP CGGHGVEQRR61 EPSESRGRGD LSLGCGAGHG TGRRWLGLRC LFC.核苷酸及氨基酸组合序列(SEQ ID NO27)克隆号PP10029起始编码子433 ATG终止编码子709 TAA蛋白质分子量9973.671 GGG TGG GTG CCT GAT GAG CGG TGC TTC CCT CAT ATG ATA TGT GGG CAC 4849 CCT GAA GCT CTC ACG TAA TGG TTC TGC TGT GCC GGG TTG TGA CCC AGC 9697 TGT CCT TGG TAG GCT CTC CTG TTT AAT GAG CAA CTG CTA TAT GCC AGG 144145 CCC TGT TCT AGA AAC AGA TGA GGC CCC TGT TCC CAT GGA ACT TAG ATC 192193 TGA GTA TGT GGA CAG AGT GAG TAG GTT GCC AGA TAA TGT CAG AGG TAA 240241 GAA AAA AGC CAG GCA GAG GAC AGC AGT GCT GGT TTA GAC AAG GGT TGG 288289 CAA GGC CTC CCT GAT AAG GGG ACG TAT TTG CGC AGA CAC GGA AGC AGT 336337 CTG ATG GAA GGC TTG CCC TGT AGG GAC CTG GGG TGC AGA CTG AGC TGG 384385 GAG GGC TCT TGG CTT GCT CCA ATG AGG TAG GGG CGA AGA GAG GGC AGA 432433 ATG GCC CCC GTG CTG GTC CAG ATG TGG CCA GCG CCA GAT CGT ATA GAG 4801 Met Ala Pro Val Leu Val Gln Met Trp Pro Ala Pro Asp Arg Ile Glu 16481 CCG TGG AGG CAC GGT AAG GAC TTG GGG TTT GAG GGA GAT GAG GGC CCT 52817 Pro Trp Arg His Gly Lys Asp Leu Gly Phe Glu Gly Asp Glu Gly Pro 32529 GAG CAG GGG TGC CAT GAT CTA GCC TCT GCT CCA GAA GGA TCT GTC TGG 57633 Glu Gln Gly Cys His Asp Leu Ala Ser Ala Pro Glu Gly Ser Val Trp 48577 CTG CCA TGT GGG GGA CAC GGA GTG GAG CAA AGA CGG GAG CCC AGT GAG 62449 Leu Pro Cys Gly Gly His Gly Val Glu Gln Arg Arg Glu Pro Ser Glu 64625 AGT CGA GGG AGA GGT GAC CTC AGC TTG GGC TGC GGT GCA GGC CAT GGG 67265 Ser Arg Gly Arg Gly Asp Leu Ser Leu Gly Cys Gly Ala Gly His Gly 80673 ACT GGC AGG AGG TGG CTG GGG TTA CGC TGT CTT TTC TAA CAT TCA GCA 72081 Thr Gly Arg Arg Trp Leu Gly Leu Arg Cys Leu Phe *** 93721 TTG GCT CAG GGG CCA GGT CAG GGC TCA CAG ACT GTT GCT ATA AAG GGC 768769 TGG GTG GCT TTC TTC CCC ACA GCT ACT CAG CCT AAT GCC ATT GCA GAG 816817 CAC ATG TAG CCA TGG ACA ACA CAA GGG GCG TAT CCG TGT TCC AGG ACA 864865 GCC ATA TTG ACA GGA ATA GGC AGG AGG CCA GAT TTG GTC CTC AGG CTG 912913 TAA TTT CTT GGC CCC TTG TCT AGG GAG AGG TAA ACG AGG GGA GGA GAG 960961 ATC AGT CAA GGA TGA CGT GAG GGT TTG CTG GGA GCA CCA GGA ATC CTG10081009 GAG AAG GTA GTG GCA AGA GGG TGC AGC AAG CTC AGC TGG GCG GGG ATC10561057 AAG TCT GAG GAC TTA ATG TCT CCT CTG ATC TCC AGA CCC ATA AGG GAG11041105 ATG CTG AGT AGA CAA CTG GGG CTT ATG GGT CTG GAG TTC AGA GGA GAG11521153 ATC GGG AAG GTG TCC ATT TGG AGT CAT CCA CGC AGA GAT GTG TGA AGG12001201 CTG CTC AAT GAT TTT GAG GTT TAA AGA AAA AAA GAG ATG TGA AAC CAG12481249 GGG CCC TGA TGA GGC TGC CCA GGT GGT AAG GAA GAC AGA AGA GAA GCC12961297 ATG GGA CAG CTG AGC CCG GGC ACC CTC AAG CCT TGG AGG CAT GAA GTT13441345 TGG TGG GGA TCT GGC AAA GAA CAC CTG GGA GCA GCC AGC GGG CAG CAG13921393 ACC CCA GAG TAG CAG GGA AGA CAA GCA CTT CAA AGA GGC AGC GTC AGC14401441 CAG GGG CAG TGG CTC AGC TGT AAT CCT AGC ACT TTG GGA GGC CAA GGA14881489 TGG CAG ATC ACC TGA GGT TAG GGG TTC GAG ACT AGC CTG GCC AAC ATG15361537 GTG AAA CCC TGT CTC TAC TAA AAA TAA AAA ATT AGC CAG GCA TTG GTG15841585 GTA TGT GCC TGT AAT CCC AGC TAC TCG AGA GGC TGA GGC AGG AGA ATC16321633 TCT TGA ACC CGG GAG GCA GAG GTT GCA GTG AGC CGA GAT CAT GCC ATT16801681 GCA CTC CAG CCT GGG CAA CAA GAG CGA AAC TCC GTC TCA AAA AAA AAA 17281729 AAA AAA AAA A 173810.SP2114bA核苷酸序列(SEQ ID NO28)长度1980bp1CTCTTCTTCC CAAAGTCCTG GTCAGTTCCC CAGAAAGGAC CAGTCATGGC TGTGCAGGGT61GACTGCCCTC CCCCAGGTCA GCCCTGTCGA CAAAGGCAGG GGCTTGGTTG TCATTTCCAC121CAAGTGGGAA GACAGTATTA ATAGATGGAG AACCCTCTGC AGTGGGAAGA TTTCAGCAAT181GGGCAAGCTG GATAGAGCCG TGGTTAGGAT GGAGTTGTTT GCTTGTTGCA CTTGGAGCTC241TTTATGAAGC AAGGGCTCTG CCTCCCAGCC TGAGACCCAG ACCCTGGTTT GGACCCAGTA301GAACTCTTGT GGGCCCTGGG TTGGTGTCTC TGAGCAAATC CCCAAAGCAG GAGAGTCCCT361AGCACCGTGA GCTCTGTCAG AACCTCCCAG CTGGCCTTCC TTCTGCCCTC ATTGACAACC421CTCTGACCCT CTTGCTGAGC ATAGACACAT ATGTGATGTT ACAGGAGCCA GTGACCTTCC481AGGATGTGGC TGTGGACTTC AGCCGGGAGG AGTGGGGGCT GCTGGGCCCG ACACAGAGGA541CCGAGTACCG CGATGTGATG CTGGAGACCT TTGGGCACCT GGTCTCTGTG GGGTGGGAGA601CTACACTGGA AAATAAAGAG TTAGCTCCAA ATTCTGACAT TCCTGAGGAA GAACCAGCCC661CCAGCCTGAA AGTACAAGAA TCCTCAAGGG ATTGTGCCTT GTCCTCTACA TTAGAAGATA721CCTTGCAGGG TGGGGTCCAG GAAGTCCAAG ACACAGTGTT GAAGCAGATG GAGTCTGCTC781AGGAAAAAGA CCTTCCTCAG AAGAAGCACT TTGACAACCG TGAGTCCCAG GCAAACAGTG841GTGCTCTTGA CACAAACCAA GTTTCGCTCC AGAAAATTGA CAACCCTGAG TCCCAGGCAA901ACAGTGGCGC TCTTGACACA AACCAAGTTT TGCTCCACAA AATTCCTCCT AGAAAACGAT961TGCGCAAACG TGACTCACAA GTTAAAAGTA TGAAACATAA TTCACGTGTA AAAATTCATC1021AGAAGAGCTG TGAAAGGCAA AAGGCCAAGG AAGGCAATGG TTGTAGGAAA ACCTTCAGTC1081GGAGTACTAA ACAGATTACG TTTATAAGAA TTCACAAGGG GAGCCAAGTT TGCCGATGCA1141GTGAATGTGG TAAAATATTC CGGAACCCAA GATACTTTTC TGTGCATAAG AAAATCCATA1201CCGGAGAGAG GCCCTATGTG TGTCAAGACT GTGGGAAAGG ATTTGTTCAG AGCTCTTCCC1261TCACACAGCA TCAGAGAGTT CATTCTGGAG AGAGACCATT TGAATGTCAG GAGTGTGGGA1321GGACCTTCAA TGATCGCTCA GCCATCTCCC AGCACCTGAG GACTCACACT GGCGCTAAGC1381CCTACAAGTG TCAGGACTGT GGAAAAGCCT TCCGCCAGAG TTCCCACCTC ATCAGACATC1441AGAGGACTCA CACCGGGGAG CGCCCATATG CATGCAACAA ATGTGGAAAG GCCTTCACCC1501AGAGCTCACA CCTTATTGGG CACCAGAGAA CCCACAATAG GACAAAGCGA AAGAAGAAAC1561AGCCTACCTC ATAGCTCTCA AGCCAGTTGA AGAAACCTTG CCTTTTCAGC TTGACCCTGC1621AATATAACAT GCACAGGCCT GCTTGTGAAT CAGGACTGAA TGTGAAAGGG AAGTATTGAG1681TGAGGACATT CCCAAAACCA AAGGACAACT GAGGAGACTG CCCAGCACAT AATGAATAAA1741TAAGAAAATG AGTGAGGAGT TATTAACATC ATTTGGAAAA AAGATTTCCC ATTCACTTGA1801TATTGTTTGT TCACTCATTT AGTCATTAAA AGTGAGATTA ATAAAATCTG AAAATGTTAT1861ATAATAACTT TAAAAAGCCA GGTAATTAAT AATCTGCACT GATATTACAT CCACAGTACC1921ACAGTATTTA TGTGTATGAA TTAAGGATTA AAAGATAATG TGGATAAAAA AAAAAAAAAAB氨基酸序列(SEQ ID NO29)长度372个氨基酸1MLQEPVTFQD VAVDFSREEW GLLGPTQRTE YRDVMLETFG HLVSVGWETT LENKELAPNS61DIPEEEPAPS LKVQESSRDC ALSSTLEDTL QGGVQEVQDT VLKQMESAQE KDLPQKKHFD121NRESQANSGA LDTNQVSLQK IDNPESQANS GALDTNQVLL HKIPPRKRLR KRDSQVKSMK181HNSRVKIHQK SCERQKAKEG NGCRKTFSRS TKQITFIRIH KGSQVCRCSE CGKIFRNPRY241FSVHKKIHTG ERPYVCQDCG KGFVQSSSLT QHQRVHSGER PFECQECGRT FNDRSAISQH301LRTHTGAKPY KCQDCGKAFR QSSHLIRHQR THTGERPYAC NKCGKAFTQS SHLIGHQRTH361NRTKRKKKQP TSC.核苷酸及氨基酸组合序列(SEQ ID NO30)克隆号 SP2114b起始编码子456 ATG终止编码子1572 TAG蛋白质分子量42445.771 CT CTT CTT CCC AAA GTC CTG GTC AGT TCC CCA GAA AGG ACC AGT CAT 4748 GGC TGT GCA GGG TGA CTG CCC TCC CCC AGG TCA GCC CTG TCG ACA AAG 9596 GCA GGG GCT TGG TTG TCA TTT CCA CCA AGT GGG AAG ACA GTA TTA ATA 143144 GAT GGA GAA CCC TCT GCA GTG GGA AGA TTT CAG CAA TGG GCA AGC TGG 191192 ATA GAG CCG TGG TTA GGA TGG AGT TGT TTG CTT GTT GCA CTT GGA GCT 239240 CTT TAT GAA GCA AGG GCT CTG CCT CCC AGC CTG AGA CCC AGA CCC TGG 287288 TTT GGA CCC AGT AGA ACT CTT GTG GGC CCT GGG TTG GTG TCT CTG AGC 335336 AAA TCC CCA AAG CAG GAG AGT CCC TAG CAC CGT GAG CTC TGT CAG AAC 383384 CTC CCA GCT GGC CTT CCT TCT GCC CTC ATT GAC AAC CCT CTG ACC CTC 431432 TTG CTG AGC ATA GAC ACA TAT GTG ATG TTA CAG GAG CCA GTG ACC TTC 4791 Met Leu Gln Glu Pro Val Thr Phe 8480 CAG GAT GTG GCT GTG GAC TTC AGC CGG GAG GAG TGG GGG CTG CTG GGC 5279 Gln Asp Val Ala Val Asp Phe Ser Arg Glu Glu Trp Gly Leu Leu Gly 24528 CCG ACA CAG AGG ACC GAG TAC CGC GAT GTG ATG CTG GAG ACC TTT GGG 57525 Pro Thr Gln Arg Thr Glu Tyr Arg Asp Val Met Leu Glu Thr Phe Gly 40576 CAC CTG GTC TCT GTG GGG TGG GAG ACT ACA CTG GAA AAT AAA GAG TTA 62341 His Leu Val Ser Val Gly Trp Glu Thr Thr Leu Glu Asn Lys Glu Leu 56624 GCT CCA AAT TCT GAC ATT CCT GAG GAA GAA CCA GCC CCC AGC CTG AAA 67157 Ala Pro Asn Ser Asp Ile Pro Glu Glu Glu Pro Ala Pro Ser Leu Lys 72672 GTA CAA GAA TCC TCA AGG GAT TGT GCC TTG TCC TCT ACA TTA GAA GAT 71973 Val Gln Glu Ser Ser Arg Asp Cys Ala Leu Ser Ser Thr Leu Glu Asp 88720 ACC TTG CAG GGT GGG GTC CAG GAA GTC CAA GAC ACA GTG TTG AAG CAG 76789 Thr Leu Gln Gly Gly Val Gln Glu Val Gln Asp Thr Val Leu Lys Gln 104768 ATG GAG TCT GCT CAG GAA AAA GAC CTT CCT CAG AAG AAG CAC TTT GAC 815105 Met Glu Ser Ala Gln Glu Lys Asp Leu Pro Gln Lys Lys His Phe Asp 120816 AAC CGT GAG TCC CAG GCA AAC AGT GGT GCT CTT GAC ACA AAC CAA GTT 863121 Asn Arg Glu Ser Gln Ala Asn Ser Gly Ala Leu Asp Thr Asn Gln Val 136864 TCG CTC CAG AAA ATT GAC AAC CCT GAG TCC CAG GCA AAC AGT GGC GCT 911137 Ser Leu Gln Lys Ile Asp Asn Pro Glu Ser Gln Ala Asn Ser Gly Ala 152912 CTT GAC ACA AAC CAA GTT TTG CTC CAC AAA ATT CCT CCT AGA AAA CGA 959153 Leu Asp Thr Asn Gln Val Leu Leu His Lys Ile Pro Pro Arg Lys Arg 168960 TTG CGC AAA CGT GAC TCA CAA GTT AAA AGT ATG AAA CAT AAT TCA CGT1007169 Leu Arg Lys Arg Asp Ser Gln Val Lys Ser Met Lys His Asn Ser Arg 1841008 GTA AAA ATT CAT CAG AAG AGC TGT GAA AGG CAA AAG GCC AAG GAA GGC1055185 Val Lys Ile His Gln Lys Ser Cys Glu Arg Gln Lys Ala Lys Glu Gly 2001056 AAT GGT TGT AGG AAA ACC TTC AGT CGG AGT ACT AAA CAG ATT ACG TTT1103201 Asn Gly Cys Arg Lys Thr Phe Ser Arg Ser Thr Lys Gln Ile Thr Phe 2161104 ATA AGA ATT CAC AAG GGG AGC CAA GTT TGC CGA TGC AGT GAA TGT GGT1151217 Ile Arg Ile His Lys Gly Ser Gln Val Cys Arg Cys Ser Glu Cys Gly 2321152 AAA ATA TTC CGG AAC CCA AGA TAC TTT TCT GTG CAT AAG AAA ATC CAT1199233 Lys Ile Phe Arg Asn Pro Arg Tyr Phe Ser Val His Lys Lys Ile His 2481200 ACC GGA GAG AGG CCC TAT GTG TGT CAA GAC TGT GGG AAA GGA TTT GTT1247249 Thr Gly Glu Arg Pro Tyr Val Cys Gln Asp Cys Gly Lys Gly Phe Val 2641248 CAG AGC TCT TCC CTC ACA CAG CAT CAG AGA GTT CAT TCT GGA GAG AGA1295265 Gln Ser Ser Ser Leu Thr Gln His Gln Arg Val His Ser Gly Glu Arg 2801296 CCA TTT GAA TGT CAG GAG TGT GGG AGG ACC TTC AAT GAT CGC TCA GCC1343281 Pro Phe Glu Cys Gln Glu Cys Gly Arg Thr Phe Asn Asp Arg Ser Ala 2961344 ATC TCC CAG CAC CTG AGG ACT CAC ACT GGC GCT AAG CCC TAC AAG TGT1391297 Ile Ser Gln His Leu Arg Thr His Thr Gly Ala Lys Pro Tyr Lys Cys 3121392 CAG GAC TGT GGA AAA GCC TTC CGC CAG AGT TCC CAC CTC ATC AGA CAT1439313 Gln Asp Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Ile Arg His 3281440 CAG AGG ACT CAC ACC GGG GAG CGC CCA TAT GCA TGC AAC AAA TGT GGA1487329 Gln Arg Thr His Thr Gly Glu Arg Pro Tyr Ala Cys Asn Lys Cys Gly 3441488 AAG GCC TTC ACC CAG AGC TCA CAC CTT ATT GGG CAC CAG AGA ACC CAC1535345 Lys Ala Phe Thr Gln Ser Ser His Leu Ile Gly His Gln Arg Thr His 3601536 AAT AGG ACA AAG CGA AAG AAG AAA CAG CCT ACC TCA TAG CTC TCA AGC1583361 Asn Arg Thr Lys Arg Lys Lys Lys Gln Pro Thr Ser *** 3731584 CAG TTG AAG AAA CCT TGC CTT TTC AGC TTG ACC CTG CAA TAT AAC ATG16311632 CAC AGG CCT GCT TGT GAA TCA GGA CTG AAT GTG AAA GGG AAG TAT TGA16791680 GTG AGG ACA TTC CCA AAA CCA AAG GAC AAC TGA GGA GAC TGC CCA GCA17271728 CAT AAT GAA TAA ATA AGA AAA TGA GTG AGG AGT TAT TAA CAT CAT TTG17751776 GAA AAA AGA TTT CCC ATT CAC TTG ATA TTG TTT GTT CAC TCA TTT AGT18231824 CAT TAA AAG TGA GAT TAA TAA AAT CTG AAA ATG TTA TAT AAT AAC TTT18711872 AAA AAG CCA GGT AAT TAA TAA TCT GCA CTG ATA TTA CAT CCA CAG TAC19191920 CAC AGT ATT TAT GTG TAT GAA TTA AGG ATT AAA AGA TAA TGT GGA TAA19671968 AAA AAA AAA AAA A 1980在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
权利要求
1.一种分离的具有促进癌细胞生长功能的人蛋白,其特征在于,它包含具有选自下组的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ IDNO29;或其保守性变异多肽、或其活性片段、或其活性衍生物。
2.如权利要求1所述的多肽,其特征在于,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ ID NO14、SEQID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。
3.一种分离的多核苷酸,其特征在于,它包含一核苷酸序列,该核苷酸序列与选自下组的一种核苷酸序列有至少85%相同性(a)编码如权利要求1和2所述多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸。
4.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO2、SEQ ID NO5、SEQ ID NO8、SEQ ID NO11、SEQ IDNO14、SEQ ID NO17、SEQ ID NO20、SEQ ID NO23、SEQ ID NO26、SEQ ID NO29。
5.如权利要求3所述的多核苷酸,其特征在于,该多核苷酸的序列选自下组SEQ ID NO3、SEQ ID NO6、SEQ ID NO9、SEQ ID NO12、SEQ ID NO15、SEQID NO18、SEQ ID NO21、SEQ ID NO24、SEQ ID NO27、SEQ ID NO30的编码区序列或全长序列。
6.一种载体,其特征在于,它含有权利要求3所述的多核苷酸。
7.一种遗传工程化的宿主细胞,其特征在于,它是选自下组的一种宿主细胞(a)用权利要求6所述的载体转化或转导的宿主细胞;(b)用权利要求3所述的多核苷酸转化或转导的宿主细胞。
8.一种具有促进癌细胞生长功能的人蛋白活性的多肽的制备方法,其特征在于,该方法包含(a)在适合表达具有促进癌细胞生长功能的人蛋白的条件下,培养权利要求7所述的宿主细胞;(b)从培养物中分离出具有促进癌细胞生长功能的人蛋白活性的多肽。
9.一种能与权利要求1所述的具有促进癌细胞生长功能的人蛋白特异性结合的抗体。
10.一种核酸分子,它含有权利要求3所述的多核苷酸中连续的10-800个核苷酸。
全文摘要
本发明公开了一类新的具有促进癌细胞生长功能的人蛋白,编码此多肽的多核苷酸和经重组技术产生该多肽的方法。本发明还公开了此多肽用于治疗多种疾病如癌症等的方法。本发明还公开了抗此多肽的拮抗剂及其治疗作用。本发明还公开了编码这类新的具有促进癌细胞生长功能的人蛋白的多核苷酸的用途。
文档编号C12P21/00GK1351082SQ0012710
公开日2002年5月29日 申请日期2000年10月31日 优先权日2000年10月31日
发明者顾健人 申请人:上海市肿瘤研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1