人源肿瘤细胞生长相关蛋白及其剪接异构体与编码基因的制作方法

文档序号:441962阅读:280来源:国知局
专利名称:人源肿瘤细胞生长相关蛋白及其剪接异构体与编码基因的制作方法
技术领域
本发明涉及一种人源肿瘤细胞生长相关蛋白及其剪接异构体与它们的编码基因。
背景技术
恶性肿瘤是人类的主要致死疾病之一,肿瘤发生与细胞的增殖失控、分化受阻及其凋亡异常直接相关。肿瘤细胞常常表达一系列胚性抗原、胚性基因和早期发育相关基因,这些基因在早期胚胎发育过程中启动表达而在正常成体组织(或细胞)中被抑制表达。4-6月孕龄的人胎肝是造血、免疫系统和肝脏干/祖细胞的主要来源,表达的基因极为丰富且具有其独特性。
Gasdermin结构域为GSDMDC蛋白家族所特有的。目前,人类中共发现16种蛋白含有该结构域。小鼠Gasdermin基因定位于小鼠11号染色体,其mRNA在表皮和上消化道组织中特异性表达。人类Gasdermin基因定位于人17q21.1,通过Northernblot检测其mRNA在正常胃组织细胞中表达,但在人胃癌组织中检测不到其表达,表明Gasdermin的表达缺失是胃癌致癌过程中的必要事件,该基因具有逆转细胞恶性转化的活力。含有Gasdermin结构域的DFNA5蛋白与黑色素细胞瘤获得性抵抗依托泊甙(etoposide)有关,DFNA5 mRNA表达水平增高可降低黑色素瘤MeWo ETO 1细胞系对etoposide的耐药性,即促进化疗药物杀死肿瘤细胞。暴露于etoposide的黑色素瘤MeWo ETO 1细胞系如被DFNA5稳定转染可导致caspase-3介导的细胞凋亡事件增加,暗示含有Gasdermin结构域的DFNA5具有一定抑癌功能。DFNA5基因又称ICERE-1(雌激素受体表达负相关-1)基因,在雌激素受体呈阳性的乳腺癌细胞中不表达或微量表达,而在雌激素受体呈阴性的乳腺癌细胞中高表达,表明该基因可能与激素无反应型乳腺癌的肿瘤生物学特异性有关。Gasdermin结构域的精确功能尚不了解,但其与肿瘤细胞生长相关,具有抑制肿瘤细胞生长的功能。

发明内容
本发明的目的是提供一种人源肿瘤细胞生长相关蛋白及其剪接异构体与它们的编码基因。
本发明所提供的人源肿瘤细胞生长相关蛋白,名称为GSDMDC1,来源于人属人(Homo sapiens),是具有下述氨基酸残基序列之一的蛋白质
1)序列表中的SEQ ID №1;2)将序列表中SEQ ID №1的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质。
人源肿瘤细胞生长相关蛋白具有三种剪接异构体,分别为剪接异构体(GSDMDC2),是具有序列表中SEQ ID №2的氨基酸残基序列的蛋白质或将序列表中SEQ ID №2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质;剪接异构体(GSDMDC3),是具有序列表中SEQ ID №3的氨基酸残基序列的蛋白质或将序列表中SEQ ID №3的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质;剪接异构体(GSDMDC4),是具有序列表中SEQ ID №4的氨基酸残基序列的蛋白质或将序列表中SEQ ID №4的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质。
所述一个或几个氨基酸残基的取代和/或缺失和/或添加是指不多于十个氨基酸残基的取代和/或缺失和/或添加。
序列表中的SEQ ID №1由403个氨基酸残基组成,自氨基端(N端)第4-374位氨基酸残基为Gasdermin结构域;序列表中的SEQ ID №2由203个氨基酸残基组成,自氨基端第4-200位氨基酸残基为Gasdermin结构域;序列表中的SEQ ID№3由200个氨基酸残基组成,自氨基端第4-200位氨基酸残基为Gasdermin结构域;序列表中的SEQ ID №4由183个氨基酸残基组成。
人源肿瘤细胞生长相关蛋白的编码基因包括人源肿瘤细胞生长相关蛋白的cDNA基因和人源肿瘤细胞生长相关蛋白的基因组基因。其基因组基因,是下述核苷酸序列之一1)序列表中SEQ ID №9的DNA序列;2)编码序列表中SEQ ID №1蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №9限定的DNA序列杂交的核苷酸序列。
序列表中的SEQ ID №9由12944个碱基组成,具有9个外显子和8个内含子,自5′端的第225-458位碱基为该基因组基因的第一个外显子,自5′端的第5043-5216位碱基为该基因组基因的第二个外显子,自5′端的第7618-7785位碱基为该基因组基因的第三个外显子,自5′端的第8499-8582位碱基为该基因组基因的第四个外显子,自5′端的第10553-10582位碱基为该基因组基因的第五个外显子,自5′端的第11272-11430位碱基为该基因组基因的第六个外显子,自5′端的第11556-11693位碱基为该基因组基因的第七个外显子,自5′端的第12044-12115位碱基为该基因组基因的第八个外显子,自5′端的第12577-12729位碱基为该基因组基因的第九个外显子,自5′端的第225-227位碱基为该基因组基因的起始密码子ATG,自5′端的第12727-12729位碱基为该基因组基因的终止密码子TGA;自5′端的第459-5042位碱基为该基因组基因的第一个内含子,自5′端的第5217-7617位碱基为该基因组基因的第二个内含子,自5′端的第7786-8498位碱基为该基因组基因的第三个内含子,自5′端的第8583-10552位碱基为该基因组基因的第四个内含子,自5′端的第10583-11271位碱基为该基因组基因的第五个内含子,自5′端的第11431-11555位碱基为该基因组基因的第六个内含子,自5′端的第11694-12043位碱基为该基因组基因的第七个内含子,自5′端的第12116-12576位碱基为该基因组基因的第八个内含子。
其cDNA基因,是下述核苷酸序列之一1)序列表中SEQ ID №5的DNA序列;2)编码序列表中SEQ ID №1蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №5限定的DNA序列杂交的核苷酸序列。
序列表中的SEQ ID №5由1518个碱基组成,其开放阅读框架(ORF)为自5′端第72位-1283位碱基,编码具有序列表中SEQ ID №1的氨基酸残基序列的蛋白质;剪接异构体GSDMDC2的编码基因(GSDMDC2),是下述核苷酸序列之一1)序列表中SEQ ID №6的DNA序列;2)编码序列表中SEQ ID №2蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №6限定的DNA序列杂交的核苷酸序列。
剪接异构体GSDMDC3的编码基因(GSDMDC3),是下述核苷酸序列之一1)序列表中SEQ ID №7的DNA序列;2)编码序列表中SEQ ID №3蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №7限定的DNA序列杂交的核苷酸序列。
剪接异构体GSDMDC4的编码基因(GSDMDC4),是下述核苷酸序列之一
1)序列表中SEQ ID №8的DNA序列;2)编码序列表中SEQ ID №4蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №8限定的DNA序列杂交的核苷酸序列。
所述高严谨条件为杂交后用含0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液在65℃下洗膜。
序列表中的SEQ ID №6由1100个碱基组成,其开放阅读框架为自5′端第1位-609位碱基,编码具有序列表中SEQ ID №2的氨基酸残基序列的蛋白质;序列表中的SEQ ID №7由1127个碱基组成,其开放阅读框架为自5′端第1位-600位碱基,编码具有序列表中SEQ ID №3的氨基酸残基序列的蛋白质;序列表中的SEQ ID №8由958个碱基组成,其开放阅读框架为自5′端第1位-549位碱基,编码具有序列表中SEQ ID №4的氨基酸残基序列的蛋白质。
含有人源肿瘤细胞生长相关蛋白及其剪接异构体编码基因的表达载体,转基因细胞系,宿主菌和扩增所述编码基因中任一片段的引物对也属于本发明的保护范围。利用现有分子生物学的方法可以得到不同的表达载体,已将四种异构体构建到pCDNA3.1/Myc-His(+)C载体,pEGFP-C1载体,pGBKT7载体。
在GNF SymAtlas网站用芯片的方法获得了GSDMDC1的表达谱(图3),该基因的组织表达谱具有以下特点GSDMDC1的mRNA在CD8+T细胞,CD4+T细胞,NK细胞,胸腺,甲状腺,淋巴结,阑尾和前列腺等免疫相关的细胞和组织中相对较高表达。
免疫组化分析实验表明,GSDMDC1在子宫颈癌,癌旁,癌远端正常组织中的表达有显著性差异,说明GSDMDC1在子宫颈癌发生进程中起作用。
本发明的GSDMDC1具有Gasdermin结构域,GSDMDC1基因与Gasdermin基因均定位于17q21.1,串联成簇排列,属于同系同源物,两者具有相似的抑制肿瘤细胞生长的功能。GSDMDC1及其剪接异构体的编码基因可用于制备诊断,预防和/或治疗肿瘤的药物,为临床上治疗肿瘤提供了一条新的治疗途径。


图1为人源肿瘤细胞生长相关基因GSDMDC1的Gasdermin结构域分析结果图2A为人源肿瘤细胞生长相关基因GSDMDC1表达蛋白的亚细胞定位图2B为人源肿瘤细胞生长相关基因GSDMDC2表达蛋白的亚细胞定位图2C为人源肿瘤细胞生长相关基因GSDMDC3表达蛋白的亚细胞定位图2D为人源肿瘤细胞生长相关基因GSDMDC4表达蛋白的亚细胞定位图3为人源肿瘤细胞生长相关基因GSDMDC1在人各组织细胞中的表达分析结果图4A为免疫组化检测GSDMDC1在子宫颈癌组织的细胞核中的表达情况照片图4B为免疫组化检测GSDMDC1在子宫颈癌组织的细胞质、细胞核中的表达情况照片图4C为免疫组化检测GSDMDC1在子宫颈癌旁组织中的表达情况照片具体实施方式
下述实施例中所用方法如无特别说明均为常规方法。
实施例1、GSDMDC1的获得1、对人胎肝的cDNA文库(Clontech公司)进行测序,已测定序列16915条,获得3000余种新的EST序列,克隆其中的全长cDNA511条,方法参见文献(YongtaoYu,Chenggang Zhang,Gangqiao Zhou,et al.Gene Expression Profiling inHuman Fetal Liver and Identification of Tissue-andDevelopmental-Stage-Specific Genes through Compiled Expression Profilesand Efficient Cloning of Full-Length cDNAs.Genome Res.2001,11(8)1392-1403),其中一条基因具有序列表中SEQ ID №5的多核苷酸序列,序列表中SEQ ID №5由1518个碱基组成,将其命名为GSDMDC1。
实施例2、GSDMDC1的克隆、GSDMDC1的剪接异构体的编码基因的获得和它们所编码蛋白的氨基酸序列分析利用NCBI的ORF finder程序进行GSDMDC1的开放阅读框分析,根据实施例1得到的GSDMDC1的cDNA序列设计引物克隆GSDMDC1的开放阅读框序列,引物序列如下引物1(上游引物)5’-CGCGGATCCGGCGCAATGTTCAGCGTAT-3’(划线部分碱基为BamH I识别位点)引物2(下游引物)5’-CCGCTCGAGTTAGGAAGAGACAGAGGT-3’(划线部分碱基为Xho I识别位点)以人胎肝cDNA文库(Clontech公司)为模板,在引物1和引物2引导下,按常规方法PCR扩增GSDMDC1,将PCR产物用限制性内切酶BamH I和Xho I酶切后,与经相同酶酶切的载体pSP72(购自Promega公司)连接,将连接产物转化E.coliJM109感受态细胞,再将其接种于氨苄青霉素抗性培养平板上筛选阳性克隆,挑取在抗性平板上长出的单菌落,摇菌、提质粒进行酶切鉴定,得到在BamH I和Xho I酶切位点之间正确插入有不同长度DNA片段的阳性克隆,对阳性克隆进行测序并进行开放阅读框分析,测序结果表明插入片段长度分别为1212bp,1100bp,1127bp和958bp,将含有GSDMDC1开放阅读框(1212bp)的质粒命名为pSP72-GSDMDC1,GSDMDC1的开放阅读框(ORF)为自5′端第72位-1283位碱基,编码具有序列表中SEQ ID №1的氨基酸残基序列的蛋白质,序列表中的SEQ ID №1由403个氨基酸残基组成,其蛋白分子量为45893.3道尔顿,等电点为5.14,利用德国海德堡生物信息中心SMART网上工具(http∥smart.embl-heidelberg.de/)进行蛋白质结构域(domain)的搜索,结果表明GSDMDC1编码的蛋白含有一个Gasdermin结构域(图1),为序列表中SEQ ID №1的自氨基端(N端)第4-374位氨基酸残基,将该蛋白命名为GSDMDC1(Gasdermin domain containing)。将长度为1100bp的基因片段命名为GSDMDC2,将长度为1127bp的基因片段命名为GSDMDC3,将长度为958bp的基因片段命名为GSDMDC4,同一GSDMDC基因组上转录剪接出不完全相同的mRNA,不完全相同的mRNA又转录出不同的cDNA,因此以人胎肝cDNA为模板,可扩增出4条长度不同的基因片段,表明GSDMDC2、GSDMDC3和GSDMDC4为GSDMDC1的三种剪接异构体的编码基因,GSDMDC2具有序列表中SEQ ID №6的多核苷酸序列,序列表中SEQ ID №6由1100个碱基组成,其开放阅读框架为自5′端第1位-609位碱基,编码具有序列表中SEQ ID №2的氨基酸残基序列的蛋白质,序列表中的SEQ ID №2由203个氨基酸残基组成,其蛋白分子量为23727.0道尔顿,等电点为6.32,将该蛋白命名为GSDMDC2;GSDMDC3具有序列表中SEQ ID №7的多核苷酸序列,序列表中SEQ ID №7由1127个碱基组成,其开放阅读框架为自5′端第1位-600位碱基,编码具有序列表中SEQ ID №3的氨基酸残基序列的蛋白质,序列表中的SEQ ID №3由200个氨基酸残基组成,其蛋白分子量为23348.6道尔顿,等电点为7.07,将该蛋白命名为GSDMDC3;GSDMDC4具有序列表中SEQ ID №8的多核苷酸序列,序列表中SEQ ID №8由958个碱基组成,其开放阅读框架为自5′端第1位-549位碱基,编码具有序列表中SEQ ID №4的氨基酸残基序列的蛋白质,序列表中的SEQ ID №4由183个氨基酸残基组成,其蛋白分子量为20804.6道尔顿,等电点为5.70,将该蛋白命名为GSDMDC4。
实施例3、GSDMDC1的染色体定位及其基因组结构分析对GSDMDC1的核苷酸序列经Blast分析得到Unigene序列,确定该基因的染色体定位,结果表明GSDMDC1定位于染色体17q21.1。
用GSDMDC1的核苷酸序列对人类基因组序列进行Blast搜索确定该基因的基因组结构,结果表明GSDMDC1的基因组基因序列全长为15千核苷酸对,具有序列表中SEQ ID №9的多核苷酸序列,序列表中的SEQ ID №9由12944个碱基组成,具有9个外显子和8个内含子,自5′端的第225-458位碱基为该基因组基因的第一个外显子,自5′端的第5043-5216位碱基为该基因组基因的第二个外显子,自5′端的第7618-7785位碱基为该基因组基因的第三个外显子,自5′端的第8499-8582位碱基为该基因组基因的第四个外显子,自5′端的第10553-10582位碱基为该基因组基因的第五个外显子,自5′端的第11272-11430位碱基为该基因组基因的第六个外显子,自5′端的第11556-11693位碱基为该基因组基因的第七个外显子,自5′端的第12044-12115位碱基为该基因组基因的第八个外显子,自5′端的第12577-12729位碱基为该基因组基因的第九个外显子,自5′端的第225-227位碱基为该基因组基因的起始密码子ATG,自5′端的第12727-12729位碱基为该基因组基因的终止密码子TGA;自5′端的第459-5042位碱基为该基因组基因的第一个内含子,自5′端的第5217-7617位碱基为该基因组基因的第二个内含子,自5′端的第7786-8498位碱基为该基因组基因的第三个内含子,自5′端的第8583-10552位碱基为该基因组基因的第四个内含子,自5′端的第10583-11271位碱基为该基因组基因的第五个内含子,自5′端的第11431-11555位碱基为该基因组基因的第六个内含子,自5′端的第11694-12043位碱基为该基因组基因的第七个内含子,自5′端的第12116-12576位碱基为该基因组基因的第八个内含子。
实施例4、GSDMDC1,GSDMDC2,GSDMDC3和GSDMDC4的亚细胞定位1、定位质粒的构建根据GSDMDC的基因组序列设计引物扩增GSDMDC的开放阅读框架序列,引物序列如下引物35’-CCGCTCGAGCAATGTTCAGCGTATTTG-3’;引物45’-CGC GGATCCTTAGGAAGAGACAGAGGT-3’以人胎肝的cDNA为模板,在引物3和引物4的引导下,进行PCR扩增,反应结束后,将PCR产物用限制性内切酶Xho I和BamH I酶切后与经相同酶酶切的载体pEGFP-C1(购自Clontech公司)连接,将连接产物转化E.coli JM109感受态细胞,再将其接种于卡那霉素抗性培养平板上筛选阳性克隆,挑取在抗性平板上长出的单菌落,摇菌、提质粒进行酶切鉴定,结果得到含有不同长度DNA片段的重组载体,对重组载体进行测序,测序结果表明插入片段的长度分别为1212bp,1100bp,1127bp和958bp,分别与GSDMDC1的开放阅读框、GSDMDC2、GSDMDC3和GSDMDC4的长度相符,将含有GSDMDC1开放阅读框的重组载体命名为pEGFP-C1-GSDMDC1,含有GSDMDC2的重组载体命名为pEGFP-C1-GSDMDC2,含有GSDMDC3的重组载体命名为pEGFP-C1-GSDMDC3,含有GSDMDC4的重组载体命名为pEGFP-C1-GSDMDC4。
2、细胞转染与荧光观察将1×105个MCF-7乳腺癌细胞(购自协和细胞中心)接种于装有DMEM培养基(购自Hyclone公司)的35mm培养皿中,在37℃,5%CO2条件下培养18-24h,待细胞达到60-80%融合率后,将步骤1构建的pEGFP-C1-GSDMDC1、pEGFP-C1-GSDMDC2、pEGFP-C1-GSDMDC3和pEGFP-C1-GSDMDC4用lipofectamine2000法转染MCF-7细胞(转染试剂lipofectamine 2000购自Invitrogen公司),转染24-48小时后观察细胞,用PI染色以指示核。在激光共聚焦显微镜下观察荧光,用冷CCD数码相机拍照,结果如图2A-图2D所示(中间图片为GFP-GSDMDC融合蛋白的绿色荧光,右侧图片为PI染核的结果,左侧图片为二者叠加的结果),表明GSDMDC1,GSDMDC2,GSDMDC3和GSDMDC4均获得表达,表达的GSDMDC1主要定位于细胞核内,在细胞质也有分布;GSDMDC2,GSDMDC3和GSDMDC4均分布于细胞质。
实施例4、组织芯片分析GSDMDC1在子宫颈癌和肝癌中的表达情况用GSDMDC1的多抗检测多种细胞系的内源性表达结果表明GSDMDC1在细胞系Hela,HepG2,MCF7,U20S,A549中表达较高,其中选取子宫颈癌和肝癌临床样本的组织芯片,用GSDMDC1多抗进行免疫组化检测其表达。其中,GSDMDC1多抗是按常规方法将GSDMDC1抗原免疫兔,从抗血清中纯化得到。GSDMDC1抗原按常规方法将其编码基因GSDMDC1插入表达载体pET-28c(+)(购自Novagen公司)中,宿主菌为大肠杆菌BL21,在IPTG(购自Pharmacia公司)诱导下表达得到含His标签的融合蛋白,经常规方法纯化得到目的抗原。
采用超敏S-P法(DAB显色)用DAB显色S-P免疫组化试剂盒检测GSDMDC1在肝癌组织芯片(CC03-02-001)和子宫颈鳞癌组织芯片(CC10-02-001)中的表达情况,具体方法如下1)60℃烤片30分钟,常规脱蜡水化;2)3%H2O2-甲醇封闭内源性过氧化物酶,室温10分钟,蒸馏水洗3次;3)以0.01M柠檬酸盐缓冲液(CB,pH6.0)高温高压修复抗原2分钟,冷却至室温,PBS洗5分钟;4)滴加正常非免疫动物血清封闭液,室温12分钟,甩去多余液体;5)滴加一抗(浓度为1∶200),4℃过夜;阴性对照用PBS代替一抗;
6)0.1%Tween-PBS洗2次,每次10分钟;7)滴加生物素标记第二抗体工作液,室温孵育12分钟,0.1%Tween-PBS洗3次,每次5分钟;8)滴加链霉菌抗生物素蛋白-HRP工作液,室温孵育12分钟,0.1%Tween-PBS洗3次,每次5分钟;9)DAB显色,蒸馏水洗终止显色;10)苏木素复染、水洗、分化后充分水洗返蓝;11)常规脱水透明,中性树胶封片。
GSDMDC1的表达情况如表1所示,在子宫颈鳞癌组织芯片(CC10-02-001)中,所检测的63例样本中,在21例子宫颈癌组织中,共有16例在细胞核中表达(有的只在细胞核中表达,如图4A;有的在细胞核和细胞质中均表达,如图4B),另外5例在细胞核中没有表达(如图4C);在21例癌旁组织中,共有9例在细胞核中表达(含只在细胞核表达的和在细胞核、细胞质均表达的),另外12例在细胞核中没有表达(如图4C);在21例远端组织中,共有8例在细胞核中表达,另外13例在细胞核中没有表达。
表1.子宫颈癌芯片细胞免疫组化结果

注以胞核表达计为阳性;胞核无表达,无论胞质是否表达均计为阴性用卡方检验和Fisher检验分析GSDMDC1在子宫颈癌,癌旁,癌远端正常组织中的表达情况,结果表明GSDMDC1表达在子宫颈癌,癌旁,癌远端有显著性差异(p<0.05;p<0.028)。说明GSDMDC1在细胞内的定位与子宫颈癌的发生进程有关联。
序列表<160>9<210>1<211>403<212>PRT<213>人属人(Homo sapiens)<400>1Met Phe Ser Val Phe Glu Glu Ile Thr Arg Ile Val Val Lys Glu Met1 5 10 15Asp Ala Gly Gly Asp Met Ile Ala Val Arg Ser Leu Val Asp Ala Asp20 25 30Arg Phe Arg Cys Phe His Leu Val Gly Glu Lys Arg Thr Phe Phe Gly35 40 45Cys Arg His Tyr Thr Thr Gly Leu Thr Leu Met Asp Ile Leu Asp Thr50 55 60Asp Gly Asp Lys Trp Leu Asp Glu Leu Asp Ser Gly Leu Gln Gly Gln65 70 75 80Lys Ala Glu Phe Gln Ile Leu Asp Asn Val Asp Ser Thr Gly Glu Leu85 90 95Ile Val Arg Leu Pro Lys Glu Ile Thr Ile Ser Gly Ser Phe Gln Gly100 105 110Phe His His Gln Lys Ile Lys Ile Ser Glu Asn Arg Ile Ser Gln Gln115 120 125Tyr Leu Ala Thr Leu Glu Asn Arg Lys Leu Lys Arg Glu Leu Pro Phe130 135 140Ser Phe Arg Ser Ile Asn Thr Arg Glu Asn Leu Tyr Leu Val Thr Glu145 150 155 160Thr Leu Glu Thr Val Lys Glu Glu Thr Leu Lys Ser Asp Arg Gln Tyr
165 170 175Lys Phe Trp Ser Gln Ile Ser Gln Gly His Leu Ser Tyr Lys His Lys180 185 190Gly Gln Arg Glu Val Thr Ile Pro Pro Asn Arg Val Leu Ser Tyr Arg195 200 205Val Lys Gln Leu Val Phe Pro Asn Lys Glu Thr Met Lys Lys Asp Gly210 215 220Ala Ser Ser Cys Leu Gly Lys Ser Leu Gly Ser Glu Asp Ser Arg Asn225 230 235 240Met Lys Glu Lys Leu Glu Asp Met Glu Ser Val Leu Lys Asp Leu Thr245 250 255Glu Glu Lys Arg Lys Asp Val Leu Asn Ser Leu Ala Lys Cys Leu Gly260 265 270Lys Glu Asp Ile Arg Gln Asp Leu Glu Gln Arg Val Ser Glu Val Leu275 280 285Ile Ser Arg Glu Leu His Met Glu Asp Ser Asp Lys Pro Leu Leu Ser290 295 300Ser Leu Phe Asn Ala Ala Gly Val Leu Val Glu Ala Arg Ala Lys Ala305 310 315 320Ile Leu Asp Phe Leu Asp Ala Leu Leu Glu Leu Ser Glu Glu Gln Gln325 330 335Phe Val Ala Glu Ala Leu Glu Lys Gly Thr Leu Pro Leu Leu Lys Asp340 345 350Gln Val Lys Ser Val Met Glu Gln Asn Trp Asp Glu Leu Ala Ser Ser355 360 365Pro Pro Asp Met Asp Tyr Asp Pro Glu Ala Arg Ile Leu Cys Ala Leu370 375 380Tyr Val Val Val Ser Ile Leu Leu Glu Leu Ala Glu Gly Pro Thr Ser385 390 395 400Val Ser Ser
<210>2<211>203<212>PRT<213>人属人(Homo sapiens)<400>2Met Phe Ser Val Phe Glu Glu Ile Thr Arg Ile Val Val Lys Glu Met1 5 10 15Asp Ala Gly Gly Asp Met Ile Ala Val Arg Ser Leu Val Asp Ala Asp20 25 30Arg Phe Arg Cys Phe His Leu Val Gly Glu Lys Arg Thr Phe Phe Gly35 40 45Cys Arg His Tyr Thr Thr Gly Leu Thr Leu Met Asp Ile Leu Asp Thr50 55 60Asp Gly Asp Lys Trp Leu Asp Glu Leu Asp Ser Gly Leu Gln Gly Gln65 70 75 80Lys Ala Glu Phe Gln Ile Leu Asp Asn Val Asp Ser Thr Gly Glu Leu85 90 95Ile Val Arg Leu Pro Lys Glu Ile Thr Ile Ser Gly Ser Phe Gln Gly100 105 110Phe His His Gln Lys Ile Lys Ile Ser Glu Asn Arg Ile Ser Gln Gln115 120 125Tyr Leu Ala Thr Leu Glu Asn Arg Lys Leu Lys Arg Glu Leu Pro Phe130 135 140Ser Phe Arg Ser Ile Asn Thr Arg Glu Asn Leu Tyr Leu Val Thr Glu145 150 155 160Thr Leu Glu Thr Val Lys Glu Glu Thr Leu Lys Ser Asp Arg Gln Tyr165 170 175Lys Phe Trp Ser Gln Ile Ser Gln Gly His Leu Ser Tyr Lys His Lys180 185 190
Glu Ser Leu Trp Val Arg Arg Ile Pro Glu Thr195 200<210>3<211>200<212>PRT<213>人属人(Homo sapiens)<400>3Met Phe Ser Val Phe Glu Glu Ile Thr Arg Ile Val Val Lys Glu Met1 5 10 15Asp Ala Gly Gly Asp Met Ile Ala Val Arg Ser Leu Val Asp Ala Asp20 25 30Arg Phe Arg Cys Phe His Leu Val Gly Glu Lys Arg Thr Phe Phe Gly35 40 45Cys Arg His Tyr Thr Thr Gly Leu Thr Leu Met Asp Ile Leu Asp Thr50 55 60Asp Gly Asp Lys Trp Leu Asp Glu Leu Asp Ser Gly Leu Gln Gly Gln65 70 75 80Lys Ala Glu Phe Gln Ile Leu Asp Asn Val Asp Ser Thr Gly Glu Leu85 90 95Ile Val Arg Leu Pro Lys Glu Ile Thr Ile Ser Gly Ser Phe Gln Gly100 105 110Phe His His Gln Lys Ile Lys Ile Ser Glu Asn Arg Ile Ser Gln Gln115 120 125Tyr Leu Ala Thr Leu Glu Asn Arg Lys Leu Lys Arg Glu Leu Pro Phe130 135 140Ser Phe Arg Ser Ile Asn Thr Arg Glu Asn Leu Tyr Leu Val Thr Glu145 150 155 160Thr Leu Glu Thr Val Lys Glu Glu Thr Leu Lys Ser Asp Arg Gln Tyr165 170 175
Lys Phe Trp Ser Gln Ile Ser Gln Gly His Leu Ser Tyr Lys His Lys180 185 190Arg Arg Met Val Leu His Pro Val195 200<210>4<211>183<212>PRT<213>人属人(Homo sapiens)<400>4Met Phe Ser Val Phe Glu Glu Ile Thr Arg Ile Val Val Lys Glu Met1 5 10 15Asp Ala Gly Gly Asp Met Ile Ala Val Arg Ser Leu Val Asp Ala Asp20 25 30Arg Phe Arg Cys Phe His Leu Val Gly Glu Lys Arg Thr Phe Phe Gly35 40 45Cys Arg His Tyr Thr Thr Gly Leu Thr Leu Met Asp Ile Leu Asp Thr50 55 60Asp Gly Asp Lys Trp Leu Asp Glu Leu Asp Ser Gly Leu Gln Gly Gln65 70 75 80Lys Ala Glu Phe Gln Ile Leu Asp Asn Val Asp Ser Thr Gly Glu Leu85 90 95Ile Val Arg Leu Pro Lys Glu Ile Thr Ile Ser Gly Ser Phe Gln Gly100 105 110Phe His His Gln Lys Ile Lys Ile Ser Glu Asn Arg Ile Ser Gln Gln115 120 125Tyr Leu Ala Thr Leu Glu Asn Arg Glu Gly Trp Cys Phe Ile Leu Phe130 135 140Arg Lys Val Phe Gly Phe Gly Gly Phe Gln Lys His Glu Gly Glu Val145 150 155 160Gly Gly His Gly Glu Cys Pro Gln Gly Pro Asp Arg Gly Glu Glu Lys
165 170 175Arg Cys Ala Lys Leu Pro Arg180<210>5<211>1518<212>DNA<213>人属人(Homo sapiens)<400>5atctgtgggg attctcacaa cttccatttc tggtgaacag ctgaggtcag agaggagttg 60gtccaggcgc aatgttcagc gtatttgagg aaatcacaag aattgtagtt aaggagatgg 120atgctggagg ggatatgatt gccgttagaa gccttgttga tgctgataga ttccgctgct 180tccatctggt gggggagaag agaactttct ttggatgccg gcactacaca acaggcctca 240ccctgatgga cattctggac acagatgggg acaagtggtt agatgaactg gattctgggc 300tccaaggtca aaaggctgag tttcaaattc tggataatgt agactcaacg ggagagttga 360tagtgagatt acccaaagaa ataacaattt caggcagttt ccagggcttc caccatcaga 420aaatcaagat atcggagaac cggatatccc agcagtatct ggctaccctt gaaaacagga 480agctgaagag ggaactaccc ttttcattcc gatcaattaa tacgagagaa aacctgtatc 540tggtgacaga aactctggag acggtaaagg aggaaaccct gaaaagcgac cggcaatata 600aattttggag ccagatctct cagggccatc tcagctataa acacaagggc caaagggaag 660tgaccatccc cccaaatcgg gtcctgagct atcgagtaaa gcagcttgtc ttccccaaca 720aggagacgat gaagaaggat ggtgcttcat cctgtttagg aaagtctttg ggttcggagg 780attccagaaa catgaaggag aagttggagg acatggagag tgtcctcaag gacctgacag 840aggagaagag aaaagatgtg ctaaactccc tcgctaagtg cctcggcaag gaggatattc 900ggcaggatct agagcaaaga gtatctgagg tcctgatttc cagggagcta cacatggagg 960actcagacaa gcctctccta agcagccttt ttaatgctgc tggggtcttg gtagaagcgc 1020gtgcaaaagc cattctggac ttcctggatg ccctgctaga gctgtctgaa gagcagcagt 1080ttgtggctga ggccctggag aaggggaccc ttcctctgtt gaaggaccag gtgaaatctg 1140tcatggagca gaactgggat gagctggcca gcagtcctcc tgacatggac tatgaccctg 1200
aggcacgaat tctctgtgcg ctgtatgttg ttgtctctat cctgctggag ctggctgagg 1260ggcctacctc tgtctcttcc taactacaaa agccctttct ccccacaagc ctctgggttt 1320tccctttacc agtctgtcct cactgccatc gccactacca tcctgtcacc agtgggacct 1380ctttaaaaca agcagccaac cattctttga tgtatcccat tcgctccatg ttaacatcca 1440aaaccagcct ggatttcata catggacttc tgattaaaag tggcaggttg tgcatgttaa 1500aaaaaaaaaa aaaaaaaa 1518<210>6<211>1100<212>DNA<213>人属人(Homo sapiens)<400>6atgttcagcg tatttgagga aatcacaaga attgtagtta aggagatgga tgctggaggg 60gatatgattg ccgttagaag ccttgttgat gctgatagat tccgctgctt ccatctggtg 120ggggagaaga gaactttctt tggatgccgg cactacacaa caggcctcac cctgatggac 180attctggaca cagatgggga caagtggtta gatgaactgg attctgggct ccaaggtcaa 240aaggctgagt ttcaaattct ggataatgta gactcaacgg gagagttgat agtgagatta 300cccaaagaaa taacaatttc aggcagtttc cagggcttcc accatcagaa aatcaagata 360tcggagaacc ggatatccca gcagtatctg gctacccttg aaaacaggaa gctgaagagg 420gaactaccct tttcattccg atcaattaat acgagagaaa acctgtatct ggtgacagaa 480actctggaga cggtaaagga ggaaaccctg aaaagcgacc ggcaatataa attttggagc 540cagatctctc agggccatct cagctataaa cacaaggaaa gtctttgggt tcggaggatt 600ccagaaacat gaaggagaag ttggaggaca tggagagtgt cctcaaggac ctgacagagg 660agaagagaaa agatgtgcta aactccctcg ctaagtgcct cggcaaggag gatattcggc 720aggatctaga gcaaagagta tctgaggtcc tgatttccgg ggagctacac atggaggacc 780cagacaagcc tctcctaagc agccttttta atgctgctgg ggtcttggta gaagcgcgtg 840caaaagccat tctggacttc ctggatgccc tgctagagct gtctgaagag cagcagtttg 900tggctgaggc cctggagaag gggacccttc ctctgttgaa ggaccaggtg aaatctgtca 960tggagcagaa ctgggatgag ctggccagca gtcctcctga catggactat gaccctgagg 1020cacgaattct ctgtgcgctg tatgttgttg tctctatcct gctggagctg gctgaggggc 1080ctacctctgt ctcttcctaa 1100
<210>7<211>1127<212>DNA<213>人属人(Homo sapiens)<400>7atgttcagcg tatttgagga aatcacaaga attgtagtta aggagatgga tgctggaggg 60gatatgattg ccgttagaag ccttgttgat gctgatagat tccgctgctt ccatctggtg 120ggggagaaga gaactttctt tggatgccgg cactacacaa caggcctcac cctgatggac 180attctggaca cagatgggga caagtggtta gatgaactgg attctgggct ccaaggtcaa 240aaggctgagt ttcaaattct ggataatgta gactcaacgg gagagttgat agtgagatta 300cccaaagaaa taacaatttc aggcagtttc cagggcttcc accatcagaa aatcaagata 360tcggagaacc ggatatccca gcagtatctg gctacccttg aaaacaggaa gctgaagagg 420gaactaccct tttcattccg atcaattaat acgagagaaa acctgtatct ggtgacagaa 480actctggaga cggtaaagga ggaaaccctg aaaagcgacc ggcaatataa attttggagc 540cagatctctc agggccatct cagctataaa cacaagagaa ggatggtgct tcatcctgtt 600taggaaagtc tttgggttcg gaggattcca gaaacatgaa ggagaagttg gaggacatgg 660agagtgtcct caaggacctg acagaggaga agagaaaaga tgtgctaaac tccctcgcta 720agtgcctcgg caaggaggat attcggcagg atctagagca aagagtatct gaggtcctga 780tttccaggga gctacacatg gaggactcag acaagcctct cctaagcagc ctttttaatg 840ctgctggggt cttggtagaa gcgcgtgcaa aagccattct ggacttcctg gatgccctgc 900tagagctgtc tgaagagcag cagtttgtgg ctgaggccct ggagaagggg acccttcctc 960tgttgaagga ccaggtgaaa tctgtcatgg agcagaactg ggatgagctg gccagcagtc1020ctcctgacat ggactatgac cctgaggcac gaattctctg tgcgctgtat gttgttgtct1080ctatcctgct ggagctggct gaggggccta cctctgtctc ttcctaa 1127<210>8<211>958<212>DNA<213>人属人(Homo sapiens)
<400>8atgttcagcg tatttgagga aatcacaaga attgtagtta aggagatgga tgctggaggg 60gatatgattg ccgttagaag ccttgttgat gctgatagat tccgctgctt ccatctggtg 120ggggagaaga gaactttctt tggatgccgg cactacacaa caggcctcac cctgatggac 180attctggaca cagatgggga caagtggtta gatgaactgg attctgggct ccaaggtcaa 240aaggctgagt ttcaaattct ggataatgta gactcaacgg gagagttgat agtgagatta 300cccaaagaaa taacaatttc aggcagtttc cagggcttcc accatcagaa aatcaagata 360tcggagaacc ggatatccca gcagtatctg gctacccttg aaaacagaga aggatggtgc 420ttcatcctgt ttaggaaagt ctttgggttc ggaggattcc agaaacatga aggagaagtt 480ggaggacatg gagagtgtcc tcaaggacct gacagaggag aagagaaaag atgtgctaaa 540ctccctcgct aagtgcctcg gcaaggagga tattcggcag gatctagagc aaagagtatc 600tgaggtcctg atttccaggg agctacacat ggaggactca gacaagcctc tcctaagcag 660cctttttaat gctgctgggg tcttggtaga agcgcgtgca aaagccattc tggacttcct 720ggatgccctg ctagagctgt ctgaagagca gcagtttgtg gctgaggccc tggagaaggg 780gacccttcct ctgttgaagg accaggtgaa atctgtcatg gagcagaact gggatgagct 840ggccagcagt cctcctgaca tggactatga ccctgaggca cgaattctct gtgcgctgta 900tgttgttgtc tctatcctgc tggagctggc tgaggggcct acctctgtct cttcctaa 958<210>9<211>12944<212>DNA<213>人属人(Homo sapiens)<400>9gtggaatgtc atcagttaag gctattttca tttcttttgt ggatcttcag ttgcttcagg 60ccatctggat gtatacatgc aggtcacagg gaatatgatg gcttagcttg ggttcagagg 120cctgacacct caggctgcca aatgtggaag atttaaatac ttgaaccaat accctcctcc 180caaaaactga aattggcttc tgtttctgag ttggtccagg cgcaatgttc agcgtatttg 240aggaaatcac aagaattgta gttaaggaga tggatgctgg aggggatatg attgccgtta 300gaagccttgt tgatgctgat agattccgct gcttccatct ggtgggggag aagagaactt 360
tctttggatg ccggcactac acaacaggcc tcaccctgat ggacattctg gacacagatg 420gggacaagtg gttagatgaa ctggattctg ggctccaagg tcagtataag gtagatgaca 480ggtggccagc caggaggcct tgaccgtttg tactccatct ccttctcaat tccccattgt 540tatcaaccaa tcaacaacga aactgtggga tttgtacaca tccacacacc ttaatttaag 600aaatgcacgg aagagctgca tggtgggagg agagtgggag aagtggagat ttatttccac 660tggaaaccgt tcctaaatgg tcttcctttt ccattttttc ccttgtaaaa taatctgctt 720ttaatttagc gagctcttct catgtgttta tcatttaaat gaataagtaa atgagggcag 780tttgcttact ggttaagaaa ggatgcaggc tttagggctg gaagcacctg gtttcaaagc 840ctggctctgc ctcttatcag ctgcgtaacc tttggacaag ttgttttatt gctctaagtt 900tcagtttcct cctgtgtcaa ctctagagga ctgttgtaag aatcaagtga gggatgggtg 960cggtggctca ctcctgtaat cccagcactt tgggaggccg aggtgggcgg atcacgaggt1020caggagatcg agaccatcct ggctaacaca gtgaaacccc gtctctgctt aaaaaaaaaa1080aatacaaaaa attagccagg cgtggtggca tgcgcctgta gtcctggcta ctcaggaggc1140tgaggcaaga gaattgcttg aacccgggag gtgcaggttg ccgtgagctg agatcacgcc1200actgcactcc agcctgggag acaaagcaag cctctgtctc aaaaaaaaaa aaaaaaaaaa1260tcaaatgaga acaaattacg tgaatcattt atcacagtgc ctgccacaaa aggagcaccc1320aataaaagtt atctcccagg tcggtggtga ttcttattat cctttcatgt tccttggcta1380tcaagactga aggggaagtt tctgatgagc agaaatccct aaggtattga gggaatttat1440ggaagagtca attattccaa ccccctgcct ctgatctcag ttattcctgg ggtacttggg1500tttcagaagc cccagggtta agtgttgaac tctcacttgg agcccaaagt ggaatatggt1560gaggagttca ttatatttca taatgtgaaa aaatatttca taatatgaac aatagcaagg1620cgctcatagc tcagacctct ctgatacagt ccatttcttt ttatgaggtc tcatgccaag1680agacggaaaa gagctctaac agccctgagc agctttagag tattacagtg tgccaggaac1740tgctttaagt gaccaagagc agtacccaga ttacttggag gtggtggacc tttccacaag1800cagagtttcg ttaagcaagc aaggggcttt tggagaaatt tcagattcgc atctttcaaa1860gactgagtca attctctgaa aagtaaattg ctaagagcca atttgctaaa agtcagctct1920caaaaaaaaa aaaaaaaatc agtttgccaa atgatcaatt cactgaaaat ggaaaaatac1980tttaacccag aactaggatg ttttgccaca ataatattac tccccaggga cagggcaaag2040tttaagtctg ggaaaaaaaa attgactaag tcagtcaact tcctttaagg aaaagctcat2100ctgtgtgcat acaaaattcg gaggcagagg tgaaaccaaa cttaaaaaga aaatccttac2160aatgatggga attggtaatt tgaattgatt tttagcttgg tctgctccct atttaaatgg2220
gttattttgt aactgtataa tgctgatggt gcagttaaag tgtgcatagg gctgggcaca2280gtggctcgcg cctgtaatcc cagcactttg ggagactgag gcgggtggat cacttgaggt2340caggagttca agtctggcct ggccaacatg gcgaaaccct gtctctacta aaaatacaaa2400aattagctgg gcatgatggc gcatgcctgt aatcccagca ctttgggagg ctgaggcggg2460cggatcactt gaggccagga gttcgagacc agcctggcca acatggcaaa accctgtctt2520tactaaaaat acaaaaatta gctgggcgtg gtgtcgcatg cctgtaatcc cagctactcg2580ggaggctgag gcaggagaat tgcttgaacc tgggaggtgg aggttgcaca gtgagccatg2640attataccac tgcactccag cctggcgaca aagcaagact ccgtctcaaa aaaaaacaaa2700aaaaaaagtg tgcataggat tttgtgtttg ttattaaagt ccatacttta ttcacattaa2760cttttttttt tttttttttg agatggagtg tcgctctatt gcccaggctg gagagcagtg2820gcgcgatctc ggctcactgc aaccttcacc tctaggttca agtggttctc ctgcctcagc2880ctcccgagta gctgggatta taggtgcctg ccaccacacc tggcaaattt tttgtatttt2940tagtagagac aaggtttcac catgttggcc aggctggtct tgaactcctg acctcaggtg3000atccgcccgc cttggcctcc caaagtgctg ggattacagg tgtgagccgc tgcacccagc3060ccatgttatc ttagttttga cctagtgtcc tttttctatt ccagaatccc atccaggatc3120ctacattaca tttcgttgtc atgtctcctt aggctcctct tggctgtgac agtttctcag3180actttacctg tttgggataa tcttagcagt tttgagcagt actggtcagg gatactgtag3240aacgtccctc tgttggaatt tggctgatgt tttttctcat ggttagactg ggttctgggt3300ctcggggagg aagaccacag aggtaaagga ccattcctat tacatcacat caggggtacg3360tactgtcaac atgacctatc actgttgatg ttgaccttga tcacttggct gaggtaatgt3420ttgtcaggtt tctctaccag aagttactct ttttcctctt cttcatatag tactctttgt3480gcacatagtt tttatttttc tttttctctc tgatattttt cttttctttt acactgctca3540agaagcaaat ggtccctaag acattagtgt ctcatgtaca cacaaatagt gatttcagtc3600actgtttcta attctgtcac atttccacca gttccaaaat ggatttgtct ttggaaatcc3660agccctgcct ccaaaaccta gcagtgggag ctctccctcc cctgtaggtt cccatctggg3720aggttggaga caaaggcacg cagccccttc ggcatgccca cacatcctcc acgaacctgg3780ggtggcaact gactcagaac caaggccctt attagtgcct gatcaatcag ggccgagtcc3840atgcgtgttt gtgactttcc agggttgcct cacttcatac ttgtgtggtt catacaaaca3900acagcgacag aactgctttt attggagatg gagtctcgct gtcgcccagg ctggagtgca3960gtggcttgat cttggctcac tgcagtcttt gcttctgcct cccaggttca agcgattctc4020ctgcctcggc ctcccaagta gctggaatta caggcatgtg ccaccacccc cgactaattt4080
ggtagagatg gggtttcacc atgttggcca ggttggtctc caactcctga cctcaagtga4140tctacccacc tcagcctccc aaagtgctgg gattacaggc gtgagccacc ccaccgtgcc4200cacccagaac tgcttaattt ttatttccca attggctggg gctcctactt ctttagcttt4260acttttcttt gtcttgtttc agcctacaag actggcttac aattattaag cagttagaat4320gtatgccagg cacttggtta agtgcttaac tacatcatta tatttaattt cttcatttct4380tttcttttcc tttccttttc tttttcttgt tttgttttgt tttgttttga ggcagagagg4440cagagtgtca ctctcctcca ggctggagtg cagtggtgtg atctcagctc actgcaacct4500ccgcctcctg ggttcaagcg attctcatgc ctcagcctct caagtagctg tgattacagg4560cacacaccac caggcctggc tactttttgt attttttagt agagacgggg tttcaccata4620ttggccaggc tggtctcgaa ctcctgacct caagtgatct gcctgccaca gcctcccaaa4680gttctgggat tacaggcgtg agccactgtg cccagcccta atttccctaa atataggaag4740tagacattag taatattctc ctactataga tgaagaaaca gattcaaaga ggttaagtga4800cttacccaag gtcatgtggt aagaaggtgg aggagtgggc tcaaatctgg gatcctgtga4860ccccaaggta actgtgcttc tggtgagaac agcatttcct ggacagccac agctgtggcg4920ctccctcaga agggaggggg atggtggcac ggaacccagg atggggctgc cccagggagg4980gtgttttgga gagagatctt ttgggggtct gctccagagt gacctttatc attctctttc5040caggtcaaaa ggctgagttt caaattctgg ataatgtaga ctcaacggga gagttgatag5100tgagattacc caaagaaata acaatttcag gcagtttcca gggcttccac catcagaaaa5160tcaagatatc ggagaaccgg atatcccagc agtatctggc tacccttgaa aacaggtgag5220gttggagttg ggcagcaggg aaggagggga agaagcccat cttgggcacc aagggattca5280agggtggcag accggctctt tttaaaattt atttattttt atttttcttt tccctgcttt5340tcatgagctt tgtgggggac tggctctcta gggcagcctc tcgctctcta cttccaggat5400tccctcagcc ctccccttta cgcaagcacg ccttcctctt ctctgcctcc agaagccttc5460tcattcaccc aggagcagtc tccaggaagc cttctgatgc ccccaattca ctcatatccc5520tgctgtcccc caggatggtt aattcctctg acttggacaa acctggttgt tttttttttg5580tttggttttt gttttgtttt tttttgagac ggagtctcgc tctgtcggcc aggctagagt5640gcaatggcat gatctcggct cactgcaacc tccacctcca aacctggtgg tttaagaggc5700actctccttt gctctcctct gctctcctgc actgagctgc ccacatcagt attttgtgct5760tgtttccctc tgccttgtgg gcaagccagt ggcttccatg ttcgtctttc ccactggact5820ggaagcaact tgtgacaagg gactgacttt actaacctct ctgtattgac cccaagcaca5880cagtaggtac tgagtgaaag agagctgaag tgaagcacga ggaaagcaaa gaaccccttg5940
gaggatgttt cctgcatgga gtacagccac cccaccccag cagggtggca ccgatccagt6000gccacagagg ttctggtagc tggtgggcag gtgcttccaa ttcaagagga catcactagc6060catcccctca gcaatagttc tgttgttgtt ttcttcagct gggattgttg gagattgagg6120agtagctcag gggaaggtga cccacagttt tcctggcctt gctctccttg agtggagcgg6180gtaccttttt tcttttcctt ttcctttttt tttttttgag atggagtttc acttttgttg6240cccaggctgg agtgcaatgg tacattcttg gctcactgca acctctgcct cctggattca6300agagattctt ctgcctcaac ctcccgagga gctgggacta caggtgcccg ccaccacgcc6360tagctaattt ttgtattttt ggtagagaca gggtttcatt caccctattg gccagggttt6420tttggagaga gatctggtct cgaactcctg acctcaggtg atccacctgc cttggcctcc6480caaagtgctg ggattacagg tgtgagccac catgcccatg ccaccctttt ttattaataa6540attaaaaaca aaggcttaca ataaaatttt actggtcctt tgaattaccc ctccctacca6600cagtattgct ggggagaggc cttcagaatt gttctaagag agctcggtgt tttctattat6660agaatgcttg tttgtcaggt gagggtattg gtatctgtat gtggggtggg gcactggata6720ggtaggggaa agtcatcgga ggcagggacc catgtcttga gggccttttg attgcaaata6780gaaactccat cagactgttt taggtctcaa catgagtttc ccccagcggg aatggaatct6840gatgcttcat gagcctaagg gcagatgatg cagctggctc cagggaccag cgcaaggagc6900tggagcccct tgtcagagaa gagggtgtct tgggcttcac agatgcctat ctcagtgtca6960cgggaagggc actctctttg gacttacact gaccagggtt tgaatcccag ctctacactt7020actagctgtg tgaccttgga ccactcacaa cctgtcacta agcctcagta tctttacatg7080gaaagtggac gtaattctgc ctaccatcat aggattgtga aggttaagtg gaaaagcgtg7140gctcacagct ggcacattgt aatcttccat aaatgctggt gaattcttgc cccactttgt7200ttttatttat ttgttttgag gtggagtctt gctctgttgc ccaggctgga gtgcaatggt7260gcagtcttgg ctcactgcaa cctccgcctc ccgggttcaa gtgattctcc tgtctcagcc7320tcctgagtag ctgggattac agatgtgtgc ctggtgatcc actcacctca gcctcccaaa7380atgctgggat tacaggcgat agccaccgta cctggcctct caccctactt tgtaccccac7440ccctacctcc accccgaggt gggtaaagtg aactgcgatg gggtgctgtg ttccttggtt7500ttccagtctc agaagcgatt aatcttcaat aggagctggc tcacagagag ggaaaagagt7560cagtgggagg taaggccctg agatccttaa ctctcatctc tctccactct ctccaggaag7620ctgaagaggg aactaccctt ttcattccga tcaattaata cgagagaaaa cctgtatctg7680gtgacagaaa ctctggagac ggtaaaggag gaaaccctga aaagcgaccg gcaatataaa7740ttttggagcc agatctctca gggccatctc agctataaac acaaggttag gatcctggga7800
ggcagggact gtggaggcca gtgttggccc acaccccgca ggtcaaggcg atgccagcct7860tagactcttc cttcactcct ctccgagcag ccctgctgct cttggccacc ttgccccaag7920aaagggtggg tggcattgcc cagtccttcc cttgttactc tctagcggtg ccctcttttc7980atttgcattt tctttctttc ttttttaaat agagatgagg tcttgcatgt tgtccaggct8040ggtctcaaac tcctgggctc aagcaatcca cccacctcgg cctcccaaag tgctgggatt8100acaggtgtga gccacgcacc cagccttcat tttctttgta catttcccat ggttcatcat8160tacacaggtg tatttttgct tgtttattgt ctgtctcctt tctaggaggt aggaggacag8220gagccatggt gcctagaaca aagcagctcc tcagtaaaca tttgttgaat gaacagtggc8280aacaagatga gttttggcat cagacgtggg ttcaaatttc agctctgcca ctgtttttag8340ctgtgagact gtctcacctg ctgacctctg agagcctcag ttttctcgtc tataaaatgg8400ggatacaaat gactgcctca caggattgtt tgggagatca ggcaagataa tgatgtagaa8460acacctgggg atccgtcaat gtgagctcct ttttctaggg ccaaagggaa gtgaccatcc8520ccccaaatcg ggtcctgagc tatcgagtaa agcagcttgt cttccccaac aaggagacga8580tgagtaagca aaggcagatg gagaacagga tggggggccc taaacacacc agtgaggtgg8640ggggtgggat tcaaccaggc tctgtcagcc tagggtgggt ggctggtgag cttggaggtt8700ggggaggggt ccagggaaaa gggtgggttc agcactagga aggactgagg ctccatgctc8760tgacctgggg acctggaccc gctgacccag gatttgcctg aacatgacat aagagtcatt8820aactcctctc ccagtctcca aatagaataa ttgtcttttt tggctggacg tggtggctca8880cgcctgtaat cccagcactt tgggaggcca aggtgggcgg atcacctgag atcaggagtt8940cgagaccagc ctagccaaca tggtgaaacc ctgtctctac taaaaatata aatattagct9000gggtgtggtg gtatgcgcct gtaatcccag ctacttggga ggctgaggca ggagaattgc9060ttgaacctgg gaagtggagg ttgcagtgag ccgagatctc accattgcac tccagcctag9120gcaacaagag caaaactcca tctcaaaaac aaaaaacaaa aaacaaaaaa caaaaacaaa9180aacaaaaaac agttgtcttt tttttttttt ttttttgatt ggaggctggt atagggattg9240agagggactg gagaaaggga acttacagag tgataactgg tctctccaat aacttgtttt9300ttcctccctt tttggtgctg gtttagatat tcatttcagg ggcaaaacaa aatcctttcc9360agaaggtgag tgagctgctg ggcttcccgt tcgtcatttc agaatgggca aagacactat9420ttttaaaaat ggaattacag agtggttagg tccgaggatg tggtaagacg cacccacagg9480tgggaaccat ggcaagcgca ggggaaaaat tagcctgttg aagagtctgg attgcacatc9540ggactagggt ttccaggctg ctcctaggac aacttcgtgc tggcagtcag ctggatcctg9600agcttacagc cctccctgaa gtcttgttgg cctaggaagc acaattaaat gacttggcca9660
gttccagcag gacagcactg gctgtgaaaa gggtcctgga ctggagtcag gcagtctcag 9720ggtctagtcc caccctgcca ctcactagct ctacagcctc ccaagtcaca gttttcctga 9780ctttatttta atttaattta atttaatttt tttgagacag agtcttgctc tgtcgcccag 9840gctggagtgc agtggtgtga tctcagctca ctgcaacctc tacctcctgg gttcaagcga 9900ttctcctgcc tcagcctccc aagtagctgg gaatacaggt gccctccacc acgccaagtt 9960aagtttggtt ttttttgttt ttcttttttt tgtattttta gtagagacag ggtttcacta10020tatgttggca ggctgctctc aaactcctga actcaggtga tccacccact gcagcctccc10080aaagtgctgg gattacaggc gtgagccacc atgcccagcc tttcctgact ttaaactaaa10140ggagtgagac tagaaggtcc ctgtgattct gaattatgtg gcttcctctg gaatttctag10200gttttcccct tgatcccagc agggttgtac tgcctaagag agcttggaaa gggatagaga10260agtctgaccc aaatttgcgg agcgactgag tgtatgctgc cccctttctg ggccttggct10320tcttcctcaa tcatctaggc acagtcctat gactgcctgt ttttgaggat gtgggaaggg10380tctgcaaata cagtgctttc ccattgacac acgctggtga ggatgcaggc tccctggcac10440cagcagtgag ggctcagatt gcaagagtaa aaacttccat cactgggaag agaagtctgc10500aggggactgg aggtgatctg aagattctga aataactctt cctctctctg caaagaagga10560tggtgcttca tcctgtttag gaaagggtga tagccaagtg tgttcagggt ggctgcacca10620acccaccctg agtccatgtg gctcaagact gctgctcagg tggggtcagc tgagtgggta10680ggaagtcggg aggcactgcc tagcaggttt caactttagt ctggaggctg catctgtctc10740ctctaaacac agtggttctc attggttata ccccaaaatc acaccaggaa actttaaaac10800tagtgacgac tgagtcccgt ctccagaaac tctgacttaa ttgtgggggt gtggcctgga10860catcaggatt tgtaataact cctcaggtga ttctcatgta gtcaaggttg agaaccactg10920ctttaacttt ctccaaatcc taattacttc tagtgtggcc tgaggactgc actttgaatg10980gcaagggcca aataaccaag tttttgtttt tttccaggaa gtggagaaga atttggggtt11040gggactagac tgggggtgag ctggggagat ggaagatgga agtggggtca gtgggaggca11100atgatggtag gtatcttgga agaaggatgc ttaattttaa cacggaaaga ctggaagaag11160ggaagataca aagaggtggt ctccagaaga cagtcagaca aataacagag ccttagaaat11220aaaacctttt gggctgggtg gcccaggttc tcaattgctg cctctacagg aaagtctttg11280ggttcggagg attccagaaa catgaaggag aagttggagg acatggagag tgtcctcaag11340gacctgacag aggagaagag aaaagatgtg ctaaactccc tcgctaagtg cctcggcaag11400gaggatattc ggcaggatct agagcaaaga gtaagggacc ctaagaaagc cttggggcag11460agagagatag gagccagagg ggatggcagt tggcacagtg aggataatct gctatggtga11520
gactgctgct catctcccac acttcctggc cctaggtatc tgaggtcctg atttccgggg11580agctacacat ggaggaccca gacaagcctc tcctaagcag cctttttaat gctgctgggg11640tcttggtaga agcgcgtgca aaagccattc tggacttcct ggatgccctg ctaggtgagg11700aagggtctcg ctgtaggctg gggtggagga agtgtgagca gagaggcctg tggggagtca11760catcttggga ggaggggctg catgttgctc ttcacagttt atggggggca ctccttcatg11820tcttcctcag gccaggcatt gaggggctgg ttcctcgtct gtgactcctg caggccaaga11880gggaagcagg agtcacagca gaggcctgtt tggagtaagt ctcatctagc actcccaggg11940gctctctgga accttttgat gatacatgtt ctgggtgtga tcagccactg aggccctgtc12000ccaccatata tctctccttt ttaccactct ttctttgccc ccagagctgt ctgaagagca12060gcagtttgtg gctgaggccc tggagaaggg gacccttcct ctgttgaagg accaggtgag12120acagcctggg ctgagggcca tggtcatagt ggaagggaat gcccatattc tcaagggacc12180cagaagtccc agggtacagc cccttcttat tccatagttt tctgccggct cacatccatg12240cagctggttt gtgacaattc cctggacaga gagttgccag aacaatttgt ggtgggttct12300ttaggctctg ttttttatct gtgggcaaga gagggctgca aattggttag tcccaggaca12360gcagctggta tgatcttgag ttcccatgca gactgactag cagagcctgc cactatgttg12420agagagtatg aagctctccg ggctctgcag gaaagagtgc catgatggat tattacgtct12480gcctatcagc tcagcagcaa ggagtgtggc caaatatttg ccatttctgg tatatcgttg12540ttcctagctg ttacaatctg gggggtttcc ttccaggtga aatctgtcat ggagcagaac12600tgggatgagc tggccagcag tcctcctgac atggactatg accctgaggc acgaattctc12660tgtgcgctgt atgttgttgt ctctatcctg ctggagctgg ctgaggggcc tacctctgtc12720tcttcctaac tacaaaagcc ctttctcccc acaagcctct gggttttccc tttaccagtc12780tgtcctcact gccatcgcca ctaccatcct gtcaccagtg ggacctcttt aaaacaagca12840gccaaccatt ctttgatgta tcccattcgc tccatgttaa catccaaaac cagcctggat12900ttcatacatg gacttctgat taaaagtggc aggttgtgca tgtt 1294权利要求
1.一种人源肿瘤细胞生长相关蛋白,是具有下述氨基酸残基序列之一的蛋白质1)序列表中的SEQ ID №1;2)将序列表中SEQ ID №1的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质。
2.权利要求1所述人源肿瘤细胞生长相关蛋白的编码基因。
3.根据权利要求2所述的编码基因,其特征在于所述人源肿瘤细胞生长相关蛋白的cDNA基因,具有下述核苷酸序列之一1)序列表中SEQ ID №5的DNA序列;2)编码序列表中SEQ ID №1蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №5限定的DNA序列杂交的核苷酸序列。
4.含有权利要求2或3所述编码基因的表达载体,转基因细胞系,宿主菌。
5.权利要求1所述蛋白的剪接异构体,是具有下述氨基酸残基序列之一的蛋白质1)序列表中的SEQ ID №2;2)将序列表中SEQ ID №2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质。
6.权利要求5所述剪接异构体的编码基因,具有下述核苷酸序列之一1)序列表中SEQ ID №6的DNA序列;2)编码序列表中SEQ ID №2蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №6限定的DNA序列杂交的核苷酸序列。
7.权利要求1所述蛋白的剪接异构体,是具有下述氨基酸残基序列之一的蛋白质1)序列表中的SEQ ID №3;2)将序列表中SEQ ID №3的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质。
8.权利要求7所述剪接异构体的编码基因,是下述核苷酸序列之一1)序列表中SEQ ID №7的DNA序列;2)编码序列表中SEQ ID №3蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №7限定的DNA序列杂交的核苷酸序列。
9.权利要求1所述蛋白的剪接异构体,是具有下述氨基酸残基序列之一的蛋白质1)序列表中的SEQ ID №4;2)将序列表中SEQ ID №4的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且与肿瘤细胞生长相关的蛋白质。
10.权利要求9所述剪接异构体的编码基因,是下述核苷酸序列之一1)序列表中SEQ ID №8的DNA序列;2)编码序列表中SEQ ID №4蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №8限定的DNA序列杂交的核苷酸序列。
全文摘要
本发明公开了一种人源肿瘤细胞生长相关蛋白及其剪接异构体与它们的编码基因。该蛋白具有下述氨基酸残基序列之一1)序列表中的SEQ ID №1;2)将序列表中SEQ ID №1的氨基酸残基序列经过一至十个氨基酸残基的取代、缺失或添加且与肿瘤细胞生长相关的蛋白质。其cDNA基因,是下述核苷酸序列之一1)序列表中SEQ ID №5的DNA序列;2)编码序列表中SEQ ID №1蛋白质序列的多核苷酸;3)在高严谨条件下可与序列表中SEQ ID №5限定的DNA序列杂交的核苷酸序列。本发明的GSDMDC1及其剪接异构体的编码基因可用于制备诊断,预防和/或治疗肿瘤的药物,为临床上治疗肿瘤提供了一条新的治疗途径。
文档编号C12N15/12GK1840545SQ20061006511
公开日2006年10月4日 申请日期2006年3月17日 优先权日2005年3月18日
发明者贺福初, 张令强, 孙乔, 邢桂春, 鱼咏涛 申请人:中国人民解放军军事医学科学院放射与辐射医学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1