影响elk1活性的多核苷酸及其编码多肽和用途的制作方法

文档序号:429030阅读:554来源:国知局
专利名称:影响elk1活性的多核苷酸及其编码多肽和用途的制作方法
技术领域
本发明公开了一类新的编码具有影响ELK1活性的功能的人蛋白的多核苷酸及其编码的多肽,多肽的抗体。本发明也公开了这类新的多核苷酸在宿主细胞中外源表达对ELK1活性的影响的应用。本发明还公开了所述多肽、抗体在制备预防和治疗神经系统疾病和肿瘤的药物上的用途。

背景技术
ELK1(member of ETS oncogene family),基因定位于Xp11.2,1989年Rao等发表的论文指出,发现了两个新ETS致癌基因,名为ELK1和ELK2,在睾丸和肺两个器官,ELK及其相似序列均表现出转录功能。该基因编码的蛋白产物为ELK1,为ETS致癌基因家族(转录因子)的一员,属于TCF(the ternary complex factor)亚家族。TCF亚家族基因编码的蛋白产物通过结合位于c-fos原癌基因的上游启动子区的血清反应元件(SRE)和血清反应因子(SRF),形成一个三联复合物发挥作用。该基因编码的蛋白是ras-raf-MAPK信号传导级联的核定位分子。
The ETS DNA-binding domain位于N端,The B-box region是Elk1结合于SRF的蛋白-蛋白相互作用部位,促进了三联复合物的形成。the transcriptional activation domain(TAD)包含多个丝氨酸/苏氨酸残基,为磷酸化的MAPK激酶结合位点;The D-domain和the FxF motif是MAPK激酶的入坞位点;ETS DNA-binding domain和the R-motif具有以致基因表达活性。以上结构域在脊椎动物里是保守的,进化上的保守说明其具有重要的功能。
Elk1的生物学功能很复杂,大体可以分为两类Elk1的功能和TCF复合物形成的功能。研究表明Elk1基因可能在神经系统发挥作用。首先,Elk1在大鼠的脑部多种神经细胞中表达,而且在谷氨酸受体活化是发生磷酸化;此外,在神经细胞分化过程中出现了N端缺失的Elk1。不过,Elk1在细胞系中的作用是通过Elk1活化后对立早蛋白如c-fos的调节实现的。
Elk1活化后,通过结合位于立早蛋白基因的上游启动子区的血清反应元件(SRE)和血清反应因子(SRF),形成一个三联复合物,介导了细胞对刺激的快速反应。最早发现有调节作用的是c-fos原癌基因,后来在egr-1和jun-B等也有作用,不过现在并不知道其调控的全部蛋白,也不知道是否存在SRF非依赖的作用方式,以及它们是否可以在启动子区的不同部位发挥功能。实际上,Elk1可以以The B-box region非依赖的形式和Pax-5形成启动子偶联复合物,此时发挥作用的是The ETS DNA-binding domain和Pax-5。
经典理论认为Elk1的主要作用是形成Elk-1-SRF-SRE三联复合物,该复合物是决定细胞增殖还是凋亡的分子开关;Elk1是ras-raf-MAPK信号传导级联的核定位分子。因此,虽然我们还不能确定其调节的临界点,但是我们可以确定其在细胞增殖和凋亡的调控、神经系统、肿瘤中 具有作用 1.Elk1和肿瘤 Elk1对肿瘤的作用的可能机制可能为Elk1是ras-raf-MAPK信号传导级联的核定位分子,其被MAPK通路活化磷酸化后,形成Elk-1-SRF-SRE三联复合物,增高了c-fos原癌基因等立早基因的表达,决定了细胞增殖/凋亡的分子开关向抑制凋亡和促进增殖方面转化,导致细胞的恶性增殖,并进而导致肿瘤的发生。实验证据包括在Helicobacter诱导的胃部小肠组织样恶化和villin引起的Elk1和SRF的活化高度相关;在前列腺癌细胞中,Elk1的活化导致了细胞的显著性增殖等。
2.Elk1和神经生长、胰岛素的关系 关于这方面的机制还不是很清楚,不过越来越多的证据表明它们存在联系如有研究表明,在EGF诱导的嗜铬细胞瘤PC12和胰岛素瘤INS-1增殖中,Elk1起到调节基因转录的重要作用;Elk1在大鼠的脑部多种神经细胞中表达,而且在谷氨酸受体活化是发生磷酸化;此外,在神经细胞分化过程中出现了N端缺失的Elk1。不过这种调控作用是否需要形成Elk-1-SRF-SRE三联复合物尚未可知。
3.作为Elk-1-SRF-SRE三联复合物而发挥的作用 该复合物在肌肉增生和重塑、衰老中发挥作用。详见专利“影响SRE活性的多核苷酸及其编码多肽和用途”(高霞等,200510102772.7)。
既然很多疾病的发生和发展与Elk1及其调控异常相关,那么对某些疾病进行治疗性干预是合乎逻辑的。相关的动物实验也表明,对Elk1的封闭或者活性部位的突变于肿瘤、神经系统异常等方面的改变,不过到目前为止,尚未见到有关该基因或其表达蛋白用于治疗的报导,或者是对该通路的调控进行干预用于治疗的例子。因此,Elk1信号转导及其调控机理研究对于今后很多疾病的治疗具有重要意义。


发明内容
人基因组学研究目前是国际上的热点,除大规模测序的方法外,还缺少从功能研究开始的高通量筛选具有一定功能的基因的方法。针对这种现状及现有药物或试剂的不足,本发明的目的是提供一类新的编码具有影响ELK1活性功能的人蛋白的多核苷酸ELK1IF1、2、3、4、5、6、7、8。
本发明的另一目的是提供这类多核苷酸所编码的多肽。
本发明的另一目的是提供含有这类多核苷酸的载体,和这类多核苷酸及其载体转化或转导的宿主细胞。
本发明的另一目的是提供这类多核苷酸所编码的多肽的抗体和用于检测的核酸分子。
本发明的另一目的是提供这类新的多核苷酸在宿主细胞中外源表达影响ELK1活性的应用。
本发明的另一目的是提供生产这些多核苷酸和其编码的多肽的方法以及该多核苷酸及其编码的多肽的用途。
为实现上述目的,本发明采用以下技术方案 在本发明的第一方面,提供新颖的分离的多核苷酸,它包含编码具有影响ELK1活性的功能的蛋白的核苷酸序列,该核苷酸序列选自(a)与编码含有SEQ ID NO2、SEQ ID NO4、SEQID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16的氨基酸序列的多肽的多核苷酸有至少70%相似性的多核苷酸;(b)编码含有与SEQ ID NO.2、SEQ ID NO.4、SEQ ID NO.6、SEQ ID NO.8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16的氨基酸序列有至少70%相似性的氨基酸序列的多肽的多核苷酸;(c)与(a)或(b)的多核苷酸互补的多核苷酸。
较佳地,该多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16。
较佳地,该多核苷酸的序列与选自下组的核苷酸序列有至少85%相似性(a)SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15的编码区序列或全长序列;(b)在遗传密码简并范围内相应于(a)中提到的序列的至少一个序列;(c)与(a)或(b)中提到的序列互补的序列杂交的至少一个序列。
更佳地,该多核苷酸的序列选自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15的编码区序列或全长序列。
在本发明的第二方面,提供了上述核苷酸所编码的多肽,它包含具有选自下组中的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQID NO12、SEQ ID NO14、SEQ ID NO16;或与以上任一氨基酸序列具有至少90%以上相似性的多肽,或其保守性变异多肽、或其活性片段、或其活性衍生物。
较佳地,该多肽是具有选自下组的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO4、SEQ IDNO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16。
在本发明的第三方面,提供了含有上述多核苷酸的载体,以及被该载体转化或转导的宿主细胞,还提供了被上述多核苷酸转化或转导的宿主细胞。
在本发明的第四方面,提供了与上述多肽特异性结合的抗体,还提供了可用于检测的核酸分子,它含有上述任一多核苷酸中8-100个连续的核苷酸。
在本发明的第五方面,提供了上述多核苷酸在宿主细胞中外源表达影响ELK1活性的应用。较佳地,该应用包括具有选自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9中的编码区或全长序列的多核苷酸在宿主细胞中外源表达抑制ELK1活化的应用和具有选自SEQ ID NO11、SEQ ID NO13、SEQ ID NO15中的编码区或全长序列的多核苷酸在宿主细胞中外源表达促进ELK1活化的应用。
在本发明的第六方面,提供了上述多核苷酸和多肽在制备预防和/或治疗神经系统的疾病或肿瘤的药物中的用途。
在本发明地第七方面,提供了一种药物组合物,它含有安全有效量的本发明中的具有影响ELK1活性功能的多肽及药学上可接受的载体。
在本发明的第八方面,提供了一种神经系统疾病或肿瘤的体外检测方法,利用上述抗体或核酸片段来检测宿主样品中的多肽的存在或水平。
本发明的其他方面由于本文的技术的公开,对本领域技术人员而言是显而易见的。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化的,但同样的多核苷酸或多肽如果从天然状态中与共同存在的其他物质分开,则为分离纯化的。这样的多核苷酸可能是某一载体的一部分,也可能这样的多核苷酸或多肽是某一组合物的一部分,既然载体或组合物不是它们的天然环境的成分,这些多核苷酸或多肽仍然是分离的。
如本文所用,“相似性”是指核苷酸或多肽序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低,是一种直接的数量关系,通过部分相同或相似的百分比来度量核苷酸序列或者多肽序列之间相似的程度,此相似性百分比可以通过本领域已有的比对方法来计算,例子有两两序列间的比对方法FASTA程序(Pearson,W.R.and Lipman,D.J.1988.Improved tools for biological sequence comparison.Proc.Natl.Acad.Sci.852444-2448),BLAST程序(Altschul,S.F.,et al.1990 Basic local alignment search tool.J.Mol.Biol.215403-410)等,或多序列比对方法CLUSTAL W(CORPET,F.1998 Multiple sequencealignment with hierarchical clustering.Nucleic Acids Res.,1610881-10890)等。同源序列是指从某一共同祖先经趋异进化而形成的不同序列,根据相似性百分比可以判断比对序列间的同源性。当基因或蛋白质间相似程度很高时,表示它们具有一段共同的进化历程,从而判断它们会具有相似的生物学功能。当具有至少50%的相似程度时,比较容易推测检测序列和目标序列可能是同源序列。较佳地,具有至少70%的相似程度;更佳地,具有至少85%的相似程度;最佳地,具有至少90%的相似程度。而当相似性程度低于20%时,就难以确定或者根本无法确定其是否具有同源性。
本发明的多核苷酸包括其互补链可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。如本文所用,“编码具有诱导细胞凋亡功能的多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码序列和/或非编码序列的多核苷酸。以ELK1IF1所编码的多肽为例,编码成熟多肽的编码区序列可以与SEQ ID NO1所示的编码区序列相同或者是遗传密码简并的变异体。如本文所用,“遗传密码简并”是指一个氨基酸有几个密码子的现象。例如在本发明中ELK1IF1所编码的多肽的遗传密码简并的变异体指编码具有SEQ ID NO2的多肽的核苷酸,且此核苷酸与SEQID NO1所示的编码区序列有差别。对于其他具有影响ELK1活性功能的多肽,可依此类推。
本发明还涉及上述多核苷酸的变异体,它编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。该多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与本发明所述多核苷酸序列的互补序列杂交且两个序列间具有至少50%,较佳地至少70%,更佳地至少80%相同性的多核苷酸。本发明特别涉及在严格条件下与此多核苷酸序列的互补序列可杂交的多核苷酸。在本发明中,“严格条件”是指(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好的是在97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与本发明所述的多肽有相同的生物学功能和活性。
本发明的多核苷酸序列能用本领域已有的方法获得。这些技术包括但不局限于(1)通过杂交技术分离DNA序列;(2)人工化学合成DNA序列;(3)通过构建cDNA文库大规模获得所需的多核苷酸;(4)PCR扩增技术。
第一种方法是先构建基因组文库或者cDNA文库,然后通过分子杂交等技术从基因组文库或cDNA文库中筛选出目的基因或序列。当生物基因组比较小时,此方法较易成功;当生物基因组很大时,构建其完整的基因组文库较困难,再从庞大的文库中去克隆目的基因的工程量也很大。
第二种方法是按设计好的序列一次合成100-200bp长的DNA片段,再用这些合成的片段组合连接成完整的基因。这种合成长的基因序列的方法的价格十分昂贵。此方法主要用于合成作为引物、接头等的核酸片段。
第三种方法是用本领域通常的方法构建cDNA文库,多次测序后,结合生物信息学分析技术(Ota et al.Nat Genet.2004 Jan36(1)40-5),大规模获得目的cDNA克隆。生物信息学分析技术包括但不限于用BLAST或BLAT与已有的公共数据库比对,如refseq数据库等;用Phred算法评估测序质量;用计算转录起始密码子ATG的出现概率的ATGpr算法筛选全长cDNA序列等。
第四种方法用PCR技术扩增DNA/RNA的方法(Saiki,et al.Science 1985;2301350-1354)。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。本发明优选应用的方法是两步法通量化RT-PCR技术在混合cDNA文库中扩增得到大量的cDNA克隆。混合cDNA文库包括现有的cDNA文库和肿瘤文库。
本发明的基因,或者各种DNA片段等核苷酸序列的测定可用常规方法,如双脱氧链终止法(Sanger et al.PNAS,1977,745463-5467)也可用商业测序试剂盒等。为了获得全长的cDNA序列,测序需要反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。
本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(如细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。本发明的多肽可以是糖基化的,也可以是非糖基化的。本发明的多肽可以包括或不包括起始的甲硫氨酸残基。
本发明还包括具有影响ELK1活性功能的多核苷酸编码的人蛋白多肽的片段、衍生物和类似物。术语“片段”、“衍生物”和“类似物”是指基本上保持与本发明的天然具有影响ELK1活性功能的人蛋白多肽相同的生物学功能或活性的多肽。本发明的多肽片段、衍生物和类似物可以是(a)有一个或多个保守或非保守性氨基酸残基(优先保守性氨基酸残基)被取代的多肽,而这样取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(b)在一个或多个氨基酸残基中具有取代基团的多肽,或(c)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物)融合所形成的多肽,或(d)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。
本发明的多肽可以通过常规的重组DNA技术,利用本发明的多核苷酸序列来表达或生产重组的具有影响ELK1活性功能的蛋白多肽(Science,1984;2241431)。包括以下步骤 (1)用本发明的多核苷酸(或其变异体),或用含有此多核苷酸的表达载体转化或转导合适的宿主细胞; (2)在合适的培养基中培养步骤(1)得到的宿主细胞; (3)从培养基或细胞中分离、纯化所需的蛋白多肽。
本发明中的多核苷酸和多肽优选以分离的形式提供,更佳地被纯化至均质。
本发明也涉及包含本发明所述多核苷酸的载体。本发明中,编码具有影响ELK1活性功能的人蛋白多肽的多核苷酸序列可以插入到重组表达载体中。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒,如腺病毒、逆转录病毒,或者其他载体。在本发明中适用的载体可以是原核表达载体,也可以是真核表达载体,如在细菌中表达的基于T7的表达载体(Rosenberg,et al.Gene,1987,56125),在哺乳动物细胞中高表达的真核表达载体pcDNATM3.1/myc-hisB(-)(Invitrogen),pcDNA3.1/V5-His-TOPO(Invitrogen,以下缩写为pcDT)。本发明优选pcDT,它可以直接与PCR产物连接来构建真核表达载体,大大提高了规模化生产的效率。只要能在宿主体内复制和稳定,任何质粒和载体都可以应用。表达载体的一个重要特征是通常含有复制起点、启动子、标记基因和翻译控制元件。用本领域的技术人员熟知的方法来构建含有本发明所述多核苷酸序列和转录/翻译控制信号的表达载体即可。这些方法包括体外重组DNA技术、DNA合成技术、体内重组DNA技术等(Sambrook,et al.MolecularCloning,a Laboratory Manual,Cold Spring Harbor Laboratory.New York,1989)。
本发明的多核苷酸序列可有效地连接到表达载体中的适当的启动子上来指导mRNA合成。这些启动子的代表性例子有大肠杆菌的lac或trp启动子;λ噬菌体的PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。表达载体优选的包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如用于大肠杆菌的四环素或氨苄青霉素抗性、或真核细胞培养用的绿色荧光蛋白(GFP)、新霉素抗性及二氢叶酸还原酶。
本发明还涉及用上述载体或者本发明的多核苷酸经基因工程产生的宿主细胞。本发明的载体和多核苷酸可以用于转化适当的宿主细胞,以使其能够表达具有影响ELK1活性功能的蛋白质。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有大肠杆菌;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS或Bowes黑素瘤细胞的动物细胞;293T、Hela细胞等。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录增强。增强子是DNA的顺式作用因子,通常有10-300个碱基对,作用于启动子以增强基因的转录。例子有在复制起始点下游的100-270个碱基对的SV40增强子、在复制起始点下游的多瘤增强子以及腺病毒增强子等。
本领域的普通技术人员都知道如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主细胞为原核细胞如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收集,用CaCl2法处理,所用步骤是本领域众所周知的。可供选择的是MgCl2处理,也可用电穿孔的方法处理。当宿主是真核细胞时,可选择以下转染方法磷酸钙共沉淀法、常规机械方法如显微注射、电穿孔、脂质体包装等。获得的转化子可以用常规方法培养,来表达本发明的多核苷酸所编码的多肽。根据所选的宿主细胞选择合适的常规培养基,在适于宿主细胞生长的条件下培养。当宿主细胞生长到适当的细胞密度后,用适当的方法如温度转化或化学诱导,来诱导选择的启动子,将细胞再培养一段时间。
上述方法中的重组多肽可包被于细胞内、细胞外或在细胞膜上表达或分泌到细胞外。如果需要,可利用其物理的、化学的和其他特性通过各种分离方法分离和纯化重组多肽。这些方法是本领域技术人员所熟知的,如常规的复性处理,用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超声波处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析和其它各种液相层析技术或这些方法的结合。
本发明还涉及与本发明多核苷酸的任何一部分同源的核酸片段。如本文所用,“核酸片段”的长度至少含有15个核苷酸,较好的是至少30个核苷酸,更好的是至少50个核苷酸,最好的是至少100个核苷酸。此核酸片段通常是在本发明的核苷酸序列信息的基础上化学合成的DNA序列。上述核酸片段可以用于PCR扩增技术(如作为引物)以确定和/或分离编码具有影响ELK1活性功能的多核苷酸也可以作为杂交所用的探针。也可以用于RNA干扰技术。本发明的多核苷酸的一部分或全部也可作为探针固定在微阵列(Microarray)或DNA芯片上,用于分析组织中基因的差异表达和基因诊断。探针的标记可用放射性同位素,荧光素或酶(如碱性磷酸酶)等。
本发明的多肽可以直接作为药物治疗疾病,如神经系统疾病和肿瘤等;还可用于筛选促进或对抗具有影响ELK1活性的功能的蛋白的抗体、多肽或其它配体,例如,筛选可用于促进或抑制本发明的蛋白的功能的抗体。用表达的重组的本发明的蛋白来筛选多肽库,用于寻找有治疗价值的能够促进或抑制本发明的蛋白的功能的多肽分子。
本发明的多肽可以单独使用或者与合适的药物载体组合后使用。组合物包含安全有效量的多肽或拮抗剂及不影响药物效果的载体和赋型剂。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油及它们的组合。药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。给药于患者的用量取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
本发明的多肽也可以通过在活体表达这些多肽来使用。例如患者的细胞可以通过在体外用编码本发明多肽的基因进行基因工程操作,然后将工程细胞提供给患者,使工程细胞在体内高表达这种多肽,从而达到治疗的目的。
具有影响ELK1活性功能的人蛋白的多核苷酸也可用于多种治疗目的。可用在基因治疗技术中来治疗由于具有影响ELK1活性的功能的人蛋白表达异常或活性异常导致的疾病。重组的基因治疗载体(如病毒载体)可设计成表达变异的具有影响ELK1活性的功能的人蛋白,来抑制内源性的具有影响ELK1活性功能的人蛋白的活性。重组的具有影响ELK1活性功能的人蛋白基因也可包装到脂质体中转移至细胞内。
抑制本发明多肽mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酸也在本发明的范围之内。反义RNA和DNA以及核酸可用本领域已有的方法合成。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷间的连接用磷酸硫酯键或肽键。
本发明的多肽及其片段、衍生物、类似物或表达它们的细胞可以作为抗原来生产抗体。这些抗体包括但不限于单克隆抗体、多克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的抗体。本发明的多肽的抗体可用本领域公知的抗体制备方法来生产。例子有单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256495-497)。多克隆抗体的生产可用本发明的多肽免疫动物,如家兔、小鼠、大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术产生(Morrison etal.PNAS,1985,816851)。单链抗体也可用已有的技术生产(U.S.Pat No.4946778)。
本发明的抗体可用于免疫组织化学技术中,检测活体标本中的具有诱导细胞凋亡功能的蛋白。还可以在临床上用于与具有诱导细胞凋亡功能的人蛋白相关的疾病的临床诊断、治疗、疗效评价等。例如用放射性同位素标记与本发明的多肽结合的单克隆抗体,然后注入体内跟踪其位置和分布,可以作为一种非创伤性诊断方法来定位肿瘤细胞,或判断肿瘤细胞是否转移。本发明中的抗体还可以用于治疗或预防与具有影响ELK1活性功能的人蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断具有影响ELK1活性功能的人蛋白的产生或活性。
本发明还涉及定量和定位检测具有影响ELK1活性功能的蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。实验中检测的具有影响ELK1活性功能的蛋白水平,可以用作解释具有影响ELK1活性功能的蛋白在各种疾病中的重要性和用于诊断具有影响ELK1活性功能的蛋白起作用的疾病。
具有影响ELK1活性功能的蛋白的多核苷酸可用于具有影响ELK1活性功能的蛋白相关疾病的诊断和治疗。在诊断方面,具有影响ELK1活性功能的蛋白的多核苷酸可用于检测具有影响ELK1活性功能的蛋白的表达与否,或在疾病状态下具有影响ELK1活性功能的蛋白的异常表达。如具有影响ELK1活性功能的蛋白的DNA序列可用于对活检标本的杂交以判断具有影响ELK1活性功能的蛋白的表达异常。杂交技术是本领域已公开的成熟技术,包括Southern印迹法、Northern印迹法、原位杂交等,相关的试剂盒可以从商业途径获得。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片上,用于分析组织中基因的差异表达和基因诊断。用具有影响ELK1活性功能的蛋白特异的引物进行RNA-聚合酶链式反应(RT-PCR)体外扩增也可以检测具有影响ELK1活性功能的蛋白的转录产物。
检测具有影响ELK1活性功能的蛋白基因的突变也可用于诊断具有影响ELK1活性功能的蛋白相关的疾病。具有影响ELK1活性功能的蛋白基因的突变形式包括与正常野生型的具有影响ELK1活性功能的蛋白的DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用本领域已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Westen印迹法可间接判断基因有无突变。
基因ELK1IF1、2、3、4、5、6、7、8在实验中所有用到的正常组织、胎儿组织、肿瘤组织中都有表达,说明其为人体自身重要的ELK1影响因子;在不同的组织中表达量高低有差别,说明其在不同的组织中发挥功能的程度不同。
以下对本发明的实施方案进一步详细说明。
本发明通过对NCBI的refseq数据库进行人功能未知预测基因检索,获得人未知功能基因序列,进一步利用Human_est数据库通过BLASTn方法进行序列校正,根据校正后得到的序列设计基因特异引物,从混合人组织cDNA文库中通过两步法通量化RT-PCR技术扩增得到目的基因的编码区cDNA片段。此编码区cDNA片段与pcDT重组构建真核表达载体。然后采用双荧光素酶报告基因法检测ELK1IF1、2、3、4、5、6、7、8基因对ELK1的影响。该方法采用的是体内信号转导途径顺式报导系统,其中所用的ELK1-luc报告质粒载有萤火虫荧光素酶基因,该基因的表达由合成的启动子所调控,其中包含基本的启动子元件(TATA box),以及转录因子ELK1的结合位点,ELK1-luc报告质粒的结构图如图2所示。当细胞内的ELK1通过某种信号转导途径而被活化时,ELK1便会结合于报告质粒ELK1-luc的增强子元件,从而启动报告基因萤火虫荧光素酶基因的转录,进一步胞内翻译成荧光素酶,导致细胞内荧光素酶数量增加,活性增强;相反,当细胞内的ELK1活化受到抑制的时候,荧光素酶的表达量及活性就低。所以,通过检测荧光素酶的活性,便可以反映不同刺激物以及共转染的目的基因对细胞内ELK1是否具有促进活化或者抑制活化的功能。pRL-SV40报告质粒载体如图2所示,含有水母荧光素酶基因,该基因的表达由猿猴病毒40(SV40)增强子/启动子所调控,转染哺乳动物细胞后可以产生较强的基本水平的水母荧光素酶的表达,且表达的活性不受ELK1活化与否的调节,所以在实验中用作内对照报告基因。实验表明本发明的多肽具有显著、稳定的影响ELK1活性的作用。
由于采用了以上技术方案,本发明具有如下优点 1、提供了规模化克隆和筛选新基因的技术平台。
2、提供了人类新功能基因ELK1IF1、2、3、4、5、6、7、8的cDNA序列及其编码多肽; 3、首次发现人类新功能基因ELK1IF1、2、3、4、5、6、7、8具有影响ELK1活性的作用,并且高效、稳定; 4、ELK1IF1、2、3、4、5、6、7、8在机体多数正常细胞表达,说明其为自身重要的ELK1调控分子。
5、基于上述的4个优点,本发明为进一步研究ELK1IF1、2、3、4、5、6、7、8与ELK1之间的调控关系,以及开发治疗与增殖和肌肉分化相关疾病或肿瘤的新药物,为开创新的临床诊断、疗效评价及预后指标奠定必要的基础。



图1、真核表达载体pcDT-ELK1IFx的构建示意图(x选自1、2、3、4、5、6、7、8之一)。
图2、pELK1-luc荧光素酶基因报告质粒的结构图(2A)和pRL-TK报告质粒结构图(2B)。
图3、ELK1IF1、2、3、4、5外源表达抑制PMA对ELK1的活化 图4、ELK1IF6、7、8外源表达促进ELK1活化
具体实施例方式 下面结合具体实施例和附图,进一步阐述本发明。这些实施例和附图仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,如《分子克隆实验指南》(2002年第三版[美]萨姆布鲁克等箸,科学出版社)中所述的条件,或按照制造厂商所建议的条件。
实施例1、两步法通量化RT-PCR技术扩增目的基因 (1)对NCBI的refseq数据库进行人功能未知预测基因检索,获得人未知功能基因序列,并利用Human_est数据库通过BLASTn方法进行序列校正,最终得到的序列设定为下组序列SEQID NO.1、SEQ ID NO.3、SEQ ID NO.5、SEQ ID NO.7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ ID NO15。根据此类序列设计基因ELK1IF1、2、3、4、5、6、7、8的特异引物 (2)用上述引物,按目的基因的表达谱在现有的cDNA文库和肿瘤文库中选择模板,进行初扩。现有的文库包括12种人体正常组织(心、胰、睾丸、卵巢、前列腺、结肠、小肠、骨骼肌、胸腺、淋巴结、扁桃体、白细胞);6种人肿瘤组织(肺癌、胰腺癌、卵巢癌、前列腺癌、结肠癌、乳腺癌);和8种胎儿组积(胎肺、胎心、胎肝、胎脾、胎肾、胎脑、胎骨骼肌、胎胸腺)的cDNA文库(Clonetch,K1420-1,1241-1)。初扩反应条件如下 50μl PCR反应 PCR延伸时间根据所扩目的基因的最长片段,按50sec/Kb的原则进行扩增
初扩产物纯化到30μl,以去除PCR反应体系中大量的引物及dNTPs等,并浓缩整个体系,得到对应目的基因序列的二级扩增库,作为二扩(大扩)的模板。
(3)将(2)中的纯化产物作为模板,分别对每个目的基因进行二扩,反应条件如下 50μl PCR(每个基因)反应 PCR延伸时间根据所扩目的基因的最长片段,按50sec/Kb的原则进行扩增
得到的PCR产物取10μl上样电泳,挑选有扩增条带的PCR产物,进行等体积纯化(40μl)。通过两步PCR反应扩增出非单一条带的基因用Qiagen胶回收试剂盒切胶回收目的片段。扩增的结果表明,这些组织的细胞中都存在基因ELK1IF1、2、3、4、5、6、7、8的cDNA,说明ELK1IF1、2、3、4、5、6、7、8在这些组织的细胞中都产生了基因ELK1IF1、2、3、4、5、6、7、8的转录产物,有较广的表达图谱,在多种组织中参与转录因子的调节。
实施例2、目的基因真核表达载体的构建 将二扩纯化产物和真核表达载体pcDNA3.1/V5-His-TOPO(Invitrogen,缩写为pcDT),按照试剂盒制造厂商建议的条件进行连接反应。连接产物电击法转化大肠杆菌DH5α,转化物在含氨苄青霉素的固体LB平板培养基上生长,挑选生长的单一克隆菌落,提取质粒,用EcoRI酶切,酶切产物用琼脂糖凝胶电泳鉴定,挑选有插入片段的阳性克隆,通过测序(ABI PRISM 3700 DNA分析仪)选出正确的正向插入克隆,各自命名为pcDT-ELK1IF1、2、3、4、5、6、7、8。
同时收集培养液,用SDS-PAGE分析沉淀蛋白,获得ELK1IF1、2、3、4、5、6、7、8多肽。
ELK1IF1、2、3、4、5、6、7、8蛋白分析结果显示ELK1IF1、2、3、4、5、6、7、8蛋白序列如下组序列SEQ ID NO.2、SEQ ID NO.4、SEQ ID NO.6、SEQ ID NO.8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16所示。
实施例3、双荧光素酶报告基因法测定目的基因对PMA+离子霉素诱导ELK1活化的抑制作用。
用目的基因和报告基因pELK1-luc,pRL-TK共转染人胚胎肾293T细胞,通过分别检测两种荧光素酶活性来测定ELK1的活性。共转染的方法为阳离子非脂性转染法,采用威格拉斯生物技术(北京)有限公司,按产品说明书所述进行。
转染操作步骤如下 (1)细胞培养将293T细胞(ATCC NumberCRL-11268)(2.0×104)用含10%胎牛血清的DMEM(Dulbecco’s modified Eagle’s medium)培养基(Hyclone,SH0022.02)铺在96孔细胞培养板(Costar,3599)上,接种密度1.2万/孔,培养基体积100ul/孔,在5%CO2,37℃的培养箱中培养18-24小时。
(2)制备转染复合物 取2.5μl生理盐水稀释40ng报告基因pELK1-luc,4ng pRL-TK和50ng目的质粒,缓慢混合均匀;同样用2.5μl生理盐水稀释适当量的vigofect(一般为0.04μl/孔),缓慢混合均匀,在室温下放置5分钟,与稀释的DNA缓慢混合,室温放置15分钟,以形成转染复合物。
(3)转染将转染复合物缓慢滴入细胞培养板(5μl/孔),轻微摇匀。5%CO2,37℃的培养箱中培养18-24小时。
转染18-24小时后用PMA(十四酸佛波酯,Calbiochem,524400,终浓度50ng/ml)+离子霉素(Calbiochem,407950,终浓度1μM)刺激细胞,37℃孵箱培养。6-8小时后弃去培养液,加入Passive Lysis Buffer(Promega,E1960),放入-80℃冰箱。检测时,取出细胞板,室温下自然解冻,使细胞完全裂解,10μl细胞裂解液移至白色荧光板,加入Dual-luciferase双报告系统检测底物,用微孔板酶标仪(Genios Pro,Tecan)检测荧光素酶活性。
设定转染pcDB空载体、PMA+离子霉素刺激时细胞内的荧光素酶活性比值(萤火虫荧光素酶荧光强度/水母荧光素酶荧光强度表示)为1,其他条件下细胞内的荧光素酶活性比值以此为标准,用相对值表示。结果参照图3,分别用待检质粒和pELK1-luc共转染293T细胞,用PMA+离子霉素刺激的293T细胞中荧光素酶的活性明显地下调,表明ELK1IF1、2、3、4、5在293T细胞中的表达产物对PMA+离子霉素诱导ELK1活化有强的抑制作用。
根据以上实验结果可以确定,当ELK1表达水平的上调引起与某些疾病相关基因的转录表达相应增加时,ELK1IF1、2、3、4、5对ELK1活化的抑制作用可以阻止该疾病的发生和发展。因此,本发明可以用于制备预防和治疗由于ELK1过表达而引起的神经系统疾病或肿瘤的药物。
实施例4、双荧光素酶报告基因法测定目的基因对ELK1活化的促进作用。
除不用刺激物刺激外,其余实验过程与步骤同实施例3。
结果参照图4,分别用待检质粒和pELK1-luc共转染293T细胞,以转染空载体pcDB时荧光素酶活性比值为标准100%,待检质粒可明显促进ELK1的活化,pELK1-luc荧光素酶活性明显上调,表明ELK1IF6、7、8在293T细胞中的表达产物对ELK1活化有强的促进作用。
根据以上实验结果可以确定,当ELK1表达水平的下调引起与某些疾病相关基因的转录表达相应减少时,ELK1IF6、7、8对ELK1活化的促进作用可以阻止该疾病的发生和发展。因此,本发明可以用于制备预防和治疗由于ELK1表达较少引起的神经系统疾病或肿瘤的药物。
实施例5、抗体制备 抗原选用原核细胞或真核细胞表达的ELK1IF1、2、3、4、5、6、7、8蛋白全长或部分肽段,也可以合成多肽作为抗原。
多克隆抗体的制备免疫动物选用成年雄性新西兰兔或BALb/c小鼠,初次免疫用200ug(新西兰兔)或20ug(BALb/c小鼠)抗原与等体积弗氏完全佐剂(FCA)充分乳化后,于背部皮下多点注射。初次免疫后21、42、63天,用弗氏不完全佐剂(FIA)完全乳化的抗原蛋白,各加强免疫1次,用量同前。每次免疫后7~10天,ELISA方法检测血清效价,达到1×10-4时,放血分离血清.Western blot鉴定抗体特异性。
单克隆抗体制备免疫BALb/c小鼠同前,取脾脏制成B细胞悬液,与对数生长期的骨髓瘤细胞SP2/0融合,通过HAT(H次黄嘌呤;A氨基喋呤;T胸腺嘧啶核苷)选择性培养,获得杂交细胞系,再通过ELISA方法检测抗体效价,筛选出特定的杂交瘤细胞系,并得到单克隆抗体。
序列表
<110>北京诺赛基因组研究中心有限公司
<120>影响ELK1活性的多核苷酸及其编码多肽和用途
<130>
<160>16
<170>PatentIn version 3.3
<210>1
<211>1989
<212>DNA
<213>人
<220>
<221>CDS
<222>(258)..(1598)
<400>1
ggtccggatt ctccgatgcg aggtcctcct cccagggccc ggggctgggg agcggaagcc 60
atcagtgggc tcggaggaca ctgtcccagc caggacacgg ccatcggtca ctaatctgca120
gcaccggaat gtccccaggc caatcagcgg gcccagcctg actcctggag attgtgaata180
gctccatcca gcctgagaaa caagccgggt ggctgagcca ggctgtgcac ggagcgcctg240
acgggcccaa cagaccc atg ctg cat cca gag acc tcc cct ggc cgg ggg 290
Met Leu His Pro Glu Thr Ser Pro Gly Arg Gly
1 5 10
cat ctc ctg gct gtg ctc ctg gcc ctc ctt ggc acc gcc tgg gca gag 338
His Leu Leu Ala Val Leu Leu Ala Leu Leu Gly Thr Ala Trp Ala Glu
15 20 25
gtg tgg cca ccc cag ctg cag gag cag gct ccg atg gcc gga gcc ctg 386
Val Trp Pro Pro Gln Leu Gln Glu Gln Ala Pro Met Ala Gly Ala Leu
30 35 40
aac agg aag gag agt ttc ttg ctc ctc tcc ctg cac aac cgc ctg cgc 434
Asn Arg Lys Glu Ser Phe Leu Leu Leu Ser Leu His Asn Arg Leu Arg
45 50 55
agc tgg gtc cag ccc cct gcg gct gac atg cgg agg ctg gac tgg agt482
Ser Trp Val Gln Pro Pro Ala Ala Asp Met Arg Arg Leu Asp Trp Ser
60 65 70 75
gac agc ctg gcc cag ctg gct caa gcc agg gca gcc ctc tgt gga acc530
Asp Ser Leu Ala Gln Leu Ala Gln Ala Arg Ala Ala Leu Cys Gly Thr
80 85 90
cca acc ccg agc ctg gcg tcc ggc ctg tgg cgc acc ctg caa gtg ggc578
Pro Thr Pro Ser Leu Ala Ser Gly Leu Trp Arg Thr Leu Gln Val Gly
95 100 105
tgg aac atg cag ctg cta ccc gcg ggc ttg gcg tcc ttt gtc gaa gtg626
Trp Asn Met Gln Leu Leu Pro Ala Gly Leu Ala Ser Phe Val Glu Val
110 115 120
gtc agc cta tgg ttt gca gag ggg cag cgg tac agc cac gcg gca gga674
Val Ser Leu Trp Phe Ala Glu Gly Gln Arg Tyr Ser His Ala Ala Gly
125 130 135
gag tgt gct cgc aac gcc acc tgc acc cac tac acg cag ctc gtg tgg722
Glu Cys Ala Arg Asn Ala Thr Cys Thr His Tyr Thr Gln Leu Val Trp
140 145 150 155
gcc acc tca agc cag ctg ggc tgt ggg cgg cac ctg tgc tct gca ggc770
Ala Thr Ser Ser Gln Leu Gly Cys Gly Arg His Leu Cys Ser Ala Gly
160 165 170
cag gca gcg ata gaa gcc ttt gtc tgt gcc tac tcc ccc aga ggc aac818
Gln Ala Ala Ile Glu Ala Phe Val Cys Ala Tyr Ser Pro Arg Gly Asn
175 180 185
tgg gag gtc aac ggg aag aca atc gtc ccc tat aag aag ggt gcc tgg866
Trp Glu Val Asn Gly Lys Thr Ile Val Pro Tyr Lys Lys Gly Ala Trp
190 195 200
tgt tcg ctc tgc aca gcc agt gtc tca ggc tgc ttc aaa gcc tgg gac914
Cys Ser Leu Cys Thr Ala Ser Val Ser Gly Cys Phe Lys Ala Trp Asp
205 210 215
cat gca ggg ggg ctc tgt gag gtc ccc agg aat cct tgt cgc atg agc962
His Ala Gly Gly Leu Cys Glu Val Pro Arg Asn Pro Cys Arg Met Ser
220 225 230 235
tgc cag aac cat gga cgt ctc aac atc agc acc tgc cac tgc cac tgt1010
Cys Gln Asn His Gly Arg Leu Asn Ile Ser Thr Cys His Cys His Cys
240 245 250
ccc cct ggc tac acg ggc aga tac tgc caa gtg agg tgc agc ctg cag1058
Pro Pro Gly Tyr Thr Gly Arg Tyr Cys Gln Val Arg Cys Ser Leu Gln
255 260 265
tgt gtg cac ggc cgg ttc cgg gag gag gag tgc tcg tgc gtc tgt gac1106
Cys Val His Gly Arg Phe Arg Glu Glu Glu Cys Ser Cys Val Cys Asp
270 275 280
atc ggc tac ggg gga gcc cag tgt gcc acc aag gtg cat ttt ccc ttc1154
Ile Gly Tyr Gly Gly Ala Gln Cys Ala Thr Lys Val His Phe Pro Phe
285 290 295
cac acc tgt gac ctg agg atc gac gga gac tgc ttc atg gtg tct tca1202
His Thr Cys Asp Leu Arg Ile Asp Gly Asp Cys Phe Met Val Ser Ser
300 305 310 315
gag gca gac acc tat tac aga gcc agg atg aaa tgt cag agg aaa ggc1250
Glu Ala Asp Thr Tyr Tyr Arg Ala Arg Met Lys Cys Gln Arg Lys Gly
320 325 330
ggg gtg ctg gcc cag atc aag agc cag aaa gtg cag gac atc ctc gcc1298
Gly Val Leu Ala Gln Ile Lys Ser Gln Lys Val Gln Asp Ile Leu Ala
335 340 345
ttc tat ctg ggc cgc ctg gag acc acc aac gag gtg att gac agt gac1346
Phe Tyr Leu Gly Arg Leu Glu Thr Thr Asn Glu Val Ile Asp Ser Asp
350 355 360
ttc gag acc agg aac ttc tgg atc ggg ctc acc tac aag acc gcc aag1394
Phe Glu Thr Arg Asn Phe Trp Ile Gly Leu Thr Tyr Lys Thr Ala Lys
365 370 375
gac tcc ttc cgc tgg gcc aca ggg gag cac cag gcc ttc acc agt ttt1442
Asp Ser Phe Arg Trp Ala Thr Gly Glu His Gln Ala Phe Thr Ser Phe
380 385 390 395
gcc ttt ggg cag cct gac aac cac ggg ttt ggc aac tgc gtg gag ctg1490
Ala Phe Gly Gln Pro Asp Asn His Gly Phe Gly Asn Cys Val Glu Leu
400 405 410
cag gct tca gct gcc ttc aac tgg aac gac cag cgc tgc aaa acc cga1538
Gln Ala Ser Ala Ala Phe Asn Trp Asn Asp Gln Arg Cys Lys Thr Arg
415 420 425
aac cgt tac atc tgc cag ttt gcc cag gag cac atc tcc cgg tgg ggc 1586
Asn Arg Tyr Ile Cys Gln Phe Ala Gln Glu His Ile Ser Arg Trp Gly
430 435 440
cca ggg tcc tga ggcctgacca catggctccc tcgcctgccc tgggagcacc 1638
Pro Gly Ser
445
ggctctgctt acctgtctgc ccacctgtct ggaacaaggg ccaggttaag accacatgcc 1698
tcatgtccaa agaggtctca gaccttgcac aatgccagaa gttgggcaga gagaggcagg 1758
gaggccagtg agggccaggg agtgagtgtt agaagaagct ggggcccttc gcctgctttt 1818
gattgggaag atgggcttca attagatggc gaaggagagg acaccgccag tggtccaaaa 1878
aggctgctct cttccacctg gcccagaccc tgtggggcag cggagcttcc ctgtggcatg1938
aaccccacgg ggtattaaat tatgaatcag ctgaaaaaaa aaaaaaaaaa a 1989
<210>2
<211>446
<212>PRT
<213>人
<400>2
Met Leu His Pro Glu Thr Ser Pro Gly Arg Gly His Leu Leu Ala Val
1 5 10 15
Leu Leu Ala Leu Leu Gly Thr Ala Trp Ala Glu Val Trp Pro Pro Gln
20 25 30
Leu Gln Glu Gln Ala Pro Met Ala Gly Ala Leu Asn Arg Lys Glu Ser
35 40 45
Phe Leu Leu Leu Ser Leu His Asn Arg Leu Arg Ser Trp Val Gln Pro
50 55 60
Pro Ala Ala Asp Met Arg Arg Leu Asp Trp Ser Asp Ser Leu Ala Gln
65 70 75 80
Leu Ala Gln Ala Arg Ala Ala Leu Cys Gly Thr Pro Thr Pro Ser Leu
85 90 95
Ala Ser Gly Leu Trp Arg Thr Leu Gln Val Gly Trp Asn Met Gln Leu
100 105 110
Leu Pro Ala Gly Leu Ala Ser Phe Val Glu Val Val Ser Leu Trp Phe
115 120 125
Ala Glu Gly Gln Arg Tyr Ser His Ala Ala Gly Glu Cys Ala Arg Asn
130 135 140
Ala Thr Cys Thr His Tyr Thr Gln Leu Val Trp Ala Thr Ser Ser Gln
145 150 155 160
Leu Gly Cys Gly Arg His Leu Cys Ser Ala Gly Gln Ala Ala Ile Glu
165 170 175
Ala Phe Val Cys Ala Tyr Ser Pro Arg Gly Asn Trp Glu Val Asn Gly
180 185 190
Lys Thr Ile Val Pro Tyr Lys Lys Gly Ala Trp Cys Ser Leu Cys Thr
195 200 205
Ala Ser Val Ser Gly Cys Phe Lys Ala Trp Asp His Ala Gly Gly Leu
210 215 220
Cys Glu Val Pro Arg Asn Pro Cys Arg Met Ser Cys Gln Asn His Gly
225 230 235 240
Arg Leu Asn Ile Ser Thr Cys His Cys His Cys Pro Pro Gly Tyr Thr
245 250 255
Gly Arg Tyr Cys Gln Val Arg Cys Ser Leu Gln Cys Val His Gly Arg
260 265 270
Phe Arg Glu Glu Glu Cys Ser Cys Val Cys Asp Ile Gly Tyr Gly Gly
275 280 285
Ala Gln Cys Ala Thr Lys Val His Phe Pro Phe His Thr Cys Asp Leu
290 295 300
Arg Ile Asp Gly Asp Cys Phe Met Val Ser Ser Glu Ala Asp Thr Tyr
305 310 315 320
Tyr Arg Ala Arg Met Lys Cys Gln Arg Lys Gly Gly Val Leu Ala Gln
325 330 335
Ile Lys Ser Gln Lys Val Gln Asp Ile Leu Ala Phe Tyr Leu Gly Arg
340 345 350
Leu Glu Thr Thr Asn Glu Val Ile Asp Ser Asp Phe Glu Thr Arg Asn
355 360 365
Phe Trp Ile Gly Leu Thr Tyr Lys Thr Ala Lys Asp Ser Phe Arg Trp
370 375 380
Ala Thr Gly Glu His Gln Ala Phe Thr Ser Phe Ala Phe Gly Gln Pro
385 390 395 400
Asp Asn His Gly Phe Gly Asn Cys Val Glu Leu Gln Ala Ser Ala Ala
405 410 415
Phe Asn Trp Asn Asp Gln Arg Cys Lys Thr Arg Asn Arg Tyr Ile Cys
420 425 430
Gln Phe Ala Gln Glu His Ile Ser Arg Trp Gly Pro Gly Ser
435 440 445
<210>3
<211>3959
<212>DNA
<213>人
<220>
<221>CDS
<222>(108)..(929)
<400>3
ctagacgcgc ggcgcattca ggttctcctg gaccgtagtg gtagtcgctg gcccgagtta 60
gaggccagct gagaagtctt cgtgcttcag atttgtttac ctacaaa atg ctt cgg116
Met Leu Arg
1
tat cca tat ttt tgt aga atg tat aaa gaa tgc ctt tca tgt tgg ttg164
Tyr Pro Tyr Phe Cys Arg Met Tyr Lys Glu Cys Leu Ser Cys Trp Leu
5 10 15
gaa tct ggc ata cct aat tta ggt gtc tgg cca aac aga ata cat act212
Glu Ser Gly Ile Pro Asn Leu Gly Val Trp Pro Asn Arg Ile His Thr
20 25 30 35
aca gca gaa aaa tat aga gaa tat gaa gcc cgg gag caa aca gat caa260
Thr Ala Glu Lys Tyr Arg Glu Tyr Glu Ala Arg Glu Gln Thr Asp Gln
40 45 50
act caa gcc cag gag tta cac aga tct caa gat aga gat ttt gaa act308
Thr Gln Ala Gln Glu Leu His Arg Ser Gln Asp Arg Asp Phe Glu Thr
55 60 65
atg gct aaa tta cat att cca gta atg gtg gat gaa gtt gtt cat tgt356
Met Ala Lys Leu His Ile Pro Val Met Val Asp Glu Val Val His Cys
70 75 80
ttg tca cca caa aaa gga cag att ttt cta gat atg aca ttt ggt tcg404
Leu Ser Pro Gln Lys Gly Gln Ile Phe Leu Asp Met Thr Phe Gly Ser
85 90 95
gga ggg cac aca aaa gcc att ctg cag aag gag tca gat att gtt ctc452
Gly Gly His Thr Lys Ala Ile Leu Gln Lys Glu Ser Asp Ile Val Leu
100 105 110 115
tat gcc ttg gac aga gac cca aca gct tat gca tta gct gaa cat ctt500
Tyr Ala Leu Asp Arg Asp Pro Thr Ala Tyr Ala Leu Ala Glu His Leu
120 125 130
tca gag ttg tat cct aaa caa atc cga gct atg ctg ggc cag ttc agc548
Ser Glu Leu Tyr Pro Lys Gln Ile Arg Ala Met Leu Gly Gln Phe Ser
135 140 145
cag gca gaa gcc tta tta atg aaa gct gga gtg cag cca gga act ttt596
Gln Ala Glu Ala Leu Leu Met Lys Ala Gly Val Gln Pro Gly Thr Phe
150 155 160
gat gga gtt ctt atg gat ctt ggg tgt tcc tcc atg caa ctt gat act644
Asp Gly Val Leu Met Asp Leu Gly Cys Ser Ser Met Gln Leu Asp Thr
165 170 175
cct gaa aga ggt ttt tcc ctt cgg aaa gat ggc cct ttg gac atg aga692
Pro Glu Arg Gly Phe Ser Leu Arg Lys Asp Gly Pro Leu Asp Met Arg
180 185 190 195
atg gat ggt ggc agg tac cct gac atg ccc act gct gct gat gtt gtg740
Met Asp Gly Gly Arg Tyr Pro Asp Met Pro Thr Ala Ala Asp Val Val
200 205 210
aat gct tta gat caa cag gca ctt gca tct atc cta aga aca tac ggg788
Asn Ala Leu Asp Gln Gln Ala Leu Ala Ser Ile Leu Arg Thr Tyr Gly
215 220 225
gag gag aag cat gcc aag aaa atc gct tca gca att gtt cag gca cgc836
Glu Glu Lys His Ala Lys Lys Ile Ala Ser Ala Ile Val Gln Ala Arg
230 235 240
agc atc tac ccc atc acc aga acc cag cag ctt gcc agc atc gtt gca884
Ser Ile Tyr Pro Ile Thr Arg Thr Gln Gln Leu Ala Ser Ile Val Ala
245 250 255
gaa tac tct gaa aca tat ttc cca gtg gcc caa act ctt tat tag 929
Glu Tyr Ser Glu Thr Tyr Phe Pro Val Ala Gln Thr Leu Tyr
260 265 270
gaaaatggac gaattgaata gcaaatggag catttcctcc ctctgctatt tatacacgga 989
aagacttact acagcgatct acccatattg ccaccaagac tttccaggct cttcgcatat1049
ttgtgaacaa tgagctcaat gaactctaca cgggactgaa gacagctcag aagtttctga1109
gacctggtgg tcgtcttgtt gccctctcct tccattcact agaggatcgc atcgtcaaaa1169
gatttttgct tggaataagc atgacagaaa gatttaacct aagtgttaga caacaagtga1229
tgaaaacatc tcaattgggt tcagatcacg aaaacacgga agaagtctct atgagaagag1289
ctcctttaat gtgggaattg atacacaaga aggtacttag tccacaagat caggatgtac1349
aagataaccc cagagggcgc tcagccaagc ttagagcagc tatcaaatta taagttatca1409
tcatcttatt cttcaaattt ttttctcaca atttctctaa tctttactca tgttatgtcc1469
ctgaatgtct tggtataggt ttaagtgtgg gacagtctga aaattgatag catttagcat1529
ttcttttttc tcaaaaagaa actgtaggaa atacatgaca gagaaagtta cactcaggga1589
gcagcagcac ctccagactg gaaaaatgtg ttaatctttg catcatattg gactcttgaa1649
ggcaatcctt cctctggcca ggaaattttt taaaaaataa tactgtgttg tgtttatcta1709
aatacgtaaa ctcaagctac caaagagaaa gatgttgtaa tcatatctgc atgtcctaaa1769
ttttgaattt agatattcca atttgcatca gtctttctgt ggctcaaata atgatgatta1829
tggaatgaat tttaatgtcc ctacttgtga ataattagct ttctcaaatg taggcttttt1889
acaaatttta aattttaaaa tattagttta aatgtgtgtt atactgataa aatttcatct1949
ttcaaattat agtctattat tttaaaggga tttttcagta tgatatgggc cattttgttc2009
atctatcgca aagtaaaaat gtaaaatcct tacagagaat tgtttcacaa aacttatatt2069
tcatgtcaat tgtatttatt ttaataatag ctcacaatgc ctttagtaag taataaagtc2129
tcttattaga atcttgtatt ttttaattga gctaatcaaa ataattcagc caagtctatt2189
tgaaatagaa aactgtctat ttaatatagt aaaatcaatg ctcccttaat gttgttacaa2249
agatatggta actgtaatat gggtaaaagt ttattcaaga aaagagtact tggtagaaga2309
ttctttaaca aattgaggag attgattcat aattcacatg tcaatttttt atagtaatat2369
gtacttctaa tttattattt atacttaaat tgtgacctga aagatgagtt ggagataatt2429
agtcaaaggg cacatggagt atggaagggg gcatgttgat taaccataca tagaaataaa2489
tattctctta gttatccttg aaatcatatt tatactatta atttgctcag tgcacttttt2549
tcaaatacag aaaaaagatt ctccattata gttacaaatt ttaggttggt gaatccaagt2609
gaatgaaata tcagcataac tatgtgggca aaatagatag aattaaatgc atgaattttc2669
ctcagactta ttttatctgc ctctgtaata tttaacttta gtacccaggc ttgttcacta2729
cttctgcttt acaggcttta tttaaatctg aacaatccta cagggaaatc agaattagga2789
aaaaaatctg gagaacaata tggttgaaat agaaacaaga gaatgcacct aggttaattc2849
cctgaatcct acttgaacat tgtataaatt tctctttgca tataatacat atttgtgaat2909
gagacatatt cccaaaaaat tcttatctct gtatgtgatt ggaaaagaaa agatcacatt2969
tgtatattca acaatctttc acctatttca taagtcattt tttcaccctg tatagtatgg3029
gaattatttt ttatgttaaa tagaaactga atgtactggg ttgaatggtg tcctctccaa3089
aattcatgta cttcctggag cctcagtatg tgaccttatt tggaaatact gtggttgtgg3149
ttgtaagtag ctaagatgag gtcatactgg agcagggcag gcccttaatc caatatgact3209
ggtgttcctt ataagagaag atagggcggg catggtggct cacgcctgta atcccagcac3269
tgtgggaggc caagccaggc aaatcgcttg aggctgagga gttcaagacc agcctggcca3329
acatggcgaa aacccatctc tactaaaaat aaaattagcc atgcgtggtg cttgtaatgt3389
cagctaccca ggagtctgag gcacaagaat cactcgaacc tgggaggtgg aggttgcgag3449
atcacaccac tgcactccag tgtgagcaac agaacgagac tctgtctcaa aaaaaaaaaa3509
aaaaaaggga agaaagagaa gatagagaca caggggagaa tgccacatga agctggaggc3569
agagattgga gtgatacatt gtgggaaccc tcagaagata ggaaaaaagc atggaataga3629
ttctccctca gagttccagt agttgccaac cctgctaaca tggttttgca catctagcat3689
ccagaacagt gagaatgtat ttctgctgtt ttaaggtacc cagttcatgg taatttgtta3749
cagcaatcct aggaagctaa tactctgaca gaaaaaaatc ttggataata tgcatgagaa3809
aaatccttca ataaacacaa aattggtttc aaaatgtttt catgtaaaaa taaattaact3869
tttctgtaat tagattgtgt tttatagtaa ttcttgcctg cttcttagtc tttgttgtag3929
gatgcataat aaaatacatg aatgagtttt 3959
<210>4
<211>273
<212>PRT
<213>人
<400> 4
Met Leu Arg Tyr Pro Tyr Phe Cys Arg Met Tyr Lys Glu Cys Leu Ser
1 5 10 15
Cys Trp Leu Glu Ser Gly Ile Pro Asn Leu Gly Val Trp Pro Asn Arg
20 25 30
Ile His Thr Thr Ala Glu Lys Tyr Arg Glu Tyr Glu Ala Arg Glu Gln
35 40 45
Thr Asp Gln Thr Gln Ala Gln Glu Leu His Arg Ser Gln Asp Arg Asp
50 55 60
Phe Glu Thr Met Ala Lys Leu His Ile Pro Val Met Val Asp Glu Val
65 70 75 80
Val His Cys Leu Ser Pro Gln Lys Gly Gln Ile Phe Leu Asp Met Thr
85 90 95
Phe Gly Ser Gly Gly His Thr Lys Ala Ile Leu Gln Lys Glu Ser Asp
100 105 110
Ile Val Leu Tyr Ala Leu Asp Arg Asp Pro Thr Ala Tyr Ala Leu Ala
115 120 125
Glu His Leu Ser Glu Leu Tyr Pro Lys Gln Ile Arg Ala Met Leu Gly
130 135 140
Gln Phe Ser Gln Ala Glu Ala Leu Leu Met Lys Ala Gly Val Gln Pro
145 150 155 160
Gly Thr Phe Asp Gly Val Leu Met Asp Leu Gly Cys Ser Ser Met Gln
165 170 175
Leu Asp Thr Pro Glu Arg Gly Phe Ser Leu Arg Lys Asp Gly Pro Leu
180 185 190
Asp Met Arg Met Asp Gly Gly Arg Tyr Pro Asp Met Pro Thr Ala Ala
195 200 205
Asp Val Val Asn Ala Leu Asp Gln Gln Ala Leu Ala Ser Ile Leu Arg
210 215 220
Thr Tyr Gly Glu Glu Lys His Ala Lys Lys Ile Ala Ser Ala Ile Val
225230 235 240
Gln Ala Arg Ser Ile Tyr Pro Ile Thr Arg Thr Gln Gln Leu Ala Ser
245 250 255
Ile Val Ala Glu Tyr Ser Glu Thr Tyr Phe Pro Val Ala Gln Thr Leu
260 265 270
Tyr
<210>5
<211>1680
<212>DNA
<213>人
<220>
<221>CDS
<222>(224)..(781)
<400>5
agagagctgt ttactaggca cgactgcgaa ggcaaggggg caccagctca ggactgcatc 60
tgcctgccat ttcccttcca ctcctccttt ctggagtctg acattagaaa gccagcgaga120
aggaagattc aaacaaccaa ccctgatttc ctgcttctcc ttttcatgag tgttcctgtg180
gtctctgcac ctcctttctg tcccccggca gagggcagta gag atg gcc ggc cca 235
Met Ala Gly Pro
1
agg tct cgg tgg cgc gac cag ctg ctg ttc atg agc atc ata gtc ctc 283
Arg Ser Arg Trp Arg Asp Gln Leu Leu Phe Met Ser Ile Ile Val Leu
5 10 15 20
gtg att gtg gtc atc tgc ctg atg tta tac gct ctt ctc tgg gag gct 331
Val Ile Val Val Ile Cys Leu Met Leu Tyr Ala Leu Leu Trp Glu Ala
25 30 35
ggc aac ctc act gac ctg ccc aac ctg aga atc ggc ttc tat aac ttc 379
Gly Asn Leu Thr Asp Leu Pro Asn Leu Arg Ile Gly Phe Tyr Asn Phe
40 45 50
tgc ctg tgg aat gag gac acc agc acc cta cag tgt cac cag ttc cct 427
Cys Leu Trp Asn Glu Asp Thr Ser Thr Leu Gln Cys His Gln Phe Pro
55 60 65
gag ctg gaa gcc ctg ggg gtg cct cgg gtt ggc ctg ggc ctg gcc agg 475
Glu Leu Glu Ala Leu Gly Val Pro Arg Val Gly Leu Gly Leu Ala Arg
70 75 80
ctt ggc gtg tac ggg tcc ctg gtc ctc acc ctc ttt gcc ccc cag cct 523
Leu Gly Val Tyr Gly Ser Leu Val Leu Thr Leu Phe Ala Pro Gln Pro
85 90 95 100
ctc ctc cta gcc cag tgc aac agt gat gag aga gtg tgg cgg ctg gca 571
Leu Leu Leu Ala Gln Cys Asn Ser Asp Glu Arg Val Trp Arg Leu Ala
105 110 115
gtg ggc ttc ctg gct gtg tcc tct gtg ctg ctg gca ggc ggc ctg ggc 619
Val Gly Phe Leu Ala Val Ser Ser Val Leu Leu Ala Gly Gly Leu Gly
120 125 130
ctc ttc ctc tcc tat gtg tgg aag tgg gtc agg ctc tcc ctc ccg ggg 667
Leu Phe Leu Ser Tyr Val Trp Lys Trp Val Arg Leu Ser Leu Pro Gly
135 140 145
cct ggg ttt cta gct ctg ggc agc gcc cag gcc tta ctc atc ctc ttg 715
Pro Gly Phe Leu Ala Leu Gly Ser Ala Gln Ala Leu Leu Ile Leu Leu
150 155 160
ctt ata gcc atg gct gtg ttc cct ctg agg gct gag agg gct gag agc 763
Leu Ile Ala Met Ala Val Phe Pro Leu Arg Ala Glu Arg Ala Glu Ser
165 170 175 180
aag ctt gag agc tgc taa aggcttacgt gattgcaagg gttcagttcc 811
Lys Leu Glu Ser Cys
185
aaccatggtc agaggtggca catctgctca gccatctcat tttacagcta acgctgatct 871
ccagctccag cgatggaacc cactacagag gaggtggggc ccctgtgtca aagaggccga 931
ggggcagcaa gggcagccag ggcacctgtg acttcttagt acaagattgt ctgtccttca 991
ggacttccaa ggctcccaaa gactccctaa accatgcagc tcattgtcac accaattcct1051
gctttaatta atggatctga gcaaatcttc ctctagcttc aggagggtgg ggagggagtg 1111
attgctgtca tggggccaga cttccaggct gatttgccaa atgccaaaat gaaacctagc1171
aaagaactta cggcaacaaa cgaggacatt aaaagagcga gcacctcagt gtctctgggg1231
acatggttaa ggagcttcca ctcagcccac catagtgagt gggccgccat aagccatcac1291
tggaactcca accccagagg tccaggagtg atctctgagt gactcaacaa agacaggaca1351
catggggtac aaagacaagg cttgactgct tcaaagcttc cctggacctg aagccagaca1411
gggcagaggc gtccgctgac aaatcactcc catgatgaga ccctggagga ctccaaatcc1471
tcgctgtgaa caggactgga cggttgcgca caaacaaacg ctgccaccct ccacttccca1531
acccagaact tggaaagaca ttagcacaac ttacgcattg gggaattgtg tgtattttct1591
agcacttgtg tattggaaaa cctgtatggc agtgatttat tcatatattc ctgtccaaag1651
ccacactgaa aacagaggca gagacatgt 1680
<210>6
<211>185
<212>PRT
<213>人
<400> 6
Met Ala Gly Pro Arg Ser Arg Trp Arg Asp Gln Leu Leu Phe Met Ser
1 5 10 15
Ile Ile Val Leu Val Ile Val Val Ile Cys Leu Met Leu Tyr Ala Leu
20 25 30
Leu Trp Glu Ala Gly Asn Leu Thr Asp Leu Pro Asn Leu Arg Ile Gly
35 40 45
Phe Tyr Asn Phe Cys Leu Trp Asn Glu Asp Thr Ser Thr Leu Gln Cys
50 55 60
His Gln Phe Pro Glu Leu Glu Ala Leu Gly Val Pro Arg Val Gly Leu
65 70 75 80
Gly Leu Ala Arg Leu Gly Val Tyr Gly Ser Leu Val Leu Thr Leu Phe
85 90 95
Ala Pro Gln Pro Leu Leu Leu Ala Gln Cys Asn Ser Asp Glu Arg Val
100 105 110
Trp Arg Leu Ala Val Gly Phe Leu Ala Val Ser Ser Val Leu Leu Ala
115 120 125
Gly Gly Leu Gly Leu Phe Leu Ser Tyr Val Trp Lys Trp Val Arg Leu
130 135 140
Ser Leu Pro Gly Pro Gly Phe Leu Ala Leu Gly Ser Ala Gln Ala Leu
145 150 155 160
Leu Ile Leu Leu Leu Ile Ala Met Ala Val Phe Pro Leu Arg Ala Glu
165 170 175
Arg Ala Glu Ser Lys Leu Glu Ser Cys
180 185
<210>7
<211>1195
<212>DNA
<213>人
<220>
<221>CDS
<222>(137)..(703)
<400>7
ggcacgaggc gccagtcccc taaccctgag gctgccgcgc ggcggtcact gcgccggggt 60
agtgggcccc agtgttgcgc tctctggccg ttccttacac tttgcttcag gctccagtgc120
aggggcgtag tgggat atg gcc aac tcg ggc tgc aag gac gtc acg ggt cca172
Met Ala Asn Ser Gly Cys Lys Asp Val Thr Gly Pro
1 5 10
gat gag gag agt ttt ctg tac ttt gcc tac ggc agc aac ctg ctg aca220
Asp Glu Glu Ser Phe Leu Tyr Phe Ala Tyr Gly Ser Asn Leu Leu Thr
15 20 25
gag agg atc cac ctc cga aac ccc tcg gcg gcg ttc ttc tgt gtg gcc268
Glu Arg Ile His Leu Arg Asn Pro Ser Ala Ala Phe Phe Cys Val Ala
30 35 40
cgc ctg cag gat ttt aag ctt gac ttt ggc aat tcc caa ggc aaa aca316
Arg Leu Gln Asp Phe Lys Leu Asp Phe Gly Asn Ser Gln Gly Lys Thr
45 50 55 60
agt caa act tgg cat gga ggg ata gcc acc att ttt cag agt cct ggc364
Ser Gln Thr Trp His Gly Gly Ile Ala Thr Ile Phe Gln Ser Pro Gly
65 70 75
gat gaa gtg tgg gga gta gta tgg aaa atg aac aaa agc aat tta aat412
Asp Glu Val Trp Gly Val Val Trp Lys Met Asn Lys Ser Asn Leu Asn
80 85 90
tct ctg gat gag caa gaa ggg gtt aaa agt gga atg tat gtt gta ata460
Ser Leu Asp Glu Gln Glu Gly Val Lys Ser Gly Met Tyr Val Val Ile
95 100 105
gaa gtt aaa gtt gca act caa gaa gga aaa gaa ata acc tgt cga agt508
Glu Val Lys Val Ala Thr Gln Glu Gly Lys Glu Ile Thr Cys Arg Ser
110 115 120
tat ctg atg aca aat tac gaa agt gct ccc cca tcc cca cag tat aaa556
Tyr Leu Met Thr Asn Tyr Glu Ser Ala Pro Pro Ser Pro Gln Tyr Lys
125 130 135 140
aag att att tgc atg ggt gca aaa gaa aat ggt ttg ccg ctg gag tat604
Lys Ile Ile Cys Met Gly Ala Lys Glu Asn Gly Leu Pro Leu Glu Tyr
145 150 155
caa gag aag tta aaa gca ata gaa cca aat gac tat aca gga aag gtc652
Gln Glu Lys Leu Lys Ala Ile Glu Pro Asn Asp Tyr Thr Gly Lys Val
160 165 170
tca gaa gaa att gaa gac atc atc aaa aag ggg gaa aca caa act ctt700
Ser Glu Glu Ile Glu Asp Ile Ile Lys Lys Gly Glu Thr Gln Thr Leu
175 180 185
tag aacataacag aatatatcta agggtattct atgtgctaat ataaaatatt 753
tttaacactt gagaacaggg atctggggga tctccacgtt tgatccgttt tcagcagtgc 813
tctgaaggag tatcttactt gggtgattcc ttgtttttag actataaaaa gaaactggga 873
taggagttag acaatttaaa aggggtgtat gagggcctga aatatgtgac aaatgaatgt 933
gagtacccct tctgtgaaca ctgaaagcta ttctcttgaa ttgatcttaa gtgtctcctt 993
gctctggtaa aagatagatt tgtagctcac ttgatgatgg tgctggtgaa ttgctctgct1053
ctgtctgaga tttttaaaaa tcagcttaat gagagtaatc tgcagacaat tgataataac1113
attttgaaaa ttggaaagat ggtatactgt ttttagagga ataaacgtat ttgtggttta 1173
aaaaaaaaaa aaaaaaaaaa aa 1195
<210>8
<211>188
<212>PRT
<213>人
<400>8
Met Ala Asn Ser Gly Cys Lys Asp Val Thr Gly Pro Asp Glu Glu Ser
1 5 10 15
Phe Leu Tyr Phe Ala Tyr Gly Ser Asn Leu Leu Thr Glu Arg Ile His
20 25 30
Leu Arg Asn Pro Ser Ala Ala Phe Phe Cys Val Ala Arg Leu Gln Asp
35 40 45
Phe Lys Leu Asp Phe Gly Asn Ser Gln Gly Lys Thr Ser Gln Thr Trp
50 55 60
His Gly Gly Ile Ala Thr Ile Phe Gln Ser Pro Gly Asp Glu Val Trp
65 70 75 80
Gly Val Val Trp Lys Met Asn Lys Ser Asn Leu Asn Ser Leu Asp Glu
85 90 95
Gln Glu Gly Val Lys Ser Gly Met Tyr Val Val Ile Glu Val Lys Val
100 105 110
Ala Thr Gln Glu Gly Lys Glu Ile Thr Cys Arg Ser Tyr Leu Met Thr
115 120 125
Asn Tyr Glu Ser Ala Pro Pro Ser Pro Gln Tyr Lys Lys Ile Ile Cys
130 135 140
Met Gly Ala Lys Glu Asn Gly Leu Pro Leu Glu Tyr Gln Glu Lys Leu
145 150 155 160
Lys Ala Ile Glu Pro Asn Asp Tyr Thr Gly Lys Val Ser Glu Glu Ile
165 170 175
Glu Asp Ile Ile Lys Lys Gly Glu Thr Gln Thr Leu
180 185
<210>9
<211>1817
<212>DNA
<213>人
<220>
<221>CDS
<222>(292)..(771)
<400>9
aaaaatcaga ataagaagta cctgacatac tttctacatc tgtagttgcg gaagacattt 60
taataggtct tctcatagcc tttctttgct aaggacattg tgactctcca gagagcaaca120
gtgatggctc tagaatgtct aggaaaaaga agggcttaat gtcaggagtc tgcttggggc180
acacaacact agaagatgtc cttctgcaca ttgtttcata tcgagtatgg aacccttcag 240
atcaaagctt accaataaat tcagtatgta gaacagatta acgtagttga a atg agg 297
Met Arg
1
aag aat gag agt tat ctc aac cag cca gca ccc cct atc ccc att ccc345
Lys Asn Glu Ser Tyr Leu Asn Gln Pro Ala Pro Pro Ile Pro Ile Pro
5 10 15
aca ctt tcc ctc atg gga ggc tgt cgg gag cac ttc gaa aac cac tgg393
Thr Leu Ser Leu Met Gly Gly Cys Arg Glu His Phe Glu Asn His Trp
20 25 30
aaa ggc cgg gca cgg tgg ctc atg cct gta atc cca gca ctt tgg gag441
Lys Gly Arg Ala Arg Trp Leu Met Pro Val Ile Pro Ala Leu Trp Glu
35 40 45 50
gcc aag gca ggc aga tca cct gag gtc agg agt tcg aaa cca gcc tgg489
Ala Lys Ala Gly Arg Ser Pro Glu Val Arg Ser Ser Lys Pro Ala Trp
55 60 65
cca aca tgg cga aac ccc atc ttt act aaa aat acg aaa att agc cag537
Pro Thr Trp Arg Asn Pro Ile Phe Thr Lys Asn Thr Lys Ile Ser Gln
70 75 80
gta tta gaa tta ttt ctg aat tat cag tct ctc att tgt gct ttg gag585
Val Leu Glu Leu Phe Leu Asn Tyr Gln Ser Leu Ile Cys Ala Leu Glu
85 90 95
aag cag aaa agg caa aag ggg tct ttg gcc atc ttc tgc tgg agc ttc633
Lys Gln Lys Arg Gln Lys Gly Ser Leu Ala Ile Phe Cys Trp Ser Phe
100 105 110
cag gga gga tgt gtc tcc aag aga cca gat gta ccg agt ttg aaa tcc681
Gln Gly Gly Cys Val Ser Lys Arg Pro Asp Val Pro Ser Leu Lys Ser
115 120 125 130
cag aag ccc aag agg aaa aga atc aca ggg agg aaa aga ctg tcc aaa729
Gln Lys Pro Lys Arg Lys Arg Ile Thr Gly Arg Lys Arg Leu Ser Lys
135 140 145
ggc ttc tgg agt ctt ctg ttc tct aac ctt gga agg ttt tga771
Gly Phe Trp Ser Leu Leu Phe Ser Asn Leu Gly Arg Phe
150 155
acaatatttc tcagaggata gcctttcact tattcatctg tccagcatga ctcatccccg 831
ggagtgttga gtaagtgaaa ttttgctgta ttcatgtttt tgtgacttat aaaataggat 891
gataaggaga gaacatgaac tctggagtca gacctgttac ctcggacatg atactcttag 951
ctttgtcatt tagtatttga gtaattttgg gcaagctaac atctctggtc gttctcatct1011
gtaaaatgag aataaatgaa acccactaac cagaattggt atgaaaatga aatgtggcag1071
aaaaaaaatg aaagtgaata gtatcaccac tgacacacaa gcactaaagg cccttcctgt1131
ctccatcagg tatggatttg gggcaacatt tggccaggtc ttgtttatct ttctgttcat1191
ctattctgtc taattcagtg ctttgtttac aacgaatgtc ttacaaatgc tgactgaaca1251
ctagcatacc tgcatgaaca acaggtaaat aaattttaga tgtgttttaa tgtttattaa1311
tctatcctgt cagagaagaa ctgccagtta tagataaata tgatgccagg tcagggctga1371
agagttgggc aggttgttat ctgcatgggg tcactaggtt ccagtggaga ggtgggggct1431
aagctctcac ccgctctgca gccacctggc acccggtttc agtttcctga aagggagcct1491
tctacttgct gacgactgcc tcatctcttc tgaggtttcc tctgataaac aattttctct1551
gctttttttt tttaattatg aaatacttaa aatgtaaagg agataatgtg acacacattt1611
acccataatt gagattgcca taattgctat aactttttca aaattttgac ttaatttcag1671
acttttagaa aaattggcca ggtgtgatgg ctcatgcctg taatcccagc actttgggag1731
gccaaggtgg gtaaattact tgaacccagc agttcgagac ttgcctgggc ggcatagtga1791
gaccttgtct ctactgaaaa caaact 1817
<210>10
<211>159
<212>PRT
<213>人
<400>10
Met Arg Lys Asn Glu Ser Tyr Leu Asn Gln Pro Ala Pro Pro Ile Pro
1 5 10 15
Ile Pro Thr Leu Ser Leu Met Gly Gly Cys Arg Glu His Phe Glu Asn
20 25 30
His Trp Lys Gly Arg Ala Arg Trp Leu Met Pro Val Ile Pro Ala Leu
35 40 45
Trp Glu Ala Lys Ala Gly Arg Ser Pro Glu Val Arg Ser Ser Lys Pro
50 55 60
Ala Trp Pro Thr Trp Arg Asn Pro Ile Phe Thr Lys Asn Thr Lys Ile
65 70 75 80
Ser Gln Val Leu Glu Leu Phe Leu Asn Tyr Gln Ser Leu Ile Cys Ala
85 90 95
Leu Glu Lys Gln Lys Arg Gln Lys Gly Ser Leu Ala Ile Phe Cys Trp
100 105 110
Ser Phe Gln Gly Gly Cys Val Ser Lys Arg Pro Asp Val Pro Ser Leu
115 120 125
Lys Ser Gln Lys Pro Lys Arg Lys Arg Ile Thr Gly Arg Lys Arg Leu
130 135 140
Ser Lys Gly Phe Trp Ser Leu Leu Phe Ser Asn Leu Gly Arg Phe
145 150 155
<210>11
<211>1615
<212>DNA
<213>人
<220>
<221>CDS
<222>(193)..(1086)
<400>11
ggagcagaac cgctccccgc cggctgtccg caacctccgc cagcgtcggt ccctgggcag 60
gtgtgggtgg aatgcatcct tgggacatct ttgcatagcc ccatctagga agaagttctg120
tgatgtgtga actgtgagtt tactcaaaca agtccaactc tttataagac ataggtagac180
gtcaggtctg ga atg gaa gag cca aca gca gta gaa ggc cag gtc cag ctt231
Met Glu Glu Pro Thr Ala Val Glu Gly Gln Val Gln Leu
1 5 10
cca agc ccc cac cag ggc tct ctc agg aag gct gtg gct gct gcc ctg 279
Pro Ser Pro His Gln Gly Ser Leu Arg Lys Ala Val Ala Ala Ala Leu
15 20 25
gcg ctg gat ggg gaa tcc aca atg ggg cac agg aaa aag aag agg aaa 327
Ala Leu Asp Gly Glu Ser Thr Met Gly His Arg Lys Lys Lys Arg Lys
30 35 40 45
gag tca cgc cca gaa tcc atc atc atc tac cgc tca gac aat gag aaa 375
Glu Ser Arg Pro Glu Ser Ile Ile Ile Tyr Arg Ser Asp Asn Glu Lys
50 55 60
aca gat gag gag ccc gga gaa tca gaa ggt gga gat cag cct aaa gag 423
Thr Asp Glu Glu Pro Gly Glu Ser Glu Gly Gly Asp Gln Pro Lys Glu
65 70 75
gag gag gga gat gat ttc cta gac tat cct gtg gat gat gat atg tgg 471
Glu Glu Gly Asp Asp Phe Leu Asp Tyr Pro Val Asp Asp Asp Met Trp
80 85 90
aac ctg cct ctg gac agc cgc tac gtc acc tta act ggg acc atc aca 519
Asn Leu Pro Leu Asp Ser Arg Tyr Val Thr Leu Thr Gly Thr Ile Thr
95 100 105
cga ggg aag aaa aag ggt cag atg gtg gac atc cat gtc aca ttg aca 567
Arg Gly Lys Lys Lys Gly Gln Met Val Asp Ile His Val Thr Leu Thr
110 115 120 125
gag aaa gag ctg cag gaa ctg acc aaa cct aaa gag tca tca agg gaa 615
Glu Lys Glu Leu Gln Glu Leu Thr Lys Pro Lys Glu Ser Ser Arg Glu
130 135 140
acg acg cct gaa gga aga atg gcc tgc cag atg gga gct gac cgt ggg 663
Thr Thr Pro Glu Gly Arg Met Ala Cys Gln Met Gly Ala Asp Arg Gly
145 150 155
ccc cat gtg gtc ctc tgg acg ctg atc tgc ctg cct gtg gtt ttc atc 711
Pro His Val Val Leu Trp Thr Leu Ile Cys Leu Pro Val Val Phe Ile
160 165 170
ctt tct ttt gtt gtc tct ttc tac tac ggc act atc acc tgg tac aac 759
Leu Ser Phe Val Val Ser Phe Tyr Tyr Gly Thr Ile Thr Trp Tyr Asn
175 180 185
atc ttc ctc gtg tat aat gag gaa agg acc ttc tgg cac aag atc tcg 807
Ile Phe Leu Val Tyr Asn Glu Glu Arg Thr Phe Trp His Lys Ile Ser
190 195 200 205
tat tgc cct tgc ctc gtt ctc ttc tat cca gtg ctc atc atg gcc atg 855
Tyr Cys Pro Cys Leu Val Leu Phe Tyr Pro Val Leu Ile Met Ala Met
210 215 220
gct tct tcc ctc ggc ctc tac gct gct gtg gtc cag ctc tcg tgg tcc 903
Ala Ser Ser Leu Gly Leu Tyr Ala Ala Val Val Gln Leu Ser Trp Ser
225 230 235
tgg gaa gca tgg tgg caa gct gcc cgg gac atg gag aaa ggc ttc tgt 951
Trp Glu Ala Trp Trp Gln Ala Ala Arg Asp Met Glu Lys Gly Phe Cys
240 245 250
ggc tgg ctc tgc agc aag ctg ggt ctg gag gac tgt tct ccc tac agc 999
Gly Trp Leu Cys Ser Lys Leu Gly Leu Glu Asp Cys Ser Pro Tyr Ser
255 260 265
att gtg gag ttg ctt gaa tcc gac aat atc tca agc act ctc tcc aac 1047
Ile Val Glu Leu Leu Glu Ser Asp Asn Ile Ser Ser Thr Leu Ser Asn
270 275 280 285
aag gac ccc atc caa gaa gta gaa acc tcc acg gtc taa actcccaaca 1096
Lys Asp Pro Ile Gln Glu Val Glu Thr Ser Thr Val
290 295
acttactccc tcctctggcc ccagtagcct atatatcatc ttaaaattcc agcagattat1156
ttctttaaat taccccctac tctccgcagt tcttctggga aatcagagtc catactgatc1216
agttttacca tcttgagggt tccaggaggg catggagcag acaagcaatt gtgccaaagc1276
agttcaccca atggacaaac tctttttgat tccctgccct aaaatcacca tttatttagg1336
acaatggaac tctgctgtgt gtcgttttgg gagcctggaa gtgttactgg tgcctggaac1396
tgaggggagt atgtgactaa atgtgtcagg gagaataaag aacctcgggg taaccaaatc 1456
caccaagata atagacaggg atggagtgag acatttagga agctggacta ccacagtgta1516
gcagaaggta aagatttgtg tgtatcattt agatttagat ttagctgcat agaattaaaa1576
ccctaaaata tcagtggctt aaacaaaaaa aaaaaaaaa 1615
<210>12
<211>297
<212>PRT
<213>人
<400>12
Met Glu Glu Pro Thr Ala Val Glu Gly Gln Val Gln Leu Pro Ser Pro
1 5 10 15
His Gln Gly Ser Leu Arg Lys Ala Val Ala Ala Ala Leu Ala Leu Asp
20 25 30
Gly Glu Ser Thr Met Gly His Arg Lys Lys Lys Arg Lys Glu Ser Arg
35 40 45
Pro Glu Ser Ile Ile Ile Tyr Arg Ser Asp Asn Glu Lys Thr Asp Glu
50 55 60
Glu Pro Gly Glu Ser Glu Gly Gly Asp Gln Pro Lys Glu Glu Glu Gly
65 70 75 80
Asp Asp Phe Leu Asp Tyr Pro Val Asp Asp Asp Met Trp Asn Leu Pro
85 90 95
Leu Asp Ser Arg Tyr Val Thr Leu Thr Gly Thr Ile Thr Arg Gly Lys
100 105 110
Lys Lys Gly Gln Met Val Asp Ile His Val Thr Leu Thr Glu Lys Glu
115 120 125
Leu Gln Glu Leu Thr Lys Pro Lys Glu Ser Ser Arg Glu Thr Thr Pro
130 135 140
Glu Gly Arg Met Ala Cys Gln Met Gly Ala Asp Arg Gly Pro His Val
145 150 155 160
Val Leu Trp Thr Leu Ile Cys Leu Pro Val Val Phe Ile Leu Ser Phe
165 170 175
Val Val Ser Phe Tyr Tyr Gly Thr Ile Thr Trp Tyr Asn Ile Phe Leu
180 185 190
Val Tyr Asn Glu Glu Arg Thr Phe Trp His Lys Ile Ser Tyr Cys Pro
195 200 205
Cys Leu Val Leu Phe Tyr Pro Val Leu Ile Met Ala Met Ala Ser Ser
210 215 220
Leu Gly Leu Tyr Ala Ala Val Val Gln Leu Ser Trp Ser Trp Glu Ala
225 230 235 240
Trp Trp Gln Ala Ala Arg Asp Met Glu Lys Gly Phe Cys Gly Trp Leu
245 250 255
Cys Ser Lys Leu Gly Leu Glu Asp Cys Ser Pro Tyr Ser Ile Val Glu
260 265 270
Leu Leu Glu Ser Asp Asn Ile Ser Ser Thr Leu Ser Asn Lys Asp Pro
275 280 285
Ile Gln Glu Val Glu Thr Ser Thr Val
290 295
<210>13
<211>1731
<212>DNA
<213>人
<220>
<221>CDS
<222>(454)..(1227)
<400>13
gcaagccgga gccctggggt tgggcagcac tcggttccgt gcaactttca agtgagttgc 60
gaactccgcc ctgtaggccg gtgctggtgg cccggcgcgc tggaaccgcg gcgacccgct120
ccagcgcggg accagcagca agggccgagc gccaggttct ccgcggcaga aagggcgggt180
gggagctgta actgccccgg ccgcggggcg cgcccgctcc caagtcggct tcctccccgc240
cggggccgct ttgcctcggg tctccccatt ctccaggtcc cctgaactgc acagtcggag300
gccgtgggcg gcgggctctg cctccgccga gggacagccg gatcgcccct ctgcttcccg360
caactgccct gatcaccccc cgtcccagcc cttgagtgaa cgtccttctg agcggcttcc420
tggggtcctc cccacgtccc aaaggccggc aag atg gtg tcc tgg atg atc tgt 474
Met Val Ser Trp Met Ile Cys
1 5
cgc ctg gtg gtg ctg gtg ttt ggg atg ctg tgt cca gct tat gct tcc 522
Arg Leu Val Val Leu Val Phe Gly Met Leu Cys Pro Ala Tyr Ala Ser
10 15 20
tat aag gct gtg aag acc aag aac att cgt gaa tat gtg cgg tgg atg 570
Tyr Lys Ala Val Lys Thr Lys Asn Ile Arg Glu Tyr Val Arg Trp Met
25 30 35
atg tac tgg att gtt ttt gca ctc ttc atg gca gca gag atc gtt aca 618
Met Tyr Trp Ile Val Phe Ala Leu Phe Met Ala Ala Glu Ile Val Thr
40 45 50 55
gac att ttt atc tcc tgg ttc cct ttc tac tat gag atc aag atg gcc 666
Asp Ile Phe Ile Ser Trp Phe Pro Phe Tyr Tyr Glu Ile Lys Met Ala
60 65 70
ttc gtg ctg tgg ctg ctc tca ccc tac acc aag ggc gcc agc ctg ctt 714
Phe Val Leu Trp Leu Leu Ser Pro Tyr Thr Lys Gly Ala Ser Leu Leu
75 80 85
tac cgc aag ttt gtc cac ccg tcc ctg tcc cgc cat gag aag gag atc 762
Tyr Arg Lys Phe Val His Pro Ser Leu Ser Arg His Glu Lys Glu Ile
90 95 100
gac gcg tac atc gtg cag gcc aag gag cgc agc tac gag acc gtg ctc 810
Asp Ala Tyr Ile Val Gln Ala Lys Glu Arg Ser Tyr Glu Thr Val Leu
105 110 115
agc ttc ggg aag cgg ggc ctc aac att gcc gcc tcc gct gct gtg cag 858
Ser Phe Gly Lys Arg Gly Leu Asn Ile Ala Ala Ser Ala Ala Val Gln
120 125 130 135
gct gcc acc aag agt cag ggg gcg ctg gcc ggc agg ctg cgg agc ttc 906
Ala Ala Thr Lys Ser Gln Gly Ala Leu Ala Gly Arg Leu Arg Ser Phe
140 145 150
tcc atg cag gac ctg cgc tcc atc tct gac gca cct gcc cct gcc tac 954
Ser Met Gln Asp Leu Arg Ser Ile Ser Asp Ala Pro Ala Pro Ala Tyr
155 160 165
cat gac ccc ctc tac ctg gag gac cag gtg tcc cac cag agg cca ccc1002
His Asp Pro Leu Tyr Leu Glu Asp Gln Val Ser His Gln Arg Pro Pro
170 175 180
att ggg tac cgg gcc ggg ggc ctg cag gac agc gac acc gag gat gag1050
Ile Gly Tyr Arg Ala Gly Gly Leu Gln Asp Ser Asp Thr Glu Asp Glu
185 190 195
tgt tgg tca gat act gag gca gtc ccc cgg gcg cca gcc cgg ccc cga1098
Cys Trp Ser Asp Thr Glu Ala Val Pro Arg Ala Pro Ala Arg Pro Arg
200 205 210 215
gag aag ccc cta atc cgc agc cag agc ctg cgt gtg gtc aag agg aag 1146
Glu Lys Pro Leu Ile Arg Ser Gln Ser Leu Arg Val Val Lys Arg Lys
220 225 230
cca ccg gtg cgg gag ggc acc tcg cgc tcc ctg aag gtt cgg acg agg 1194
Pro Pro Val Arg Glu Gly Thr Ser Arg Ser Leu Lys Val Arg Thr Arg
235 240 245
aaa aag act gtg ccc tca gac gtg gac agc tag ggtctgctgc atctgccccc1247
Lys Lys Thr Val Pro Ser Asp Val Asp Ser
250 255
ttcttacctc gtgccctgca gggctccagg gctatttgga gggaccttgg gctgcacatc1307
tggcctgcct gcaccagctg cctgggcccc accctcctga ctcctgctga tggttaaggg1367
ccgggagcag atgctgccaa ggccacatgc agggatgcac ccacaatgta ccaaagcagg1427
ctgggcccag ggttctattt attgccttgc tctgccctct cccttccccg gttgtgggac1487
aagagccctc cctgaacccc tgcaaccctc cctgaacccc tgcaaatgaa accaaacgtc1547
cacctgggtg tgttcattcc ttcctgtcct tcaaagtact tgatagcctt tcataaggcc1607
tggcacatgt gtcctggttg tgtgtgtgtg tgttggtgag tgaggtcagg tttgcgagtg1667
ttttgataaa taaatacata aaggggcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa1727
aaaa 1731
<210>14
<211>257
<212>PRT
<213>人
<400>14
Met Val Ser Trp Met Ile Cys Arg Leu Val Val Leu Val Phe Gly Met
1 5 10 15
Leu Cys Pro Ala Tyr Ala Ser Tyr Lys Ala Val Lys Thr Lys Asn Ile
20 25 30
Arg Glu Tyr Val Arg Trp Met Met Tyr Trp Ile Val Phe Ala Leu Phe
35 40 45
Met Ala Ala Glu Ile Val Thr Asp Ile Phe Ile Ser Trp Phe Pro Phe
50 55 60
Tyr Tyr Glu Ile Lys Met Ala Phe Val Leu Trp Leu Leu Ser Pro Tyr
65 70 75 80
Thr Lys Gly Ala Ser Leu Leu Tyr Arg Lys Phe Val His Pro Ser Leu
85 90 95
Ser Arg His Glu Lys Glu Ile Asp Ala Tyr Ile Val Gln Ala Lys Glu
100 105 110
Arg Ser Tyr Glu Thr Val Leu Ser Phe Gly Lys Arg Gly Leu Asn Ile
115 120 125
Ala Ala Ser Ala Ala Val Gln Ala Ala Thr Lys Ser Gln Gly Ala Leu
130 135 140
Ala Gly Arg Leu Arg Ser Phe Ser Met Gln Asp Leu Arg Ser Ile Ser
145 150 155 160
Asp Ala Pro Ala Pro Ala Tyr His Asp Pro Leu Tyr Leu Glu Asp Gln
165 170 175
Val Ser His Gln Arg Pro Pro Ile Gly Tyr Arg Ala Gly Gly Leu Gln
180 185 190
Asp Ser Asp Thr Glu Asp Glu Cys Trp Ser Asp Thr Glu Ala Val Pro
195 200 205
Arg Ala Pro Ala Arg Pro Arg Glu Lys Pro Leu Ile Arg Ser Gln Ser
210 215 220
Leu Arg Val Val Lys Arg Lys Pro Pro Val Arg Glu Gly Thr Ser Arg
225 230 235 240
Ser Leu Lys Val Arg Thr Arg Lys Lys Thr Val Pro Ser Asp Val Asp
245 250 255
Ser
<210>15
<211>573
<212>DNA
<213>人
<220>
<221>CDS
<222>(25)..(789)
<400>15
ggcacgaggc tgccctagtg gcct atg tcc ctt gct cgg ggc cat gga gac 51
Met Ser Leu Ala Arg Gly His Gly Asp
1 5
act gcg gcc agt acg gcg gcg cct ctg tct gaa gaa ggg gaa gtg acc 99
Thr Ala Ala Ser Thr Ala Ala Pro Leu Ser Glu Glu Gly Glu Val Thr
10 15 20 25
tcc ggc ctc cag gct ctg gcc gtg gag gat acc gga ggc ccc tct gcc147
Ser Gly Leu Gln Ala Leu Ala Val Glu Asp Thr Gly Gly Pro Ser Ala
30 35 40
tcg gcc ggt aag gcc gag gac gag ggg gaa gga ggc cga gag gag acc 195
Ser Ala Gly Lys Ala Glu Asp Glu Gly Glu Gly Gly Arg Glu Glu Thr
45 50 55
gag cgt gag ggg tcc ggg ggc gag gag gcg cag gga gaa gtc ccc agc243
Glu Arg Glu Gly Ser Gly Gly Glu Glu Ala Gln Gly Glu Val Pro Ser
60 65 70
gct ggg gga gaa gag cct gcc gag gag gac tcc gag gac tgg tgc gtg291
Ala Gly Gly Glu Glu Pro Ala Glu Glu Asp Ser Glu Asp Trp Cys Val
75 80 85
ccc tgc agc gac gag gag gtg gag ctg cct gcg gat ggg cag ccc tgg339
Pro Cys Ser Asp Glu Glu Val Glu Leu Pro Ala Asp Gly Gln Pro Trp
90 95 100 105
atg ccc ccg ccc tcc gaa atc cag cgg ctc tat gaa ctg ctg gct gcc387
Met Pro Pro Pro Ser Glu Ile Gln Arg Leu Tyr Glu Leu Leu Ala Ala
110 115 120
cac ggt act ctg gag ctg caa gcc gag atc ctg ccc cgc cgg cct ccc435
His Gly Thr Leu Glu Leu Gln Ala Glu Ile Leu Pro Arg Arg Pro Pro
125 130 135
acg ccg gag gcc cag agc gaa gag gag aga tcc gat gag gag ccg gag483
Thr Pro Glu Ala Gln Ser Glu Glu Glu Arg Ser Asp Glu Glu Pro Glu
140 145 150
gcc aaa gaa gag gaa gag gaa aaa cca cac atg ccc acg gaa ttt gat531
Ala Lys Glu Glu Glu Glu Glu Lys Pro His Met Pro Thr Glu Phe Asp
155 160 165
ttt gat gat gag cca gtg aca cca aag gac tcc ctg att gac cgg aga579
Phe Asp Asp Glu Pro Val Thr Pro Lys Asp Ser Leu Ile Asp Arg Arg
170 175 180 185
cgc acc cca gga agc tca gcc cgg agc cag aaa cgg gag gcc cgc ctg627
Arg Thr Pro Gly Ser Ser Ala Arg Ser Gln Lys Arg Glu Ala Arg Leu
190 195 200
gac aag gtg ctg tcg gac atg aag aga cac aag aag ctg gag gag cag675
Asp Lys Val Leu Ser Asp Met Lys Arg His Lys Lys Leu Glu Glu Gln
205 210 215
atc ctt cgt acc ggg agg gac ctc ttc agc ctg gac tcg gag gac ccc723
Ile Leu Arg Thr Gly Arg Asp Leu Phe Ser Leu Asp Ser Glu Asp Pro
220 225 230
agc ccc gcc agc ccc cca ctc cga tcc tcc ggg agt agt ctc ttc cct771
Ser Pro Ala Ser Pro Pro Leu Arg Ser Ser Gly Ser Ser Leu Phe Pro
235 240 245
cgg cag cgg aaa tac tga ttcccactgc tcctgcctct agggtgcagt 819
Arg Gln Arg Lys Tyr
250
gtccgtacct gctggagcct gggccctcct tccccagccc agacattgag aaacttggga 879
agaagagaga aacctcaagc tcccaaacag cacgttgcgg gaaagaggaa gagagagtgt 939
gagtgtgtgt gtgtgttttt tctattgaac acctgtagag tgtgtgtgtg tgttttctat 999
tgaacaccta tagagagagt gtgtgtgttt tctattgaac atctatatag agagagtgtg1059
tgagtgtgtg ttttctattg aacacctatt cagagacctg gactgaattt tctgagtctg1119
aaataaaaga tgcagagcta tcatctctta aaaaaaaaaa aaaaaaaaaa aaaa 1173
<210>16
<211>254
<212>PRT
<213>人
<400>16
Met Ser Leu Ala Arg Gly His Gly Asp Thr Ala Ala Ser Thr Ala Ala
1 5 10 15
Pro Leu Ser Glu Glu Gly Glu Val Thr Ser Gly Leu Gln Ala Leu Ala
20 25 30
Val Glu Asp Thr Gly Gly Pro Ser Ala Ser Ala Gly Lys Ala Glu Asp
35 40 45
Glu Gly Glu Gly Gly Arg Glu Glu Thr Glu Arg Glu Gly Ser Gly Gly
50 55 60
Glu Glu Ala Gln Gly Glu Val Pro Ser Ala Gly Gly Glu Glu Pro Ala
65 70 75 80
Glu Glu Asp Ser Glu Asp Trp Cys Val Pro Cys Ser Asp Glu Glu Val
85 90 95
Glu Leu Pro Ala Asp Gly Gln Pro Trp Met Pro Pro Pro Ser Glu Ile
100 105 110
Gln Arg Leu Tyr Glu Leu Leu Ala Ala His Gly Thr Leu Glu Leu Gln
115 120 125
Ala Glu Ile Leu Pro Arg Arg Pro Pro Thr Pro Glu Ala Gln Ser Glu
130 135 140
Glu Glu Arg Ser Asp Glu Glu Pro Glu Ala Lys Glu Glu Glu Glu Glu
145 150 155 160
Lys Pro His Met Pro Thr Glu Phe Asp Phe Asp Asp Glu Pro Val Thr
165 170 175
Pro Lys Asp Ser Leu Ile Asp Arg Arg Arg Thr Pro Gly Ser Ser Ala
180 185 190
Arg Ser Gln Lys Arg Glu Ala Arg Leu Asp Lys Val Leu Ser Asp Met
195 200 205
Lys Arg His Lys Lys Leu Glu Glu Gln Ile Leu Arg Thr Gly Arg Asp
210 215 220
Leu Phe Ser Leu Asp Ser Glu Asp Pro Ser Pro Ala Ser Pro Pro Leu
225 230 235 240
Arg Ser Ser Gly Ser Ser Leu Phe Pro Arg Gln Arg Lys Tyr
245 250
权利要求
1.一种分离的多核苷酸,其特征在于,所述多核苷酸含有编码具有影响ELK1活性的功能的多肽的核苷酸序列,该核苷酸序列选自
(a)与编码含有SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16的氨基酸序列的多肽的多核苷酸有至少70%相似性的多核苷酸;
(b)编码含有与SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16的氨基酸序列有至少70%相似性的氨基酸序列的多肽的多核苷酸;
(c)与(a)或(b)的多核苷酸互补的多核苷酸。
2.如权利要求1所述的多核苷酸,其特征在于,所述多核苷酸编码的多肽具有选自下组的氨基酸序列SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ IDNO12、SEQ ID NO14、SEQ ID NO16。
3.如权利要求1所述的多核苷酸,其特征在于,所述多核苷酸的序列与选自下组的核苷酸序列有至少85%相似性
(a)SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ IDNO11、SEQ ID NO13、SEQ ID NO15的编码区序列或全长序列;
(b)在遗传密码简并范围内相应于(a)中提到的序列的至少一个序列;
(c)与(a)或(b)中提到的序列互补的序列杂交的至少一个序列。
4.如权利要求3所述的多核苷酸,其特征在于,所述多核苷酸的序列选自SEQ ID NO1、SEQ IDNO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9、SEQ ID NO11、SEQ ID NO13、SEQ IDNO15的编码区序列或全长序列。
5.权利要求1所述的多核苷酸编码的多肽,其特征在于,所述多肽包含选自下组中的氨基酸序列的多肽SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQID NO12、SEQ ID NO14、SEQ ID NO16;或与以上任一氨基酸序列具有至少90%相似性的多肽;或其保守性变异多肽、或其活性片段、或其活性衍生物。
6.权利要求5所述的多肽,其特征在于,所述多肽具有选自下组的氨基酸序列SEQ ID NO2、SEQ ID NO4、SEQ ID NO6、SEQ ID NO8、SEQ ID NO10、SEQ ID NO12、SEQ ID NO14、SEQ ID NO16。
7.一种载体,其特征在于,所述载体含有权利要求1所述的多核苷酸。
8.一种遗传工程宿主细胞,其特征在于,所述宿主细胞选自
(a)用权利要求7所述的载体转化或转导的宿主细胞;
(b)用权利要求1所述的多核苷酸转化或转导的宿主细胞。
9.一种抗体,其特征在于,所述抗体是能与权利要求5所述的多肽特异性结合的抗体。
10.一种核酸片段,其特征在于,所述核酸片段含有权利要求1所述的任一多核苷酸中8-100个连续的核苷酸。
11.一种分离的多核苷酸在影响ELK1活性中的应用,其特征在于所述多核苷酸选自权利要求1所述的多核苷酸,该多核苷酸在宿主细胞中外源表达会影响ELK1活性。
12.权利要求11所述的应用,其特征在于所述多核苷酸的序列选自SEQ ID NO1、SEQ ID NO3、SEQ ID NO5、SEQ ID NO7、SEQ ID NO9的编码区序列或全长序列,该多核苷酸在宿主细胞中外源表达会抑制ELK1的活化。
13.权利要求11所述的应用,其特征在于所述多核苷酸的序列选自SEQ ID NO11、SEQ ID NO13、SEQ ID NO15的编码区序列或全长序列,该多核苷酸在宿主细胞中外源表达会促进ELK1的活化。
14.权利要求1所述的多核苷酸或权利要求5所述的多肽在制备预防和/或治疗神经系统疾病或肿瘤的药物中的用途。
15.含有权利要求5所述的多肽和药学上可接受的载体的药物组合物。
16.一种神经系统疾病或肿瘤的体外检测方法,其特征在于,利用权利要求9所述的抗体或权力要求10所述的核酸片段来检测宿主样品中的多肽的存在或水平。
全文摘要
本发明公开了一类新的编码具有影响ELK1活性的功能的人蛋白的多核苷酸及其编码的多肽,多肽的抗体。本发明也公开了这类新的多核苷酸在宿主细胞中外源表达对ELK1活性的影响的应用。本发明还公开了所述多肽、抗体在制备预防和治疗神经系统疾病和肿瘤的药物上的用途。
文档编号C12N15/63GK1952132SQ200510112970
公开日2007年4月25日 申请日期2005年10月18日 优先权日2005年10月18日
发明者高鹏, 高霞, 马曦, 马大龙, 石太平, 张晨颖, 邓唯唯, 马进京, 陆阳, 郭金海, 程华玲, 李娜, 于鹏, 蔡恬静, 王欣宇, 王峰, 童郁蓉 申请人:北京诺赛基因组研究中心有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1