与癌症相关的基因家族的制作方法

文档序号:455388阅读:979来源:国知局
专利名称:与癌症相关的基因家族的制作方法
技术领域
本发明涉及来自癌症病人的人组织中基因表达的变化。具体来说,本发明涉及那些在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌组织中与相应的正常组织相比差异表达的人基因。
背景技术
在美国,有超过100万新发的癌症病例被诊断,大约有50万人死于癌症。癌症的原因是多种多样的,包括遗传倾向、环境影响、传染因素和衰老。这些因素通过脱开广泛的调节和下游效应器途径将正常细胞转化为癌变细胞。有几种基本的细胞生理学变化合在一起共同支配了恶性的生长生长信号的自给自足、对生长抑制信号的不敏感性、程序性细胞死亡的规避、无限的复制潜力、持续的血管生成以及组织侵害和转移(Hanahan和Weinberg(2000),Cell 10057-70)。
到目前为止,研究人员已经能够鉴定许多据信是肿瘤发生的原因的遗传变化。这些遗传变化包括致癌基因的扩增和导致肿瘤抑制基因丧失的突变。致癌基因起初被鉴定为病毒携带的能够引起它们的靶细胞转化的基因。一类主要的病毒致癌基因在细胞中有其对应物,它们参与正常的细胞功能。细胞中的基因被称为原癌基因,在某些病例中,它们在细胞中的突变或畸变与肿瘤的形成相关。致癌基因的产生代表功能的获得,其中细胞内的原癌基因被不适当地激活了。这可以包括蛋白的突变变化、或组成性的活化、过量表达、或不能在适当的时间关闭表达。已经鉴定了大约100个致癌基因。致癌基因的例子包括但不限于ras、fos、myc、abl和myb(Ponder(2001),Nature 411336-341)。肿瘤抑制基因在其野生型等位基因中表达能够抑制异常的细胞增殖的蛋白。当为肿瘤抑制蛋白编码的基因被突变或缺失时,产生的突变蛋白或肿瘤抑制蛋白表达的完全缺失可能不能正确地调控细胞增殖,异常的增殖可能发生,特别是当细胞的调控机制已经存在损伤时。许多已经深入研究的人类肿瘤和肿瘤细胞系失去了或具有无功能的肿瘤抑制基因。肿瘤抑制基因的例子包括但不限于成视网膜细胞瘤易感性基因或RB基因、p53基因、结肠癌缺失(DCC)基因和神经纤维瘤I型(NF-1)肿瘤抑制基因(Weinberg(1991),Science 2541138-1146)。肿瘤抑制基因失去活性或钝化可能在大量人类癌症的起始和/或发展中扮演中心的角色。
利用基因组范围内的表达图谱对肿瘤分类、鉴定药物的靶、鉴定诊断标记物和/或对化疗结果获得进一步的了解,可以便于设计更有效的治疗多种癌症的策略。早期的利用基因表达模式鉴定癌症亚型的研究产生了相当吸引人的结果(参见Perou等(1999),Proc Natl Acad Sci USA 969212-9217;Golub等(1999),Science 286531-537;Alizadeh等(2000),Nature 403503-511;Alon等(1999),Proc Natl Acad Sci USA966745-6750;以及Bittner等(2000),Nature 406536-540;Perou等(2000),Nature 406747-752)。通过基因表达图谱对B细胞淋巴瘤进行分子分类,在临床上阐明了截然不同的弥散性大B细胞淋巴瘤亚类(参见Alizadeh等,同上)。在乳腺癌中,利用有限数量的基因(8102个基因)进行的研究已经基于基因表达图谱将肿瘤分为亚型,这个研究指出了多种与乳腺癌相关的分子表型(参见Perou等,同上)。此外,基因表达图谱已经使研究者能够对数千个基因的组织特异性表达水平作图(Alon等(1999),Proc Natl Acad Sci USA 966745-6750;Iyer等(1999),Science 28383-87;Khan等(1998),Cancer Res 585009-5013;Lee等(1999),Science 2851390-1393;Wang等(1999),Gene 229101-108;Whitney等(1999),Ann Neurol 46425-428)。尽管这些研究已经表明基因表达图谱可以被用于在诊断人类疾病如癌症、以及开发改良的治疗策略方面产生进展,仍然需要进一步的研究。
尽管癌症由于源自于多种组织和具有多种发病因素而具有多样性和异源性,现已提出导致这些可变性的原因只在于相对少量的关键事件,这些事件的聚集是任何和所有癌症发展所必需的(Evan和Vousden(2001),Nature 411342-348)。因此,需要广泛地研究许多不同类型癌症中整体基因表达水平的变化,以鉴定与癌症发生和发展相关的关键分子标记。在本领域还需要能够更准确地诊断癌症的材料与方法。此外,在本领域中对治疗的方法和鉴定能够有效治疗疾病的药剂的方法还存在需要。本发明满足了这些以及其它的需要。
发明概述本发明是基于与正常组织相比在癌症组织中差异表达的新基因,分别称为LFG1、LFG2、LFG3、LFG4、LFG5、LFG6。本发明包括含有SEQ ID NO1、3、5、7、9、11、13或15所示序列或其互补序列的分离的核酸分子。
本发明还包括与一个或多个表达控制元件可操作连接的核酸分子,包括含有分离的核酸分子的载体。本发明还包括转化后含有本发明核酸的宿主细胞,以及生产蛋白的方法,该方法包括在蛋白能够表达的条件下培养用本发明的核酸分子转化的宿主细胞的步骤。
本发明还提供了分离的多肽,选自含有SEQ ID NO2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ ID NO2、4、6、8、10、12、14或16中自然发生氨基酸序列变体的分离的多肽。本发明的多肽还包括这样的一些多肽,它们的氨基酸序列与SEQ ID NO2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%氨基酸序列同一性,与SEQ ID NO2、4、6、8、10、12、14或16中的所述序列优选有至少大约80%、更优选至少大约90-95%,而最优选至少大约95-98%的序列同一性。
本发明还提供了鉴定本发明的多肽家族的其它成员的方法。具体来说,SEQ ID NO1、3、5、7、9、11、13或15的核酸序列,在鉴定编码LFG1、LFG2、LFG3、LFG4、LFG5或LFG6蛋白家族的其它成员的核酸分子的方法中,可以用作探针或用来产生PCR引物。
本发明还提供了能够特异性地与本发明的多肽结合的分离的抗体或抗原结合的抗体片段,包括单克隆抗体和多克隆抗体。
本发明还提供了试剂的鉴定方法,所述试剂调节编码本发明蛋白的核酸分子表达,包括将表达核酸分子的细胞暴露于试剂;以及确定试剂是否调节该核酸分子的表达,从而鉴定能够调节编码蛋白的核酸分子表达的试剂。
本发明还提供了试剂的鉴定方法,所述试剂调节本发明蛋白的水平或至少一种活性,包括将表达蛋白的细胞暴露于试剂;以及确定试剂是否调节该蛋白的水平或至少一种活性,从而鉴定能够调节蛋白的水平或至少一种活性的试剂。
本发明还提供了调节编码本发明蛋白的核酸分子表达的方法,其中包括施用有效量的调节编码蛋白的核酸分子表达的试剂的步骤。本发明还提供了调节本发明蛋白的至少一种活性的方法,其中包括了施用有效量的能够调节本发明蛋白的至少一种活性的试剂的步骤。
本发明还提供了鉴定本发明蛋白的结合配体的方法,其步骤包括将该蛋白暴露于潜在的结合配体;以及确定潜在的结合配体是否与该蛋白结合,从而鉴定蛋白的结合配体。
本发明还提供了能够阻断或调节本发明蛋白与结合配体结合的试剂的鉴定方法。具体来说,通过将本发明蛋白或其片段以及结合配体与待测试剂接触,然后确定待测试剂是否阻断或减少本发明蛋白与结合配体的结合,可以检测该试剂阻断、减少或调节该蛋白与结合配体的结合的能力。
本发明还提供了减少或阻断本发明蛋白与一个或多个结合配体结合的方法,其中包括施用有效量的能够减少或阻断该蛋白与结合配体结合的试剂的步骤。该方法可以利用能够与本发明的蛋白或结合配体结合的试剂。
在本发明的另一方面,本发明的蛋白可以用作合理的药物设计的起始点,以提供配体、治疗药物或其它类型的小化学分子。此外,通过上述筛选方法鉴定的小分子或其它化合物可以在合理的药物设计中作为“前导化合物”。
本发明还涉及了治疗癌症的方法,包括将核酸构建物导入到癌细胞中,该构建物含有与启动子或增强子元件可操作地连接的本发明的核酸分子,以使该核酸分子的表达导致该癌症的抑制。
本发明还包括了经修饰以包含本发明的核酸分子的非人的转基因动物,或经修饰以包含突变的核酸分子的非人的转基因动物,以便编码的本发明多肽的表达被阻止。
本发明也包括非人的转基因动物,其中含有SEQ ID NO1、3、5、7、9、11、13或15中所有或部分的基因的所有或一部分已经从动物的基因组中被敲除或缺失了。
本发明还提供了诊断癌症的方法,其步骤包括从对象获得组织、血液、尿液或其它样品,然后确定本发明的核酸分子或本发明的多肽的表达水平。
本发明还包括了含有稀释剂和多肽或蛋白的组合物,其中的多肽或蛋白选自含有SEQ ID NO2、4、6、8、10、12、14或16中氨基酸序列的分离的多肽、含有SEQ ID NO2、4、6、8、10、12、14或16中至少10个氨基酸片段的分离的多肽、含有SEQ ID NO2、4、6、8、10、12、14或16中保守氨基酸置换的分离的多肽、以及含有SEQ IDNO2、4、6、8、10、12、14或16中自然发生的氨基酸序列变体的分离的多肽,以及氨基酸序列与SEQ ID NO2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%同一性的分离的多肽,与SEQ ID NO2、4、6、8、10、12、14或16中的所述序列优选至少大约80%,更优选至少大约90-95%,而最优选至少大约95-98%的序列同一性。
附图简述

图1显示两个LFG1克隆的相对比对位置。
图2是LFG1-克隆A(SEQ ID NO2)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图3是LFG1-克隆B(SEQ ID NO4)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图4是LFG2(SEQ ID NO6)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图5是LFG3(SEQ ID NO8)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图6是LFG4(SEQ ID NO10)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图7是ALFG5(SEQ ID NO12)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图8显示了两个LFG6克隆的相对比对位置。
图9是LFG6-#20(SEQ ID NO14)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
图10是LFG6-#46(SEQ ID NO16)的可读框编码的蛋白的疏水性分布图。按照Kyte-Doolittle的方法进行分析。
优选实施方案的详细描述I.一般说明本发明部分基于鉴定的新基因家族,它们在癌变人组织中的表达与在正常的人组织中的表达不同。这些基因家族对应于SEQ IDNOS1、3、5、7、9、11、13和15中的人cDNA。
本发明的基因和蛋白可以用做诊断试剂或标记物来检测癌症,或用来将样品中的癌组织与正常组织区别开来。它们也可以用做调节基因表达或活性的试剂的靶。例如,可以鉴定调节与肿瘤生长相关的生物过程,包括癌症的增生过程的试剂。
II.具体的实施方案A.与癌症相关的蛋白本发明提供分离的蛋白、蛋白的等位基因变体、以及发生保守的氨基酸置换的蛋白。本文中使用的“蛋白”或“多肽”部分是指具有SEQ ID NO2、4、6、8、10、12、14或16中描述人的氨基酸序列的蛋白。该术语也指自然发生的等位基因变体以及与上述序列相比具有轻微不同的氨基酸序列的蛋白。等位基因变体,尽管具有与上述序列相比轻微不同的氨基酸序列,它们仍然具有同样或相似的与这些蛋白相关的生物学功能。
本文中使用的与SEQ ID NO2、4、6、8、10、12、14或16中人的氨基酸序列相关的蛋白家族是指已经从人和其它生物体中被分离出来的蛋白。用来鉴定和分离与这些蛋白相关的蛋白家族的其它成员的方法将在下面描述。
本发明的蛋白优选为分离的形式。用于本文中时,当使用物理、机械或化学的方法将蛋白从通常与蛋白结合的细胞成分中取出时,该蛋白被称为分离的。专业技术人员可以容易地使用标准的纯化方法获得被分离的蛋白。
本发明的蛋白还包括SEQ ID NO2、4、6、8、10、12、14或16的插入、缺失或保守氨基酸置换的变体。用于本文中时,保守的变体是指氨基酸序列的改变对蛋白的生物学功能没有负面的影响。当改变的序列阻止或破坏了与蛋白相关的生物学功能时,置换、插入或缺失被称为是有负面影响的。例如,蛋白的总电荷、结构或疏水/亲水性质,在某些情况下可以被改变而对生物学活性没有负面的影响。因此,氨基酸序列可以被改变,例如赋予肽链更高的疏水性或亲水性,而对蛋白的生物学活性没有负面的影响。
一般来说,等位基因变体、保守置换变体和蛋白家族的其它成员,它们含有的氨基酸序列与SEQ ID NO2、4、6、8、10、12、14或16中的所述序列有至少大约50%、60%、70%或75%的氨基酸序列同一性,优选至少大约80%、更优选至少大约90-95%、而最优选至少大约95-98%的序列同一性。这些序列的同一性或同源性在此处定义为在将序列进行比对,并且如果需要就插入空隙(gap)以获得最高的同源性百分数后,候选序列中与SEQ ID NO2、4、6、8、10、12、14或16中的氨基酸残基相同的百分数,保守置换不被当作序列同一性的一部分(相关的参数参见B部分)。融合蛋白、或肽序列中的N-端、C-端或内部延伸、缺失或插入不应被视为影响同源性。
因此,本发明的蛋白包括具有SEQ ID NO2、4、6、8、10、12、14或16中所公开的氨基酸序列的分子;具有这些蛋白的至少大约3、4、5、6、10、15、20、25、30、35或更多的氨基酸残基的连续序列的片段;其中一个或多个氨基酸残基已经被插入到公开的编码序列的N-端或C-端或内部的氨基酸序列变体;以及上述公开序列至少一个氨基酸残基置换的序列变体,或其如前所述的片段。这些片段,也被称为肽或多肽,可以含有抗原区,被鉴定为对应于已知蛋白结构域氨基酸序列区的蛋白功能区,以及具有显著的亲水性的区域。通过使用通常可以获得的序列分析软件例如MacVector(Oxford Molecular)可以容易地鉴定所有这些区域。
预期的变体还包括那些含有预定的突变,例如由同源重组、定点突变或PCR突变引起的变体,以及其它动物中的相应蛋白,其它的动物包括但不限于兔、大鼠、小鼠、猪、牛、羊、马和人以外的灵长类,以及蛋白家族的等位基因或其它自然发生的变体;以及一些衍生物,其中的蛋白已经通过置换、化学、酶学或其它适当的方法用自然存在的氨基酸之外的部分(例如可检测的部分,如酶或放射性同位素)进行了共价修饰。
本发明还提供了含有本发明的蛋白或多肽以及稀释剂的组合物。适合的稀释剂可以是水性或非水性溶剂或它们的组合,并可以含有附加的对蛋白或多肽的稳定性、溶解性、活性和/或储存有利的成分,如水溶性盐或甘油。
正如下面所描述的,蛋白家族的成员可以被用来(1)鉴定调节蛋白的水平或至少一种活性的试剂,(2)鉴定蛋白的结合配体,(3)作为抗原制备多克隆或单克隆抗体,(4)作为治疗药剂或靶,以及(5)作为癌症的诊断试剂或标记物。
B.核酸分子本发明还提供为SEQ ID NO2、4、6、8、10、12、14或16序列的蛋白和本文描述的相关蛋白编码的核酸分子,优选为分离的形式。本文使用的“核酸”被定义为编码前面定义的蛋白或肽的RNA或DNA,与编码这些肽的核酸序列互补的RNA或DNA,在适当的严紧条件下与SEQ ID NO1、3、5、7、9、11、13或15的核酸杂交并与其保持稳定的结合的RNA或DNA,编码的多肽与SEQ ID NO2、4、6、8、10、12、14或16的肽序列具有至少大约50%、60%、70%或75%,优选至少大约80%,更优选至少大约90-95%,最优选至少大约95-98%或更高的同一性的RNA或DNA,或与SEQ ID NO1、3、5、7、9、11、13或15的可读框表现出至少大约50%、60%、70%或75%,优选至少大约80%,更优选至少大约90-95%,最优选至少大约95-98%或更高的核苷酸序列同一性的RNA或DNA。
本发明还包括与SEQ ID NO1、3、5、7、9、11、13或15的互补序列特异性杂交的分离的核酸分子,特别是在可读框内特异性杂交的分子。这样的分子与SEQ ID NO1、3、5、7、9、11、13或15的互补序列一般在严紧的杂交条件下进行特异性杂交。
特别关注的是基因组DNA、cDNA、mRNA和反义分子,以及基于可选择的骨架的核酸或包括可选择碱基的核酸,不论它们是天然来源的还是合成的。但是这些杂交或互补的核酸,也被确定为对于任何现有技术的核酸来说是新的和非显而易见的,包括编码本发明蛋白的核酸,在适当的严紧条件下杂交,或者互补于编码本发明蛋白的核酸的核酸。
核苷酸或氨基酸水平上的同源性或同一性由BLAST(基本局部对比搜索工具)分析来确定,使用专门用于序列相似性检索而制作的程序blastp、blastn,blastx、tblastn和tblastx(Altschul等(1997),Nucleic AcidsRes.253389-3402,以及Karlin等(1990),Proc.Natl.Acad.Sci.USA872264-2268,两者以其全文引入参考)使用的算法来计算。BLAST程序使用的方法首先考虑一个待检索序列和一个数据库序列之间的相似区段,两区段可以存在空隙也可以没有,然后评估所有等同的配对在统计上的显著性,最后只概括出那些显著性满足了预先选定的阈值的配对。对于序列数据库相似性检索的基本论点的讨论参见Altschul等(1994),Nat.Genet.6119-129,以其全文引为参考。用于直方图、描述、比对、预期值(即用于报告与数据库序列配对的统计学重要性的阈值)、截止(点)、矩阵和过滤(低复杂性的检索参数)采用缺省设定。blastp、blastn,blastx、tblastn和tblastx使用的缺省评分矩阵是BLOSUM62矩阵(Henikoff等(1992),Proc.Natl.Acad.Sci.USA 8910915-10919,以其全文引为参考),推荐的待检索序列长度超过85个核苷酸或氨基酸。
对于blastn来说,评分矩阵由M(即一对匹配的残基的奖励分数)与N(即误配残基的处罚分数)的比率来设定,其中M和N的缺省值分别为5和-4。Blastn的四个参数被调整如下Q=10(产生空隙的处罚);R=10(延长空隙的处罚);wink=1(在待检索序列中每个winkth位点产生的字码碰撞);以及gapw=16(设定其内产生带有空隙的比对的窗口宽度)。相应的Blastp的参数设置为Q=9;R=2;wink=1;以及gapw=32。在GCG软件包10.0版中所用的序列间的最优比较,使用了DNA参数GAP=50(产生空隙的处罚)和LEN=3(延长空隙的处罚),在蛋白比较中相应的设置是GAP=8和LEN=2。
“严紧条件”是指(1)洗涤时使用低离子强度和高温,例如0.015MNaCl/0.0015M柠檬酸钠/0.1%SDS,温度为50℃或(2)在杂交过程中使用甲酰胺等变性试剂,例如50%(体积比)的甲酰胺,和0.1%牛血清白蛋白/0.1% Ficoll/0.1%聚乙烯吡咯烷酮/50mM pH6.5的磷酸钠缓冲液,以及750mM NaCl、75mM柠檬酸钠,温度为42□。另一个例子是在50%甲酰胺、5×SSC(0.75M NaCl,0.075M柠檬酸钠)、50mM磷酸钠(pH6.8)、0.1%焦磷酸钠、5×Denhardt氏溶液、超声处理的鲑鱼精子DNA(50μg/ml)、0.1%SDS和10%硫酸葡聚糖中于42□进行杂交,于42□在0.2×SSC和0.1%SDS中洗涤。专业技术人员可以容易地确定和改变严紧条件,使其适合于获得清晰和可检测的杂交信号。优选的分子是那些能够在上述条件下与SEQ ID NO1、3、5、7、9、11、13或15的互补序列杂交、并且编码功能蛋白或全长蛋白的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO1、3、5、7、9、11、13或15的可读框的互补链杂交的分子。
在本文中使用时,核酸分子,当它与编码其它多肽的污染核酸分子基本上分开时,被称为是“分离的”。
本发明还提供了公开的核酸分子的片段。本文中使用的核酸的片段是指编码或非编码序列的一小部分。片段的大小取决于使用的目的。例如,如果希望选择的片段能够编码蛋白的活性部分,则片段必须足够大到编码蛋白的功能区。例如,可以准备出这样的片段,它们编码的肽对应于预测的抗原区域。如果片段被用做核酸探针或PCR引物,那么片段的长度可以选择在探测/引发获得相对小量的假阳性(参见G部分的讨论)。
用作探针或特异性引物进行聚合酶链反应(PCR)、或用来合成编码本发明蛋白的基因序列的本发明核酸分子的片段(即合成的寡核苷酸),可以容易地通过化学技术合成,例如Matteucci等((1981)J.Am.Chem.Soc.1033185-3191)的亚磷酰胺方法或使用自动化合成方法。此外,较大的DNA片段可以通过众所周知的方法容易地制备,例如合成一组代表基因的不同模块区段的寡核苷酸,然后将寡核苷酸进行连接来构建完整的被修饰的基因。
本发明的核酸分子还可以被修饰,使其包含可检测的标记,用于诊断和探测目的。各种这样的标记在本技术领域内是广为人知的,可以容易地与本文描述的编码分子一起使用。合适的标记包括但不限于生物素、放射性标记或荧光标记的核苷酸等。专业技术人员可以容易地使用任何这样的标记以获得本发明核酸分子的标记的变体。
C.其它相关核酸分子的分离如上所述,具有SEQ ID NO1、3、5、7、9、11、13或15的核酸分子的鉴定和表征,可以使专业技术人员分离出编码除本文所述序列之外的其他蛋白家族成员的核酸分子。此外,本文公开的核酸分子使得专业技术人员可以分离出编码除SEQ ID NO2、4、6、8、10、12、14或16蛋白之外的其他蛋白家族成员的核酸分子。
例如,专业技术人员可以容易地使用SEQ ID NO2、4、6、8、10、12、14或16的氨基酸序列来产生抗体探针,以筛选从适当的细胞制备的表达文库。一般来说,来自用纯化的蛋白免疫(如下文描述)的哺乳动物例如兔的多克隆抗血清或单克隆抗体,可以被用来探测哺乳动物的cDNA或基因组表达文库,例如λgtll文库,以获得适合的为蛋白家族的其它成员编码的序列。克隆的cDNA序列可以表达成融合蛋白,使用自身的控制序列直接表达,或通过使用适合表达酶的特定宿主的控制序列的构建物表达。
另外,本文描述的编码序列的一部分可以被合成并用作探针从任何哺乳动物中找到编码该蛋白家族的成员的DNA。制备含有大约18-20个核苷酸的寡聚体(编码大约6-7个氨基酸跨度)并用来筛选基因组DNA或cDNA文库,在严紧条件或足够消除过度的假阳性水平的严紧条件下获得杂交。
此外,寡核苷酸引物对可以被制备,用在PCR中以选择性地克隆编码的核酸分子。使用这样的PCR引物的PCR变性/退火/延伸循环在本领域内是众所周知的,并可以容易地被调整而适用于分离其它的编码核酸分子。
编码蛋白家族的其它成员的核酸分子也可以使用任何可获得的计算方法在现有的基因组或其它序列信息中鉴定,这些方法包括但不限于PSI-BLAST(Altschul等(1997),Nucl.Acids Res.253389-3402),PHI-BLAST(Zhang等(1998),Nucl.Acids Res.263986-3990),3D-PSSM(Kelly等(2000),J.Mol.Biol.299499-520),以及其它的计算分析方法(Shi等(1999),Biochem.Biophys.Res.Commun.262132-138和Matsunami等(2000),Nature 404601-604)。
D.含有核酸分子的rDNA分子本发明还提供含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是指已经在原位进行分子操作的DNA分子。产生rDNA分子的方法在本领域是众所周知的,例如参见Sambrook等,分子克隆实验指南(第三版),冷泉港实验室出版社,冷泉港,NY,2001。在优选的rDNA分子中,编码的DNA序列与表达控制序列和/或载体序列是可操作地连接的。
正如本领域内所熟知的,选择本发明的蛋白家族编码序列可操作地连接的载体和/或表达控制序列,直接依赖于所需的功能性质,如蛋白表达,以及待转化的宿主细胞。本发明考虑的载体至少能够指导rDNA分子中包含的结构基因复制或插入到宿主染色体中,优选也能够表达。
用于调控可操作地连接的蛋白编码序列表达的表达控制元件在本领域内是广为人知的,包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调控元件。在优选情况下,诱导型启动子容易控制,例如对于宿主细胞培养基中的营养具有反应性。
在一个实施方案中,含有编码核酸分子的载体将包括原核的复制子、即能够指导转化的原核宿主细胞如细菌宿主细胞中染色体之外的重组DNA分子自主复制和维持的DNA序列,这样的复制子在本领域内是众所周知的。此外,包含了原核复制子的载体也可以包含基因,该基因的表达产生可检测的标记,例如药物抗性。典型的细菌药物抗性基因是对氨苄青霉素、卡那霉素、氯霉素或四环素产生抗性的基因。
包含原核复制子的载体还可以包括原核的或噬菌体的启动子,它能够指导编码基因序列在细菌宿主细胞如大肠杆菌中的表达(转录和翻译)。启动子是由DNA序列形成的表达控制元件,它允许RNA聚合酶结合并转录。与细菌宿主相容的启动子序列一般在质粒载体中提供,这些载体含有方便的限制性酶切位点用于插入本发明的DNA区段。典型的这种载体质粒是来自BioRad实验室(Richmond,CA)的pUC8、pUC9、pBR322和pBR329以及来自Pharmacia(Piscataway,NJ)的pPL和pKK223。
与真核细胞相容,优选与脊椎动物细胞相容的表达载体也可以用于形成含有编码序列的rDNA分子。真核细胞表达载体,包括病毒载体,在本领域内是广为人知的,可以从几个商业来源获得。一般来说,这些载体都含有方便的限制性酶切位点用于插入所需的DNA区段。这些载体中典型的是pSVL和pKSV-10(Pharmacia)、pBPV-1/pML2d(International Biotechnologies,Inc.)、pTDT1(ATCC,#31255),本文描述的pCDM8等真核表达载体。如果需要,载体可以被修饰,以包含组织特异性的启动子。
用于构建本发明的rDNA分子的真核细胞表达载体还可以包含在真核细胞中有效的选择性标记,优选为药物抗性选择标记。优选的药物抗性标记是基因表达后产生新霉素抗性的基因,即新霉素磷酸转移酶(neo)基因(Southern等(1982),J.Mol.Anal.Genet.1327-341)。另外,选择性标记可以存在于不同的质粒上,两个载体通过对宿主细胞的共转染被导入,并通过在适当的选择性标记的药物中培养来筛选。
E.含有外部提供的编码核酸分子的宿主细胞本发明还提供用编码本发明蛋白的核酸分子转化的宿主细胞。宿主细胞可以是原核的也可以是真核的。对可用于表达本发明蛋白的真核细胞没有限制,只要细胞系与细胞培养方法相容,及与表达载体的增殖和基因产物的表达相容。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞,优选脊椎动物细胞,例如来自小鼠、大鼠、猴子或人类细胞系的细胞。优选的真核宿主细胞包括可从ATCC以CCL61编号获得的中国仓鼠卵巢(CHO)细胞、可从ATCC以CRL1658编号获得的NIH瑞士小鼠胚胎细胞(NIH/3T3)、幼仓鼠肾细胞(BHK)等真核组织培养细胞系。
任何原核的宿主都可以被用来表达编码本发明蛋白的rDNA分子。优选的原核宿主是大肠杆菌。
适当的细胞宿主用本发明rDNA分子转化可以通过众所周知的方法来完成,这些方法一般依赖于使用的载体类型和所用的宿主系统。对于原核宿主细胞的转化,通常使用电穿孔和盐处理的方法(参见,例如,Cohen等(1972),Proc.Natl.Acad.Sci.USA 692110;和Sambrook等,同上)。对于用含有rDNAs的载体转化脊椎动物细胞,典型地使用电穿孔、阳离子脂或盐处理的方法,参见,例如,Graham等(1973),Virol.52456;Wigler等(1979),Proc.Natl.Acad.Sci.USA 761373-1376。
成功转化的细胞,即含有本发明rDNA分子的细胞,可以用众所周知的包含用选择性标记进行筛选的技术来鉴定。例如,导入了本发明rDNA后获得的细胞可以被克隆以产生单菌落。从那些菌落获得的细胞可以被收获、裂解,其DNA内含物可以使用例如Southern,(1975)J.Mol.Biol.98503或Berent等,(1985)Biotech.3208中描述的方法来检测rDNA的存在,或通过免疫的方法分析细胞产生的蛋白。
F.使用rDNA分子生产重组蛋白本发明还提供了使用本文描述的核酸分子生产本发明蛋白的方法。一般来说,生产重组形式的蛋白通常包括下面的步骤首先,获得编码本发明蛋白的核酸分子,诸如包括,基本上组成或组成为下列序列的核酸分子SEQ ID NO1、3、5、7、9、11、13或15,或SEQ ID NO1的390-4883或390-4880位核苷酸,SEQ ID NO3的12-4907或12-4904位核苷酸,或SEQ ID NO5的424-1911或424-1908位核苷酸,或SEQ ID NO7的405-1838或405-1835位核苷酸,或SEQ ID NO9的89-1153或89-1150位核苷酸,或SEQ ID NO11的223-1572或223-1569位核苷酸,或SEQ ID NO13的418-1395或418-1392位核苷酸,或SEQ ID NO15的271-1434或271-1431位核苷酸。如果编码序列没有被内含子打断,正如这些可读框,它直接适合于在任何宿主中表达。
然后,在优选情况下,如上所述,将核酸分子与适当的控制序列可操作地连接,以形成含有蛋白可读框的表达单位。表达单位被用来转化适当的宿主,转化的宿主在允许重组蛋白生产的条件下进行培养。任选地,重组蛋白也可以从培养基或细胞中分离出来;在某些情况下,当一些杂质可以被允许时,蛋白可以不必回收和纯化。
前面的每个步骤都可以以各种多种方式进行。例如,所需的编码序列可以从基因组片段获得,并直接在适当的宿主中使用。使用前面提到的适当的复制子和控制序列,可以构建出在各种不同宿主中可以操作的表达载体。控制序列、表达载体和转化方法依赖于用于表达基因的宿主细胞的类型,在前面已经详细讨论过。适当的限制性酶切位点,如果不能正常获得,可以加到编码序列的末端从而提供可切割的基因以插入到这些载体中。专业技术人员可以容易地调整任何本领域所熟知的宿主/表达系统,以使用本发明核酸分子生产重组蛋白。
G.调节编码与癌症相关基因的核酸表达的试剂的鉴定方法本发明的另一个实施方案提供了鉴定试剂的方法,所述试剂调节编码本发明的蛋白,例如具有SEQ ID NO2、4、6、8、10、12、14或16的氨基酸序列的蛋白的核酸表达。这样的检测可以利用任何可用的监测本发明核酸的表达水平变化的方法。如本文所述,如果试剂能够在细胞中上或下调节本发明核酸的表达,则它就被称为调节核酸的表达。
在一种分析方法中,可以制备含有报告基因融合体的细胞系,这些融合体是在SEQ ID NO1的390-4883位核苷酸、SEQ ID NO3的12-4907位核苷酸、SEQ ID NO5的424-1911位核苷酸、SEQ ID NO7的405-1838位核苷酸、SEQ ID NO9的89-1153位核苷酸、SEQ IDNO11的223-1572位核苷酸、SEQ ID NO13的418-1395位核苷酸、SEQ ID NO15的271-1434位核苷酸所确定的可读框中的核苷酸和/或5’和/或3’调控元件与任何可检测的融合配体之间进行融合的。有大量可检测的融合配体是已知的并容易获得,包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶的基因(Alam等(1990),Anal.Biochem.188245-254)。含有报告基因融合体的细胞系然后在适当的条件和时间下暴露于测试试剂。暴露于试剂的样品和对照样品之间报告基因的差异表达,可以鉴定能够调节本发明的核酸表达的试剂。
其它的分析方法可以用来监测试剂调节编码本发明蛋白的核酸表达的能力,例如具有SEQ ID NO2、4、6、8、10、12、14或16的蛋白。例如,mRNA表达可以通过与本发明的核酸进行杂交来直接监测。细胞系在适当的条件和时间下暴露于测试试剂,通过标准的程序,例如那些在Sambrook等,分子克隆实验指南(第三版),冷泉港实验室出版社,冷泉港,NY,2001中公开的程序,分离出总RNA或mRNA。
优选的细胞是来自人组织的细胞,例如活检组织或来自癌症病人的培养细胞。可以使用的细胞系例如ATCC胸导管癌细胞系(目录号CRL-2320,CRL-2338和CRL-7345)、ATCC结肠直肠腺癌细胞系(目录号CCL-222、CCL-224、CCL-225、CCL-234、CRL-7159和CRL-7184)、ATCC肾透明细胞癌细胞系(目录号HTB-46和HTB-47)、ATCC肾细胞腺癌细胞系(目录号CRL-1611、CRL-1932和CRL-1933)、ATCC肝细胞癌细胞系(目录号CRL-2233、CRL-2234和HB-8065)、ATCC肺腺癌细胞系(目录号CRL-5944、CRL-7380和CRL-5907)、ATCC淋巴细胞系(目录号CRL-7936、CRL-7264和CRL-7507)、ATCC卵巢腺癌细胞系(目录号HTB-161、HTB-75和HTB-76)、ATCC胰腺腺癌细胞系(目录号CRL-1687、CRL-2119和HTP-79)、前列腺腺癌细胞系(目录号CRL-1435、CRL-2422和CRL-2220)以及ATCC胃腺癌细胞系(目录号CRL-1739、CRL-1863和CRL-1864)。此外,其它可以获得的细胞或细胞系也可以使用。
可以从本发明的核酸制备用于检测暴露于试剂的细胞和对照细胞之间RNA表达水平的差异的探针。优选的但不是必需的,设计在高度严紧的条件下只与靶核酸杂交的探针。在高度严紧的条件下只有高度互补的核酸杂交体才能形成。因此,分析条件的严紧性决定了两个核酸链之间为了形成杂交体应该存在的互补性的程度。应该选择使探针靶杂交体和探针非靶杂交体之间的稳定性差异最大的严紧条件。
探针可以通过本领域现有的方法根据本发明的核酸来设计。例如,探针的G+C含量和探针的长度可以影响探针与它的靶序列的结合。优化探针特异性的方法一般可以从Sambrook等,同上或Ausubel等,Short Protocols in Molecular Biology,第四版,John Wiley & Sons,Inc.,New York,1999中获得。
针对每个探针的需要可以使用现有的方法对杂交条件进行修改,例如Sambrook等和Ausubel等中描述的方法。总细胞RNA或富集polyARNA的RNA的杂交可以通过任何可用的方式来进行。例如,总细胞RNA或富集polyA RNA的RNA可以被固定到固相支持物上,然后在探针可以特异性杂交的条件下将固相支持物暴露于至少一个含有至少一个或部分本发明的序列的探针。此外,含有至少一个或部分本发明的序列的核酸片段可以被固定到固相支持物上,例如硅片、多孔玻璃片或膜上。然后在固定的序列可以特异性杂交的条件下将固相支持物暴露于来自样品的总细胞RNA或polyA RNA。这样的固相支持物和杂交方法可以广泛获得,例如Beattie,(1995)WO 95/11755中所公开的那些。通过测定给定的探针与来自未处理的细胞群的RNA样品和暴露于试剂的细胞群的RNA样品之间特异性杂交的能力,可以鉴定能够对编码SEQ ID NO2、4、6、8、10、12、14或16序列蛋白的核酸的表达具有上或下调控的试剂。
用于mRNAs的定性和定量分析的杂交也可以通过使用RNA酶保护分析方法(即RPA,参见Ma等(1996),Methods 10273-238)来进行。简单地说,含有编码基因产物的cDNA和噬菌体特异的DNA依赖性RNA聚合酶启动子(例如T7、T3或SP6 RNA聚合酶)的表达载体在cDNA的3’末端、噬菌体启动子的下游被线性化,其中这样的线性化分子随后被用做模板通过体外转录合成标记的cDNA反义转录本。标记的转录本然后与分离的RNA(即总的或分级的mRNA)的混合物杂交,杂交条件为在含有80%甲酰胺、40mM PIPES、pH6.4、0.4M NaCl和1mM EDTA的缓冲液中于45℃保温过夜。然后在含有40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中将得到的杂交体消化。在外源的蛋白失活并抽提之后,样品在尿素/聚丙烯酰胺凝胶上上样分析。
在另一种分析方法中,为了鉴定影响即时基因产物表达的试剂,首先鉴定在生理学上表达本发明的基因产物的细胞或细胞系。这样鉴定的细胞和/或细胞系预测含有必需的细胞机制,以至于对通过适当的表面转导机制和/或胞质级联接触外源的试剂而言,都能够维持转录元件的调节忠实性。此外,将这样的细胞或细胞系用表达载体(例如质粒或病毒载体)构建物转导或转染,该构建物含有结构基因的可操作的含有启动子的5’非翻译末端,所述结构基因编码融合到一个或多个抗原性片段的即时基因产物,所述抗原片段对即时基因产物是特异性的,其中该片段处于该启动子的转录控制之下,表达为其分子量可以与天然存在的多肽区别开的多肽,该多肽也可以含有具有免疫性的可以区别的标记或其它可检测的标记。这样的方法在本领域内是公知的(参见Sambrook等,同上)。
通过上述方法转导或转染的细胞或细胞系然后在适当的条件下与试剂接触。例如,存在于可药用的赋形剂中的试剂与细胞在水性生理缓冲液中接触,例如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐缓冲液(BSS)、含有血清的PBS或BSS、或含有PBS或BBS和/或血清的条件培养基,在37℃保温。本领域的专业技术人员可以根据需要对该条件进行调整。在细胞与试剂接触后,将该细胞破碎,对裂解液中的多肽进行分级,以便使多肽级分合并,并与抗体接触,通过免疫分析方法(例如ELISA、免疫沉淀或Western印迹)进行进一步处理。从“接触了试剂”的样品中分离到的蛋白合并液将与只用赋形剂接触细胞的对照样品进行比较,“接触了试剂”的样品与对照相比通过免疫技术产生的信号的增加或减少将被用来辨别试剂的效果。
H.调节癌症相关蛋白的水平或至少一种活性的试剂的鉴定方法本发明的另一个实施方案提供了试剂的鉴定方法,所述试剂调节本发明的蛋白,例如具有SEQ ID NO2、4、6、8、10、12、14或16氨基酸序列的蛋白的水平或至少一种活性。这样的方法或分析可以使用任何监测或检测所需活性的手段,并对于鉴定治疗癌症的试剂特别有用。
在一种方法中,可以分析已经暴露于待测试剂的细胞群落与未暴露的对照细胞群落之间本发明蛋白的相对量。在这种方法中,探针例如特异性抗体被用来监测蛋白在不同细胞群落中的差异表达。细胞系或群落在适当的条件和时间下被暴露于待测试剂。从暴露的细胞系或群落和对照的未暴露的细胞系或群落制备细胞裂解液。然后用探针分析细胞裂解液。
抗体探针通过适当的免疫方案免疫适当的哺乳动物宿主而制备,免疫使用本发明的肽、多肽或蛋白,只要它们有足够的长度,或者如果希望或如果需要增强免疫原性,可以与适当的载体相连。制备带有载体如BSA、KLH或其它载体蛋白的免疫连接物(conjugate)的方法在本技术领域是现成的。在某些情况下,使用例如碳二亚胺试剂进行直接连接可能是有效的;在其它的情况下,连接试剂例如那些PierceChemical Co.(Rockford,IL)所提供的试剂,在提供对半抗原的可接近性方面可能是令人满意的。例如,半抗原肽可以在氨基或羧基末端用半胱氨酸残基延伸,或用半胱氨酸残基间插其中,以方便载体的连接。免疫原的给药一般通过在一段适当的时期内注射来进行,并使用适当的佐剂,正如本领域所通常理解的那样。在免疫计划期间,测定抗体的滴度以确定抗体的形成是足够的。
尽管对于某些应用来说,通过这种方法生产的多克隆抗血清是令人满意的,但对于药物组合物来说,使用单克隆的制备物是优选的。分泌所需的单克隆抗体的无限增殖的细胞系可以使用Kohler和Milstein((1975)Nature 256495-497)的标准方法或造成淋巴细胞或脾细胞无限增殖的修饰方案来制备,正如通常所公知的那样。分泌所需抗体的无限增殖细胞系通过免疫分析进行筛选,其中的抗原是肽半抗原、多肽或蛋白。当分泌所需抗体的适当的无限增殖细胞培养物被鉴别后,细胞可以在体外培养或在腹水中生产。
然后从培养液上清液或腹水上清液中回收所需的单克隆抗体。含有具有免疫重要(抗原结合的)部分的单克隆抗体片段或多克隆抗血清可以被用做拮抗剂,完整的抗体也可以。通常情况下,使用免疫反应性(抗原结合)的抗体片段,例如Fab、Fab’或F(ab’)2片段是优选的,特别是在治疗过程中,因为这些片段一般比完整的免疫球蛋白具有更少的免疫原性。
抗体或抗原结合片段也可以使用现有的技术通过重组的方法生产。与蛋白所需区域特异性结合的抗体区域也可以以具有多个物种来源的嵌合体的方式来生产,例如人源化抗体。
在上述方法中分析的试剂可以随机选择或合理选择或设计。用于本文中时,当试剂是被随机地选择而不考虑参与单独结合本发明的蛋白或与其相关底物、结合配体等一起结合的特定序列时,被称为是随机选择的。随机选择试剂的例子是使用化学文库或肽组合文库,或生物体的生长培养液。
在本文中使用时,当试剂的选择是在非随机的基础上进行,考虑其与试剂作用的靶位点序列和/或其构象时,被称为是合理选择或设计的。试剂可以通过利用组成这些位点的肽序列来合理选择或合理设计。例如,合理选择的肽试剂可以是一个氨基酸序列与任何功能性保守位点一致或从其衍生的肽。
本发明的试剂可以是,例如肽、小分子、维生素衍生物以及碳水化合物。显性负调节蛋白(dominant negative proteins),编码这些蛋白的DNA,针对这些蛋白的抗体,这些蛋白的肽片段或这些蛋白的模拟物,都可以导入到细胞中以影响功能。此处使用的“模拟”是指对肽分子的一个或几个区域进行修饰,以提供与亲本肽在化学上不同但在拓扑学和功能上相似的结构(参见Grant分子生物学和生物技术,Meyers编辑,659-664页,VCH Publishers,Inc.,New York,1995)。专业技术人员可以容易地认识到对本发明的试剂的结构特性没有限制。
本发明的肽试剂可以使用标准的固相(或液相)肽合成方法来制备,这在本领域内是公知的。此外,编码这些肽的DNA可以使用可商业获得的寡核苷酸合成仪合成,并可以使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸,就必须使用固相肽合成来生产。
本发明的另一类试剂是与本发明蛋白的关键位置,例如细胞质结构域、间隔区结构域、α-螺旋卷曲-卷曲结构域或受体结构域具有免疫反应性的抗体,正如本文描述的那样。通过用含有预计被抗体靶向的那些蛋白部分作为抗原区的肽免疫适当的哺乳动物对象,可以获得抗体试剂。
I.调节与癌症相关的蛋白的表达或至少一种活性的试剂的应用正如实施例中提供的那样,本发明的蛋白和核酸,例如具有SEQID NO2、4、6、8、10、12、14或16氨基酸序列的蛋白,在癌组织中是差异表达的。上调或下调或调整蛋白的表达或蛋白的至少一种活性的试剂,例如激动剂或拮抗剂,可以用来调节与蛋白的功能和活性相关的生物或病理过程。这包括鉴定的使用本发明的同源物或类似物试剂。
本文中使用的对象可以是任何哺乳动物,只要该哺乳动物需要调整由本发明蛋白介导的病理或生物过程。术语“哺乳动物”被定义为属于哺乳动物纲的个体。本发明在治疗人类对象中特别有用。
病理过程是指一类产生有害影响的生物过程。例如,本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时,当试剂降低病理过程的程度或严重性时,它被称为缓解该病理过程。例如,通过施用以某种方式上调或下调或缓解本发明蛋白的表达或至少一种活性的试剂,可以防止癌症或缓解疾病的发展。
本发明的试剂可以单独提供,也可以与其它缓解特定病理过程的试剂组合在一起。例如,本发明的试剂可以与其它现有的药物共同给药。在本文中,当两种试剂同时给药或以一种使试剂在同一时间发生作用的方式独立地给药时,它们被称为组合给药。
本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地,给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重,同时治疗的种类,如果有的话,治疗的频率和所希望的效果。
本发明还提供了含有一种或多种调整本发明蛋白的表达或至少一种活性的组合物。因为个体的需要是不同的,确定每个成分的有效量的最适范围属于本领域的技术。通常的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。
除了药理活性试剂外,本发明的组合物还可以含有适当的可药用的载体,包括可以方便使活性化合物加工成制剂的赋形剂和辅助剂,该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液,例如水溶性的盐。此外,活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油,例如芝麻油,或合成的脂肪酸酯,例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞内。
本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药。事实上,所有三种类型的剂型可以同时使用以完成活性成分的全身给药。
合适的口服剂型包括硬的或软的胶囊、药丸、药片、包括糖衣片、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。
在实施本发明的方法时,本发明的化合物可以单独使用或组合使用,或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中,本发明的化合物可以与按照一般接受的医学规范(generally acceptedmedical practice)为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用,一般在哺乳动物中,例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠,也可以在体外使用。
J.鉴定结合配体的方法本发明的另一个实施方案提供了分离和鉴定本发明蛋白的结合配体的方法。一般来说,在允许潜在的结合配体与本发明的蛋白结合的条件下,将本发明的蛋白与潜在的结合配体或细胞的提取液或级分混合。混合后,从混合物中分离出已经与本发明的蛋白结合的肽、多肽、蛋白或其它分子。然后取出与本发明的蛋白结合的结合配体并进行进一步分析。为了鉴定和分离结合配体,可以使用完整的蛋白,例如含有SEQ ID NO2、4、6、8、10、12、14或16完整氨基酸序列的蛋白。此外,蛋白的片段也可以使用。
本文使用的细胞提取液是指从裂解或破碎的细胞制成的制备液或级分。优选的细胞提取液的来源是从人类肿瘤或转化的细胞衍生的细胞,例如癌的活检组织或组织培养细胞。此外,细胞提取液也可以从正常的组织或可获得的细胞系制备。
有多种方法可用于获得细胞的提取液。细胞可以使用物理或化学的破碎方法破碎。物理破碎方法的实施例包括但不限于超声和机械剪切。化学裂解方法的实例包括但不限于去污剂裂解和酶法裂解。专业技术人员可以容易地调整制备细胞提取液的方法,以获得用于本方法的提取液。
一旦制备了细胞的提取液,将提取液在蛋白可以与结合配体结合的条件下与本发明的蛋白混合。可以使用多种不同的条件,最优选的条件是近似人细胞细胞质中的条件。例如所用的细胞提取液的渗透性、pH、温度和浓度等一些特性,可以被改变以使蛋白与结合配体的结合最优化。
在适当的条件下混合后,结合的复合物与混合物分开。有多种技术可用于分离混合物。例如,特异性针对本发明蛋白的抗体可以被用来对结合配体复合物进行免疫沉淀。此外,标准的化学分离技术例如层析技术和密度/沉降离心也可以使用。
在除去了提取液中发现的不结合的细胞成分后,可以使用常规的技术将结合配体从复合物上解离。例如,可以通过改变混合物的盐浓度或pH来实现解离。
为了帮助从混合的提取液中分离结合的结合配体,可以将本发明的蛋白固定化在固相支持物上。例如,蛋白可以连接在硝酸纤维素基质或丙烯酸珠子上。将蛋白连接在固相支持物上有助于使肽/结合配体对与提取液中发现的其它成分分离开来。鉴定的结合配体可以是单一的蛋白,也可以是由两个或多个蛋白组成的复合物。此外,结合配体也可以按照Takayama等(1997),Methods Mol.Biol.69171-184或Sauder等(1996),J.Gen.Virol.77991-996的程序使用Far-Western分析方法鉴定,或通过使用抗原决定簇标记的蛋白或GST融合蛋白来鉴定。
此外,本发明的核酸分子可以用在酵母双杂交系统或其它的体内蛋白-蛋白检测系统中。酵母双杂交系统已经被用来鉴定其它的蛋白配体对,并可以被容易地调整以利用本文描述的核酸分子。
K.癌症相关蛋白的结合配体的应用使用上述的方法获得的本发明蛋白的结合配体及其同源物和类似物,一旦分离后,可以用于各种不同的目的。使用本领域的现有技术,结合配体可以用于生产与结合配体结合的抗体。与结合配体结合的抗体可用于分析本发明的蛋白的活性,作为治疗试剂缓解由本发明的蛋白介导的生物或病理过程,或用于纯化结合配体。这些应用将在后面详细描述。
L.阻断结合配体和癌症相关蛋白之间结合的试剂的鉴定方法本发明的另一个实施方案提供鉴定减小或阻断本发明蛋白与结合配体结合的试剂的方法。具体来说,本发明的蛋白在存在或不存在待测试剂的情况下与结合配体混合。在允许蛋白结合的条件下混合后,两种混合物被分析和比较,以确定试剂是否减小或阻断了本发明的蛋白与结合配体的结合。当存在于含有待测试剂的样品中的结合量减少时,就鉴定到了减小或阻断本发明的蛋白与结合配体结合的试剂。
在本文中,当试剂的存在减小结合配体与本发明蛋白结合的程度或阻止了该结合时,该试剂被称为减小或阻断了本发明的蛋白与结合配体之间的结合。一类试剂通过与结合配体结合减小或阻断了该结合,而另一类试剂通过与本发明的蛋白结合减小或阻断了该结合。
用于上述分析方法的结合配体可以是与本发明蛋白结合的分离和充分表征的蛋白或部分表征的蛋白,也可以是已经被鉴定存在于细胞提取液中的结合配体。对于本领域的专业人员来说,显然只要结合配体的特征是可鉴定的性质,例如分子量,现有分析方法就可以使用。
上述方法中分析的试剂可以随机选择或合理选择或设计。这里所说的试剂随机选择是指试剂被随机地选择,不考虑参与本发明的蛋白与结合配体结合的具体序列。随机选择的试剂的例子是使用化学文库或肽组合文库,或生物体的生长培养液。
这里所说的试剂合理选择或设计是指试剂在非随机的基础上选择,考虑与试剂作用相关的靶位点的序列和/或其构象。利用组成结合配体和本发明蛋白的接触位点的肽序列可以合理选择或合理设计试剂。例如,合理选择的肽试剂可以是其氨基酸序列与本发明的蛋白在结合配体上的接触位点一致的肽。这样的试剂通过与结合配体的结合将减小或阻断本发明的蛋白与结合配体的结合。
本发明的试剂可以是例如肽、小分子、维生素衍生物以及碳水化合物。本领域的专业人员可以容易地认识到对本发明的试剂的结构特性没有限制。
本发明的一类试剂是肽试剂,其氨基酸序列在本发明蛋白的氨基酸序列的基础上选择。本发明的肽试剂可以使用本领域现有的标准固相(或液相)肽合成方法来制备。此外,编码这些肽的DNA可以使用商用的寡核苷酸合成仪合成,或使用标准的重组子生产系统重组地生产。如果要包括非基因编码的氨基酸,就必须使用固相肽合成来生产。
本发明的另一类试剂是与本发明的蛋白或结合配体的关键位置具有免疫反应性的抗体。如上所述,通过用含有预测被抗体靶向的那些本发明的蛋白部分或结合配体作为抗原区免疫适当的哺乳动物对象,可以获得抗体。关键区域包括参与本发明的蛋白与结合配体结合的接触位点。
正如下面讨论的,涉及本发明蛋白活性的重要的最小残基序列定义了功能性线性结构域,可以有效地用做诱饵,用于双杂交筛选和潜在结合分子的鉴定。与使用全长分子相反,使用这样的片段将显著地增加筛选的特异性,因此是优选的。同样地,线性序列也可以用作亲和基质,使用生物化学亲和纯化策略来分离结合的蛋白。
M.阻断结合配体与癌症相关蛋白之间结合的试剂的应用如同在实施例中提供的那样,本发明的蛋白和核酸,例如具有SEQID NO2、4、6、8、10、12、14或16的氨基酸序列的蛋白,在癌组织中是差异表达的。减小或阻断本发明蛋白与结合配体的相互作用的试剂,包括那些使用本发明蛋白的同源物和类似物而得以鉴定的试剂,可以用来调节与蛋白的功能和活性相关的生物或病理过程。
本文中使用的对象可以是任何哺乳动物,只要该哺乳动物需要调节由本发明的蛋白介导的病理或生物过程。术语“哺乳动物”是指属于哺乳动物纲的个体。本发明在治疗人对象中特别有用。
病理过程是指一类产生有害影响的生物过程。例如,本发明蛋白的表达可能与细胞生长或异常增生相关。在本文中使用时,当试剂减少病理过程的程度或严重性时,该试剂被称为缓解了该病理过程。例如,通过施用减小或阻断本发明蛋白与结合配体的相互作用的试剂,可以防止癌症或缓解疾病的发展。
本发明的试剂可以通过肠胃外、皮下、静脉内、肌内、腹膜内、透皮或含服的途径给药。另外或同时地,给药也可以通过口服。给药的剂量依赖于接受者的年龄、健康状况和体重,同时治疗的种类,如果有的话,以及治疗的频率和所希望的效果。
本发明还提供了含有一种或多种阻断本发明蛋白与结合配体结合的试剂的组合物。因为个体的需要是不同的,确定每个成分的有效量的最适范围属于本领域的技术。典型的剂量包括每公斤体重0.1到100μg。优选的剂量为每公斤体重0.1到10μg。最优选的剂量为每公斤体重0.1到1μg。
除了药理活性试剂外,本发明的组合物还可以含有适当的可药用的载体,包括可以方便使活性成分加工成制剂的赋形剂和辅助剂,该制剂在药学上可用于将活性成分投送到作用位点。适合的肠胃外给药的剂型包括水溶形式的活性化合物的水溶液,例如水溶性的盐。此外,活性化合物的悬浮液也可以适当的油状注射悬浮液形式给药。适合的亲脂溶剂或载体包括脂肪油,例如芝麻油,或合成的脂肪酸酯,例如油酸乙基酯或甘油三酯。水性注射悬浮液可以含有增加悬浮液粘度的物质,包括例如羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,悬浮液也可以含有稳定剂。脂质体也可以用来封装试剂以投送到细胞中。
本发明用于全身给药的药物剂型可以为肠内、非肠胃或局部给药剂型。事实上,所有三种类型的剂型可以同时使用以完成活性成分的全身给药。
合适的口服剂型包括硬的或软的胶囊、药丸、药片(包括糖衣片)、酏剂、悬浮液、糖浆或其吸入剂和可控制释放的形式。
在实施本发明的方法时,本发明的化合物可以单独使用或组合使用,或与其它的治疗或诊断试剂结合使用。在某些优选实施方案中,本发明的化合物可以与按照一般接受的医学规范为这些疾病开出的其它化合物共同给药。本发明的化合物可以在体内使用,一般在哺乳动物中,例如人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠,也可以在体外使用。
N.合理的药物设计和组合化学本发明还包括了合理的药物设计和组合化学。专业人员会认可适当的方法,以使用和实施本发明的方面来鉴定可以开发用于治疗癌症的化合物。涉及多肽的合理的药物设计需要鉴定和限定与设计的药物相互作用的第一个肽,然后使用第一个靶肽确定第二个肽的必要条件。在限定了这些必要条件后,人们可以发现或制备出满足所有或基本上所有的限定的必要条件的适当的肽或非肽。因此,合理药物设计的一个目标是生产目的生物活性多肽的结构或功能类似物,或与它们相互作用的小分子(激动剂、拮抗剂、无效化合物(null compound)),以便形成具有,例如更多或更少的潜在配基形式的药物(参见例如Hodgson(1991),Bio.Technology 919-21)。组合化学是一门整体地而不是一个一个地合成和测试化合物生物活性的科学,其目的在于比以前所能做到地更快和更廉价地发现药物和物质。近年来,由于计算机辅助蛋白模拟和药物发现中方法的改进,合理药物设计和组合化学已经变得更密切相关了。(参见例如美国专利No.4,908,773、5,884,230、5,873,052、5,331,573和5,888,738)。
由于计算机图形学的出现,将分子模拟用做合理药物设计和组合化学的工具已经极大地发展了。它不仅有可能在计算机屏幕上以三维的方式看见分子,而且有可能研究酶和受体等大分子和待测的合理设计的衍生物分子的相互作用(参见Boorman(1992),Chem.Eng.News7018-26)。现在有大量用户友好的软件和硬件可用,实际上所有的制药公司都有计算机模拟研究组致力于合理药物设计。例如,分子模拟公司(Molecular Simulations Inc.(www.msi.com))销售几种复杂精致的程序,可以使用户从氨基酸序列开始,构建出蛋白或多肽的二维或三维模型,将它与其它的二维和三维模型进行比较,并用三维模型实时地分析化合物、药物和肽的相互作用。因此,在本发明的某些实施方案中,软件被用来比较本发明蛋白的区域和与其相互作用的分子(统称为“结合配体”,例如抗蛋白抗体),以及这些分子的片段或衍生物与其它分子,例如肽、肽模拟物和化学物质,以便能预测和设计治疗的相互作用(参见Schneider(1998),Genetic Engineering News December,第20页;Tempczyk等(1997),Molecular Simulations Inc.SolutionsApril;以及Butenhof(1998),分子模拟公司,分子模拟讨论的案例注解(1998年8月))。
O.基因治疗在另一个实施方案中,基因治疗可以用做调节与蛋白的功能和活性相关的生物和病理过程的手段。这包括在癌细胞中插入基因构建物,其编码含有SEQ ID NO2、4、6、8、10、12、14或16的全部或至少部分序列的蛋白,或者该基因构建物也可以含有SEQ ID NO1、3、5、7、9、11、13或15的全部或部分非编码区,它们与启动子或增强子元件可操作地连接,以便该蛋白的表达导致所述癌症的抑制,以及其中该启动子或增强子元件是调节该基因构建物的启动子或增强子元件。
在描述的构建物中,该蛋白的表达可以由任何适当的启动子指导(例如人巨细胞病毒(CMV)、猴病毒(SV40)或金属硫蛋白的启动子),并且可以被任何适当的哺乳动物调控元件调控。例如,如果需要,已知优先在神经细胞、T细胞或B细胞中指导基因表达的增强子可以被用来指导表达。可以使用的增强子包括但不限于那些其表达被表征为组织或细胞特异性的增强子。另外,如果LFG1、LFG2、LFG3、LFG4、LFG5或LFG6的基因组克隆被用作治疗构建物(例如,在如上述用本发明的核酸分子通过杂交将其分离后),调控可以通过同源调控序列介导,或者如果需要,通过来自异源的调控序列,包括上述的任何启动子或调控元件来介导。
将构建物插入到癌细胞中是在体内完成的,例如使用病毒或质粒载体。这样的方法也可以适用于体外使用。因此,本发明的方法可以容易地应用于不同形式的基因治疗中,不论细胞是在离体进行遗传修饰然后施用给宿主中,还是在体内使用包括特别适合于这些治疗的载体的任何多种适当方法进行遗传修饰。
逆转录病毒载体、腺病毒载体、腺相关病毒载体、或对可能参与癌症的细胞(例如上皮细胞)具有适当向性的其它病毒载体,都可以用做治疗基因构建物的基因转移投送系统。有多种用于这种目的的载体已经广为人知(Cozzi PJ等(2002)Prostate,53(2)95-100;Bitzer M,LauerU.,(2002)Dtsch Med Wochenschr.127(31-32)1623-1624;Mezzina和Danos(2002),Trends Genet.8241-256;Loser等(2002)Curr.Gene Ther.2161-171;Pfeifer和Verma(2001),Annu.Rev.Genomics Hum.Genet.2177-211)。逆转录病毒载体发展得特别完善,已经用于临床(Anderson等(1995),美国专利No.5,399,346)。非病毒的方法也可以用于将治疗DNA导入预计将遭受癌症的细胞(Jeschke等(20002)Curr.Gene Ther.1267-278;Wu等(1988),J.Biol.Chem.26314621-14624;Wu等(1989),J.Biol.Chem.26416985-16987)。例如,基因可以通过脂转染、asialorosonucoid多聚赖氨酸交联、或者较不优选的在外科条件下的显微注射的方法导入到神经元或T细胞中。
对于上述的任何应用方法来说,治疗性核酸构建物优选施加在癌症事件的位点(例如通过注射)。然而,它也可以施加在癌症事件附近的组织中,或施加到为预计将遭受癌症的细胞提供供应的血管上。
P.转基因动物含有突变、敲除或修饰的基因的转基因动物也包括在本发明中,这些基因对应于SEQ ID NO1、3、5、7、9、11、13或15的cDNA序列,或编码SEQ ID NO2、4、6、8、10、12、14或16的多肽序列的可读框,或其具有至少大约3、4、5、6、10、15、20、25、30、35或更多氨基酸残基的连续序列的片段。转基因动物是遗传修饰的动物,其已经通过实验转入了重组、外源或克隆的遗传物质。这样的遗传物质通常被称为“转基因”。转基因的核酸序列,在这种情况下是SEQ ID NO1、3、5、7、9、11、13或15的形式,可以被整合在基因组中该特定的核酸序列在正常情况下不会被发现的位置,也可以整合在转移基因的正常位置上。转基因的组成为来自同物种的基因组或靶动物物种之外不同物种的基因组的核酸序列。
在某些实施方案中,构建了这样的转基因动物,其中包含SEQ IDNO1、3、5、7、9、11、13或15的基因的全部或部分被删除。在对应于SEQ ID NO1、3、5、7、9、11、13或15的基因含有一个或多个内含子的情况下,完整的基因——所有外显子、内含子和调控序列——可以被删除。此外,也可以删除比完整的基因小的部分。例如,可以删除单个的外显子和/或内含子,以产生表达修饰的本发明蛋白的动物。
术语“生殖细胞系转基因动物”是指这样的转基因动物,其中遗传变化或遗传信息被导入了生殖系细胞,从而赋予了转基因动物将遗传信息转移给后代的能力。如果这样的后代事实上具有某些或全部的这种改变或遗传信息,那么它们也是转基因动物。
变化或遗传信息对于受体所属的动物物种可以是外源的,只对受体这个特定的个体是外源的,或者遗传信息也可能已经被受体拥有。在最后这种情况下,改变的或导入的基因可以与天然的基因有不同的表达。
转基因动物可以通过各种不同的方法来产生,包括转染、电穿孔、显微注射、在胚胎干细胞中的基因靶向和重组病毒和逆转录病毒感染(参见例如美国专利No.4,736,866;美国专利5,602,307;Mullins等(1993),Hypertension 22630-633;Brenin等(1997),Surg.Oncol.699-110;Recombinant Gene Expression Protocols(Methods in MolecularBiology,第62卷),Tuan主编,Humana Press,Totowa,NJ,1997)。
许多重组或转基因小鼠可以产生,包括那些表达活化的致癌基因序列(美国专利4,736,866)、表达猴SV40 T-抗原(美国专利No.5,728,915)、缺乏干扰素调控因子1(IRF-1)(美国专利No.5,731,490)、表现出多巴胺能功能障碍(美国专利No.5,723,719)、表达至少一种参与血压控制的人类基因(美国专利No.5,731,489)、表现出与在自然发生的阿茨海默氏病中存在的病症有较高的相似性(美国专利No.5,720,936)、具有降低的介导细胞附着能力(美国专利No.5,602,307)、拥有牛生长激素基因(Clutter等(1996),Genetics 1431753-1760)、或能够产生完全的人类抗体反应(McCarthy(1997),Lancet 349405)的小鼠。
尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物,在某些情况下优选甚至必须使用另外的动物物种。转基因步骤已经成功地应用在各种非鼠科的动物中,包括绵羊、山羊、猪、狗、猫、猴、黑猩猩、仓鼠、兔、奶牛和豚鼠(参见例如Kim等(1997),Mol.Reprod.Dev.46515-526;Houdebine(1995),Reprod.Nutr.Dev.35609-617;Petters(1994),Reprod.Fertil.Dev.6643-645;Schnieke等(1997),Science 2782130-2133;和Amoah(1997),J.Animal Sci.75578-585)。
将核酸片段导入重组的哺乳动物感受态细胞的方法可以是任何利于多种核酸分子共转化的方法。本领域的专业人员可以容易地获得产生转基因动物的详细步骤,包括在美国专利No.5,489,743和美国专利No.5,602,307中所公开的那些。
Q.诊断方法因为本发明的基因和蛋白在癌细胞和非癌组织中表达不同,本发明的基因和蛋白可以用于诊断或监测癌症、追踪疾病的进展、或者将癌组织与非癌组织样品区分开来。一种使用本发明的核酸分子或蛋白诊断癌症的方法包括从活的对象中获得组织。
检测本发明的核酸或蛋白分子的分析方法可以采用任何可用的形式。通常分析核酸分子的方法包括基于杂交或PCR的方法。通常检测本发明的蛋白、多肽或肽的分析方法包括使用任何可用形式的抗体探针,例如原位结合分析等(参见Harlow和Lane,抗体-实验室手册,冷泉港实验室出版社,冷泉港,NY,1988)。在优选的实施方案中,分析的进行使用了适当的对照。
一般来说,本发明的诊断可以按照实施方案是基于核酸还是基于蛋白的分析而进行分类。某些诊断分析方法检测促进癌变的本发明的核酸或蛋白的突变或多态性。其它的诊断分析方法鉴定和辨别蛋白活性的缺陷,这是通过检测到待测生物体中本发明的RNA或蛋白水平类似于患有疾病例如癌症的生物体中本发明的RNA或蛋白水平,或检测到待测生物体中本发明的RNA或蛋白水平不同于未患疾病的生物体来进行的。
此外,还考虑到了生产含有下面实施方案中描述的试剂和方法的试剂盒,以便允许快速地检测和鉴定蛋白活性或水平的畸变。诊断试剂盒可以包含核酸探针或抗体或其组合,它们能够特异性检测本发明的蛋白或核酸探针或抗体或其组合的突变形式,可以用于测定一个或多个本发明蛋白的RNA或蛋白表达水平。这些试剂盒的检测成分一般与一种或多种下列试剂共同提供。通常提供能够吸附或结合DNA、RNA或蛋白的支持物。可用的支持物包括硝酸纤维素膜、尼龙膜或衍生的尼龙膜,其特征携有带正电荷的取代基的阵列。在这些试剂盒中也可以提供一种或多种限制性酶、对照试剂、缓冲液、扩增酶、以及非人类的多核苷酸,如小牛胸腺或鲑鱼精子DNA。
有用的基于核酸的诊断技术包括但不限于直接的DNA测序、梯度凝胶电泳、Southern印迹分析、单链确认分析(SSCA)、RNA酶保护分析、斑点印迹分析、核酸扩增、等位基因特异性PCR以及这些方法的组合。这些分析的起始点是从生物样品中分离或纯化核酸。可以预期活检组织将提供良好的样品源。核酸从样品中提取出来,并且可以使用引物通过DNA扩增技术如聚合酶链反应(PCR)得到扩增。本领域的专业人员将会容易地确认可用于证实多态性存在的方法。此外,本领域内现有的任何可寻址的阵列技术都可用于本发明的这个方面。多核苷酸阵列的一个具体的实施方案被称为GenechipsTM,已经在美国专利5,143,854、PCT申请WO 90/15070和92/10092中进行了广泛的描述。
各种各样的标记物和交联技术已为本领域的专业技术人员所熟知,可以用于各种核酸分析方法中。有几种途径可以产生用于杂交或PCR的标记的核酸,包括但不限于寡核苷酸标记、缺刻翻译、末端标记或使用标记核苷酸的PCR扩增。此外,编码本发明蛋白的核酸也可以被克隆到载体中以生产mRNA探针。这样的载体在本领域内是广为人知的,可商业获得的,并可以通过加入适当的RNA聚合酶,例如T7、T3或SP6和标记的核苷酸用来在体外合成RNA探针。许多公司例如Pharmacia Biotech(Piscataway,NJ)、Promega(Madison,WI)和U.S.Biochemical Corp(Cleveland,OH)都为这些方案提供商用试剂盒和方案。适合的报告分子或标记物包括放射性核素、酶、荧光、化学发光或产色素的试剂,以及底物、辅助因子、抑制剂、磁性微粒等。
在优选的基于蛋白的诊断中,本发明的抗体以有序阵列方式连接在支持物上,其中大量的抗体被连接在支持物的不同区域,彼此之间不重叠。本领域专业技术人员会容易地确认可用的基于蛋白的诊断的分析方法。蛋白从生物样品中获得,使用常规的方法标记(例如放射性、化学发光或荧光)。利用标记的已知浓度的本发明蛋白的突变体或野生型标准品,研究人员可以准确地确定样品中本发明的蛋白的浓度,根据这个信息可以评估特定形式蛋白的表达水平。常规的光密度测定方法也可以用来更准确地测定这样的蛋白的浓度或表达水平。这些方法也容易使用本领域的专业技术人员熟知的高通量诊断分析技术进行自动化。正如上面详细描述的那样,本领域任何已知的可寻址的阵列技术也可以用于本发明的这个方面,并且在芯片上显示蛋白阵列以试图最大化抗体结合样式和诊断信息。
如上面所讨论的,在本发明的基因或蛋白中多态性的存在或检测可以对生物体中的癌症或相似疾病提供诊断。其它的实施方案包括含有检测成分的诊断试剂盒的制备,所述成分例如特异性针对本发明基因或蛋白的具体多态性突变体的抗体。检测成分一般与一种或多种下列试剂组合提供。能够吸附或结合RNA或蛋白的支持物通常被提供。可用于这种目的的支持物包括但不限于硝酸纤维素膜、尼龙膜或衍生的尼龙膜,其特征为携有带正电荷的取代基的阵列,以及GenechipsTM或其等价物。在这些试剂盒中也可以包括一种或多种酶,例如反转录酶和/或Taq聚合酶,以及dNTP、缓冲液或非人类的多核苷酸,如小牛胸腺或鲑鱼精子DNA。试剂盒分析的结果可以由保健提供者或诊断实验室进行解释。此外,诊断试剂盒也可以生产并销售给个人用于自我诊断。
除了根据多态性的存在或不存在诊断疾病之外,一些与癌症相关的疾病是来自特定的组织中本发明的蛋白或基因的水平偏离,或本发明蛋白表达的方式异常。例如,通过监测各种组织中的表达水平,可以进行诊断或可以鉴定疾病的状态。同样地,通过确定在特定组织中各种不同的本发明蛋白的表达水平的比率(例如表达模式),可以作出健康或疾病的预测。来自健康的个体以及患有癌症的个体的不同组织中本发明蛋白的表达水平被测定。这些数值可以记录在数据库中,并与从测试个体获得的数值进行比较。此外,来自健康的和患病的个体的各种组织中的比率或表达方式都被记录在数据库中。这些分析被称为“疾病状态图谱”,通过比较一个疾病状态图谱(例如来自健康的或患病的个体)与一个来自测试个体的疾病状态图谱,临床医师可以快速地诊断是否存在疾病。
上述的基于核酸和蛋白的诊断技术可用于检测组织中本发明的基因或蛋白表达的水平或量或比率。例如通过定量的Northern印迹、原位分析、免疫组织化学、ELISA、基因芯片阵列技术、PCR和Western印迹,特定的本发明蛋白(野生型或突变体)的RNA或蛋白的表达量或水平可以被快速地测定,并根据这些信息表达的比率可以确定。此外,被分析的本发明的蛋白可以是现在未知的,但是基于它们拥有上述的一个或多个同源区域而被鉴定的家族成员。
可以相信,不用进一步的描述,本领域的普通技术人员就可以使用前面的描述和后面的说明性实施例,制造和使用本发明的化合物并实施被权利要求保护的方法。因此,下面的工作实施例只是具体地指出了本发明的优选实施方案,并不被推论为以任何方式对本公开的剩余部分进行限制。
实施例实施例1鉴定癌症中差异表达的mRNA-1对肿瘤活检和正常组织之间基因表达的整体变化使用Gene Logic,Inc.(Gaithersburg,MD)的GeneExpress Oncology DatasuiteTM进行检测。数据库包括了使用Affymetrix人基因组U95阵列产生的来自不同器官的正常和癌组织样品的基因表达图谱。在数据库的这些组织样品中,分析正常和癌组织组的表达图谱,所述组织组来自乳腺、结肠、食道、肾、肝、肺、淋巴结、卵巢、胰腺、前列腺、直肠和胃。
Affymetrix人基因组U95阵列含有63,175个探针组。探针组是检测一个转录本(基因或cDNA克隆)的一组探针,通常由16-20个寡核苷酸探针对组成。这些探针对包括了完全匹配的组和错配的组,二者对于计算平均差都是必需的。平均差用作转录本表达水平的相对指示器(indicator),并且是对每个探针对的强度差的度量,通过用完全匹配的强度减去错配的强度而计算。这考虑到了探针对之间杂交的可变性以及能够影响荧光强度的其它杂交假象。使用计算出的平均差值,对每个基因建立了绝对信号(absolute call)“不存在”(=没有检测到)、“存在”(=检测到)或“处于边缘”(=不清楚是否存在)。
使用下面的统计方法确定癌组织和正常组织样品之间基因的差异表达。(1)对于每个探针组,使用Affymetrix微阵列组(MicroarraySuite)(v4.0)确定平均差值和绝对信号;(2)在一个给定的样品组中,使用MatLab程序(The MathWorks,Inc.,Natick,MA)通过基本成分分析(PCA)检测组织样品中的无关项。在PCA中使用的数据点是随机选择的探针组(5,000~6,000个探针组)的平均差。无关项被排除出进一步的分析;(3)通过使用GeneExpress程序的倍率变化分析工具分析基因表达的变化。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中每个基因的平均差的平均值和正常组织样品组中该基因的平均差的平均值而计算的。获得在表达水平上有至少3倍的增加或减少的基因。如果基因通过方差测试分析(Steel等,Principles and Procedures ofStatisticsA Biometrical Approach(统计学原理和程序生物测量方法),第三版,McGraw-Hill,1997)测定显示出的p-值少于或等于0.05,它们就被包括在分析中;(4)选择至少在5种不同类型癌症中表现出差异表达的基因。
对芯片数据的分析显示出标记物LFG1的表达在癌组织样品中与正常组织样品中相比显著上调了。LFG1(SEQ ID NO1或3)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.91875_s_at测定。91875_s_at序列来自EST AI053741。91875_s_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,显示在表1中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.151359-1367)。表1中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-1的上调可以诊断癌症。
表1
通过测定结合到芯片序列片段no.91875_s_at的样品得到的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。分析中使用的PCR引物(5’-GCTGAAGCAGGAAAATCGCTT-3’(SEQ ID NO17)和5’-TGAGACGGAGTCTCACTCGGT-3’(SEQ ID NO18))是基于特定的Affymetrix片段(91875_s_at)的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、肝、肺、卵巢、胃和胰腺的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-1的上调。
实施例2与差异表达的mRNA对应的全长人cDNA(LFG1)的克隆使用来自人心脏的cDNA文库(ResGen,Huntsville,AL)通过聚合酶链反应(PCR)和cDNA末端的快速扩增(RACE)获得了具有SEQ IDNO1或3的全长cDNA。使用人基因组浏览器程序(Human GenomeBrowser(University of California,Santa Cruz))在预测的含有91875_s_at序列的基因的基础上设计了用于PCR的基因特异性的寡核苷酸(5’-CACCCTTTGCCTCTGTCACTTCCGCA-3’(SEQ ID NO21)、5-GCTGGAGCACCAGGACTGCATTG-3’(SEQ ID NO22)、5’-GGAGCTGAGCAGCAGTGTAATGAA-3’(SEQ ID NO23)、5’-GAGGCCTGCCTGAAGGAGGAGCTTC-3’(SEQ ID NO24)、5’-TCTGGAAGTAGTGCAGACGCCTCAGG-3’(SEQ ID NO25)、5’-AGCCAACGTCGGCTTTGTTATCCAGC-3’(SEQ ID NO26)、5’-GCTGTCAGATATGATGGTTCTGGAC-3’(SEQ ID NO27)、5’-CCAGCCTCACCACTGTTGGGTTGC-3’(SEQ ID NO28)、5’-CATTCTCTGAGCTGTATTAGTGT-3’(SEQ ID NO29)、5’-CCTGAGCTGGAATGACCTGCA-3’(SEQ ID NO30)、5’-CTTTGTGTTGGCTGCAGCCACA-3’(SEQ ID NO31)、5’-TGAGGAGAGACTTTGCTGACTGGT-3’(SEQ ID NO32)、5’-GTCCTGTCTGGCGGTGCCGA-3’(SEQ ID NO33)、5’-GCTCCAGGATCCCCTGTCACCTGGGCCTTCTGCCTTTTGGCT-3’(SEQ ID NO34)、5’-CCATATGGAGAGGAGAGCAGCGGGCCCA-3’(SEQ ID NO35)、5’-GAAGGAGGAACATGGAGAGGAGA-3’(SEQ IDNO36)、5’-CCATATGCCCCGGGTAGTCTACTGCAT-3’(SEQ IDNO37)、和5’-GTCGACTCGAGTCACTTCCGCAAAAACTTCTTG-3’(SEQ ID NO38)),以及用于RACE的寡核苷酸(5’-TCCATTCCGAAGGCTCTCCTCC-3’(SEQ ID NO39)、5’-GTCTGTGTGACGGAAATGTAAGC-3’(SEQ ID NO40)和5’-GAAGGTCGAAGGCAGACCGATGT-3’(SEQ ID NO41))。带有引物序列的扩增产物使用Topo克隆系统(Topo Cloning System(Invitrogen,Carlsbad,CA))被整合到PCR4-Topo载体中,然后测序。
对应于上面检测到的差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO1和3中。前者中,cDNA含有5293个碱基对。后者中cDNA含有5317个碱基对。
SEQ ID NO1的cDNA核苷酸序列中的可读框,位于390-4880位核苷酸(包括终止密码子为390-4883位核苷酸),编码了1497个氨基酸的蛋白。对应于SEQ ID NO1所编码的预测蛋白的氨基酸序列显示在SEQ ID NO2中。图2显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO2的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO3的cDNA核苷酸序列中的可读框,位于12-4904位核苷酸(包括终止密码子为12-4907位核苷酸),编码了1631个氨基酸的蛋白。对应于SEQ ID NO3所编码的预测蛋白的氨基酸序列显示在SEQ ID NO4中。图3显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO4的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO2的蛋白序列与SEQ ID NO4的蛋白序列相同,除了SEQ ID NO2缺失SEQ ID NO4 N-端的前134个氨基酸之外。
SEQ ID NOS2和4含有Calponin同源结构域(SEQ ID NO4的38-145位氨基酸)、用于结合钙调蛋白的IQ结构域(SEQ ID NO2的629-646位氨基酸和SEQ ID NO4的763-780位氨基酸)、RasGAP结构域(SEQ ID NO2的858-1195位氨基酸和SEQ ID NO4的992-1329位氨基酸)以及RasGAP C-末端结构域(SEQ ID NO2的1298-1421位氨基酸和SEQ ID NO4的1432-1555位氨基酸)。SEQ ID NOS2和4与IQGAP蛋白类似(Weissbach等(1994),J Biol Chem 26920517-20521;Brill等(1996),Mol Cell Biol 164869-4878)。IQGAP结合到参与细胞骨架结构、细胞-细胞附着和增殖信号传导的蛋白上并调节这些蛋白的功能(Fukada等(2002),Cell 1091-20;Briggs等(2002),J Biol Chem2777453-7465;McCallum等(1998),J Biol Chem 27322537-22544)。IQGAP1缺陷的小鼠相对于野生型表现出显著增加的晚期发作的胃增生(Li等(2000),Mol Cell Biol 20697-701)。
进行了Northern印迹分析以测定对应于LFG1的mRNA转录本的大小。使用包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有91875_s_at序列的EST通过随机引物方法进行放射性标记,并被用作印迹探针。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有3个转录本,大小大约为7.2kb和6.3kb。这与LFG1克隆(SEQ ID NO1和3)的大小一致。
实施例3鉴定癌症中差异表达的mRNA-2重复实施例1中的过程,除了以标记物LFG2代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG2的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG2(SEQ ID NO5)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.82941_at测定。82941_at序列来自EST AI277612。82941_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表2中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.151359-1367)。表2中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-2的下调可以诊断癌症。
表2
通过结合到芯片序列片段no.82941_at的样品测定得到的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ ID NO42)和5’-TGTAGAAACTCTTGGACTAATGGAGG-3’(SEQ ID NO43))是基于分析中使用的含有Affymetrix片段(82941_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-2的下调。
实施例4与差异表达的mRNA对应的全长人cDNA(LFG2)的克隆具有SEQ ID NO5的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有82941_at序列的EST的序列设计了基因特异的寡聚物(5’-GAATGTGTCAGAGACAAGTGCAGC-3’(SEQ IDNO42))。这个寡聚物用生物素标记,并用来与来自分化很少的胃腺癌文库(NCI CGAP Gas4)(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合了链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌(E.coli)细胞(DH10B),筛选出最长的cDNA。阳性的选择使用基因特异性的引物通过PCR进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO5中。该cDNA含有3608个碱基对。
SEQ ID NO5的cDNA核苷酸序列中的可读框,位于424-1908位核苷酸(包括终止密码子为424-1911位核苷酸),编码了495个氨基酸的蛋白。对应于SEQ ID NO5所编码的预测蛋白的氨基酸序列显示在SEQ ID NO6中。
SEQ ID NO6与清除受体具有同源性,该受体参与选定的多聚阴离子配体的胞吞作用、凋亡细胞和细菌的吞噬作用、细胞附着以及动脉粥样硬化的发展(Peiser等(2002),Curr.Opin.Immunol.14123-128;Resnick等(1994),Trends Biol.Sci.195-8)。基于已出版的清除受体的研究工作,SEQ ID NO6含有细胞质结构域(1-35位氨基酸)、跨膜结构域(36-58位氨基酸)、α-螺旋卷曲的结构域(90-301位氨基酸)、胶原蛋白样结构域(305-380位氨基酸)以及清除受体的富含半胱氨酸(SRCR)的结构域(393-493位氨基酸)。SRCR结构域含有6个半胱氨酸残基(418、431、462、472、482和492位氨基酸),其可以参与结构域内二硫键的形成。SEQ ID NO6也显示出与小鼠同系物(GenBank登录No.BC016096)的同源性。它在整个连续的序列中显示出70%的同一性。
图4显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO6的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG2的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人MTN印迹,Clontech,Palo Alto,CA),含有82941_at序列的EST通过随机引物方法进行放射性标记,并被用来作印迹探针。印迹在含有50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为3.7kb。这与LFG2克隆(SEQ ID NO5)的大小一致。
实施例5鉴定癌症中差异表达的mRNA-3重复实施例1中的过程,除了以标记物LFG3代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG3的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG3(SEQ ID NO7)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.46104_at测定。46104_at序列来自EST AA772055。46104_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表3中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.151359-1367)。表3中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-3的下调可以诊断癌症。
表3
通过样品结合到芯片序列片段no.46104_at测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQ ID NO44)和5’-TAGATGTTTGGGCAACAGCCT-3’(SEQ IDNO45)是基于分析中使用的含有Affymetrix片段(46104_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肾、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-3的下调。
实施例6与差异表达的mRNA对应的全长人cDNA(LFG3)的克隆具有SEQ ID NO7的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有46104_at序列的EST的序列设计了基因特异的寡聚物(5’-GTATGCATCAGAATTCCCTATAGATCTTT-3’(SEQID NO44))。这个寡聚物用生物素标记,并用来与来自人胎肾(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合有链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌(E.coli)细胞(DH10B),并筛选出最长的cDNA。阳性选择通过使用基因特异性的引物进行PCR确认后,对cDNA克隆进行DNA测序。LFG3的5’-末端通过cDNA末端的快速扩增(RACE)来鉴定,使用了从人胎肾制备的cDNA(Clontech,Palo Alto,CA)和基因特异性的引物(5’-TTCCTTCACCAAAGGCATCCAGCCATTCTATG-3’(SEQ ID NO46))。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO7中。该cDNA含有3162个碱基对。
SEQ ID NO7的cDNA核苷酸序列中的可读框,位于405-1835位核苷酸(包括终止密码子为405-1838位核苷酸),编码了477个氨基酸的蛋白。对应于SEQ ID NO7所编码的预测蛋白的氨基酸序列显示在SEQ ID NO8中。
SEQ ID NO8与单羧酸转运蛋白(MCTs)相似,含有10个预测的跨膜结构域(10-29、80-99、107-128、140-160、274-295、312-332、339-360、363-384、396-416和433-451位氨基酸)。MCT蛋白催化单羧酸例如乳酸、丙酮酸、支链酮酸、酮体、β-羟基丁酸和乙酸的易化运输(Halestrap和Price(1999),Biochem.J.343281-299)。表4总结了SEQ ID NO4与8个已知的单羧酸转运蛋白的相似性比例。
表4.LFG3与MCT蛋白的同源性
图5显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO8的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG3的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有46104_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为4.2kb。这与LFG3克隆(SEQ ID NO7)的大小一致。
实施例7鉴定癌症中差异表达的mRNA-4重复实施例1中的过程,除了以标记物LFG4代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG4的表达在癌组织样品中与正常组织样品中相比显著地下调了。LFG4(SEQ ID NO9)的表达水平可以在Affymetrix GeneChipsU95上用芯片序列片段no.62158_at测定。62158_at序列来自EST AI123532。62158_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表5中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.151359-1367)。表5中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-4的下调可以诊断癌症。
表5
通过样品结合到芯片序列片段no.62158_at所测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAATGTCTGATTACCCCATTTTATCAGT-3’(SEQ ID NO47)和5’-TAATCCTGAAATGAACAGCTAACA-3’)(SEQ ID NO48))是基于分析中使用的含有Affymetrix片段(62158_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ ID NO19)和5′-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO20))被用作对照引物。这种方法提供了以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自结肠、肝、肺、卵巢、胰腺和胃的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-4的下调。
实施例8与差异表达的mRNA对应的全长人cDNA(LFG4)的克隆具有SEQ ID NO9的全长cDNA通过cDNA末端的快速扩增(RACE)获得。简单地说,基于含有62158_at序列的EST的序列设计了基因特异性的寡聚物((5’-TAATGTTAGAGTAACAGCATTTTCCTTCAA-3’(SEQ ID NO49)和5’-TGCCCCACACTAACTCAGTTCTTGTGATG-3’(SEQ ID NO50))。这个寡聚物被用来对从人脑制备的cDNAs(Clontech,Palo Alto,CA)进行PCR扩增。带引物的扩增产物使用Topo克隆系统(Invitrogen,Carlsbad,CA)整合到PCR4-Topo载体中,然后测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO9中。该cDNA含有4891个碱基对。
SEQ ID NO9的cDNA核苷酸序列中的可读框,位于89-1150位核苷酸(包括终止密码子为89-1153位核苷酸),编码了354个氨基酸的蛋白。对应于SEQ ID NO9所编码的预测蛋白的氨基酸序列显示在SEQ ID NO10中。
SEQ ID NO10与大鼠的Kilon和鸡的Neurotractin(Funatsu等(1999),J Biol Chem 2748224-8230;Marg等(1999),J Cell Biol 145865-876)相似。蛋白序列分析发现了分泌信号肽(1-33位氨基酸)、3个免疫球蛋白结构域(47-136、145-208和231-312位氨基酸)以及6个推断的N-连接糖基化位点(73、155、275、286、294和307位氨基酸)。Kilon/Neurotractin是免疫球蛋白超家族的IgLON亚家族的一个成员。IgLONs是一族糖基化磷脂酰肌醇(GPI)连接的细胞附着分子,被认为修饰了轴突的突起(outgrowth),可能在细胞-细胞附着和识别中发挥作用(Miyate等(2000),J Comparative Neurol 42474-85)。
图6显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO10的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。这个亲水性图显示出在C末端存在疏水区域。在GPI锚定蛋白的情况下,已知GPI锚的添加发生在切除C末端的疏水区域之后。推断的GPI锚连接位点被发现(324位氨基酸处的甘氨酸)。
进行了Northern印迹分析以测定对应于LFG4的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有62158_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,并用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有单一的转录本,大小大约为5.4kb。这与LFG4克隆(SEQ ID NO9)的大小一致。
实施例9鉴定癌症中差异表达的mRNA-5
重复实施例1中的过程,除了以标记物LFG5代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG5的表达在癌组织样品中与正常组织样品中相比显著下调了。LFG5(SEQ ID NO11)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.46659_at测定。46659_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表6中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。表6中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-5的差异表达可以诊断癌症。
表6
通过结合到芯片序列片段no.46659_at的样品测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-AAGGCTTTATCAGGTCTGCATATAGAATC-3’(SEQ ID NO51)和5’-GCAAAGAACCCTAATGCTATTTATCAGC-3’(SEQ ID NO52))是基于分析中使用的特异性Affymetrix片段(46659_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肾、肺、卵巢和胰腺的正常和肿瘤组织的总RNA对(Ambion,Inc.,Austin,TX)。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-5的差异表达。
实施例10与差异表达的mRNA对应的全长人cDNA(LFG5)的克隆具有SEQ ID NO11的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有46659_at序列的EST的序列设计了基因特异的寡聚物(5’-GAGAAGACCAGGGAAGAAGCAG-3’(SEQ IDNO53))。这个寡聚物用生物素标记,用来与来自人心脏文库(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。阳性的选择通过PCR使用基因特异的引物进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO11中。该cDNA含有3098个碱基对。
SEQ ID NO11的cDNA核苷酸序列中的可读框,位于223-1569位核苷酸(包括终止密码子为223-1572位核苷酸),编码了449个氨基酸的蛋白。对应于SEQ ID NO11所编码的预测蛋白的氨基酸序列显示在SEQ ID NO12中。
SEQ ID NO12含有胸苷酸激酶结构域(257-438位氨基酸)。胸苷酸激酶是核苷酸单磷酸激酶(NMPKs)的成员,在用于RNA和DNA合成的核苷酸的合成中发挥作用,为治疗性核苷和核苷酸类似物的药物活化所需要(Van Rompay等(2000),Pharmacology & Therapeutics87189-198)。SEQ ID NO12与在巨噬细胞活化的过程中被诱导(Lee和O’Brien(1995),J Immunol.1546094-6102)的小鼠胸苷酸激酶(GenBank Accession No.NM_020557)显示出同源性。它在整个连续的序列上显示出63%的同一性。
图7显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO12的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
进行了Northern印迹分析以测定对应于LFG5的mRNA转录本的大小。使用了包含来自不同人组织的总RNAs进行Northern印迹(人MTN印迹,Clontech,Palo Alto,CA),含有82941_at序列的EST通过随机引物方法进行放射性标记,并被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有一个单一的转录本,大小大约为3.0kb。这与LFG5克隆(SEQ ID NO11)的大小一致。
实施例11鉴定癌症中差异表达的mRNA-6重复实施例1中的过程,除了以标记物LFG6代替标记物LFG1之外。
对芯片数据的分析显示出标记物LFG6的表达在癌组织样品中与正常组织样品中相比显著地上调了。LFG6(SEQ ID NO13或15)的表达水平可以在Affymetrix GeneChipsU95上通过芯片序列片段no.44103_at测定。44103_at序列来自EST AA865614。44103_at在各种不同恶性肿瘤中的表达水平,与正常对照组织的比较,被显示在表7中,其中也标明了倍率变化、改变的方向(上调或下调)和p-值。倍率变化(癌组织/正常组织)是通过比较癌组织样品组中平均差的几何平均值和正常组织样品组中平均差的几何平均值而计算出来的。倍率变化大于1.5被认为是有意义的(Wodicka等(1997),Nature Biotech.151359-1367)。表7中也标明了每个组织类型中,被称为存在、不存在或处于边缘的样品数量以及该样品组中样品的总数。这些数据表明LFG-6的上调可以诊断癌症。
表7
对通过结合到芯片序列片段no.44103_at的样品测定的基因芯片表达结果,使用Taqman分析(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)进行确认。PCR引物(5’-GGACGGGGAACTTGGACGC-3’(SEQ IDNO54)and 5’-AAGTGCAGGGCCTCTGGGTG-3’(SEQ ID NO55))是基于分析中使用的含有Affymetrix片段(44103_at)的EST的序列信息文件而设计的。在每个RNA样品(总共10ng RNA)中的靶基因相对于参比基因进行分析。出于这个目的,特异性针对CTBP1基因(C-末端结合蛋白1)的引物(5’-GTTTTTCCTAATTTTGGCATGAAC-3’(SEQ IDNO19)和5’-CGCCCAAGCTTTTCCTTTT-3’(SEQ ID NO20))被用作对照引物。这种方法提供以靶mRNA的循环阈值(Ct)相对于CTBP1循环阈值的量测量的相对表达。样品组包括来自肝和卵巢(Ambion,Inc.,Austin,TX)的正常和肿瘤组织的总RNA对。Q-RT-PCR数据证实了在癌组织中与正常样品相比LFG-6的上调。
实施例12.与差异表达的mRNA对应的全长人cDNA(LFG6)的克隆具有SEQ ID NO13或15的全长cDNA通过寡聚物延伸方法(oligo-pulling method)使用GeneTrapper分析(Life Technologies,Rockville,MD)获得。简单地说,基于含有44103_at序列的EST的序列设计了基因特异性的寡聚物(5’-CGCTGGGTCATCGGACGGT-3’(SEQ ID NO56))。这个寡聚物用生物素标记,用来与来自完全分化的人胃腺癌文库(ResGen,Huntsville,AL)的5μg单链质粒DNA(cDNA重组子)杂交,采用Sambrook等描述的步骤。杂交的cDNAs通过结合链亲和素的珠子进行分离,以及通过加热洗脱。洗脱的cDNA被转变为双链质粒DNA,用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。阳性选择通过PCR使用基因特异性的引物进行确认后,对cDNA克隆进行DNA测序。
上述检测到的对应于差异调控的mRNA的全长人cDNAs的核苷酸序列显示在SEQ ID NO13和15中。前者中cDNA含有1893个碱基对。后者中cDNA含有1597个碱基对。
SEQ ID NO13的cDNA核苷酸序列中的可读框,位于418-1392位核苷酸(包括终止密码子为418-1395位核苷酸),编码了325个氨基酸的蛋白。对应于SEQ ID NO13所编码的预测蛋白的氨基酸序列显示在SEQ ID NO14中。图9显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO14的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO15的cDNA核苷酸序列中的可读框,位于271-1431位核苷酸(包括终止密码子为271-1434位核苷酸),编码了387个氨基酸的蛋白。对应于SEQ ID NO15所编码的预测蛋白的氨基酸序列显示在SEQ ID NO16中。图10显示了使用Kyte-Doolittle值(Kyte和Doolittle(1982),J.Mol.Biol.157105-142)对SEQ ID NO16的氨基酸序列的疏水性分析结果。亲水性的区域可以如前所述用来生产抗原肽。
SEQ ID NO14和16含有泛素蛋白同源(UBQ)结构域(239-300位氨基酸)。SEQ ID NOS14和16与大鼠的Sharpin蛋白相似(Lim等(2001),Mol Cell Neurosci 17385-397)。Sharpin直接与Shank蛋白的锚蛋白重复序列相互作用,Shank蛋白在的细胞骨架复合物的结构和特化细胞连接处的细胞内信号传导中起作用(Sheng和Kim(2000),J Cell Sci1131851-1856)。
进行了Northern印迹分析以测定对应于LFG6的mRNA转录本的大小。使用了包含来自人不同组织的总RNAs进行Northern印迹(人12-道MTN印迹,Clontech,Palo Alto,CA),含有44103_at序列的EST通过随机引物方法进行放射性标记,被用来探测印迹。印迹在50%甲酰胺、5×SSPE、0.1%SDS、5×Denhart氏溶液和0.2mg/ml鲱鱼精子DNA中于42℃下进行,用含有0.1%SDS的0.2×SSC在室温下清洗。Northern印迹显示出该基因有三个转录本,大小大约为3.0kb、1.5kb和1.2kb。这与LFG6克隆(SEQ ID NO13和15)的大小一致。
尽管参考上述的实施例,本发明已经被描述得很详细,应该理解的是在不偏离本发明实质的情况下可对发明进行各种不同的修饰。因此,本发明只受到后面的权利要求的限制。所有在本申请中引用的专利、专利申请和出版物,在此以其全文引为参考。
序列表<110>株式会社LG生命科学(LG Life sciences Ltd.)<120>与癌症相关的基因家族(Gene Famililies Associated With Cancers)<130>SCT051353-47<150>US60/419911<151>2002-10-18<150>US60/419912<151>2002-10-18<150>US60/420088<151>2002-10-18<150>US60/434243<151>2002-12-16<150>US60/434278<151>2002-12-16<150>US60/438278<151>2003-01-03<160>56<170>KopatentIn 1.71<210>1<211>5293<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(390)..(4880)<223>LBFL109 Clone A<400>1gtcctgtctg gcggtgccga cggtgagggg cggtggccca acggcgggag attcaaacct 60
ggaagaagga ggaacatgga gaggagagca gcgggcccag gctgggcagc ctctggatcg 120aggcctgcct gaaggaggag cttccttccc cggtggagct ggaggagagc cttcggaatg180gagtgctgct ggccaagctg ggccactgtt ttgcaccctc cgtggttccg ttgaagaaga240tctacgatgt ggagcagctg cggtaccagg caactggctt acatttccgt cacacagaca300acatcaactt ttggctatct gcaatagccc acatcggtct gccttcgacc ttcttcccag360agaccacgga catctatgac aaaaagaac atg ccc cgg gta gtc tac tgc atc 413Met Pro Arg Val Val Tyr Cys Ile1 5cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc cct cag ata 461His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile10 15 20cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa ctc agc aac 509His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn25 30 35 40atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct gcc ttc agc 557Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser45 50 55aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat gag gct gca 605Lys Ile Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala60 65 70gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag cga ggg gtg 653Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val75 80 85gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct ctt ctg gag 701Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu90 95 100aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg ctg gcc cag 749Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln105 110 115 120gcc aag atg gag aag gca gcc aat gcc agg aac cat gat gac aga gaa 797Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu
125 130 135agc cag gac atc tat gac cac tac cta act cag gct gaa atc cag ggc 845Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly140 145 150aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt gtt gat gat 893Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp155 160 165gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc ctt caa gac 941Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp170 175 180cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct gac tgg tac 989Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr185 190 195 200ctg gag cag ctg aac tca gac aga gag cag aag gca cag gag ctg ggc 1037Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly205 210 215ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt gtg gct gca 1085Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala220 225 230gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac gct gtg cag 1133Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln235 240 245cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac act gtg aag 1181Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys250 255 260gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac cct gtt gca 1229Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala265 270 275 280tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag cag cag ggg 1277Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly285 290 295gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg ctc tca gct 1325Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala
300 305 310gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc agt ggc ttc 1373Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe315 320 325tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag gtg gaa gga 1421Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly330 335 340gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg cga cag gag 1469Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu345 350 355 360cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg cag gcc acc 1517Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr365 370 375gtg agc cag gtc aat gca cag acc cag gaa gag act gac cgg gtc ctt 1565Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu380 385 390gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc cct gag aag 1613Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys395 400 405act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat gat gtc agc 1661Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser410 415 420ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca gcc aaa agg 1709Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg425 430 435 440cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg tgg ctt gag 1757Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu445 450 455gag atc cgc cag gga gtg gtc aga gcc aac cag gac act aat aca gct 1805Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala460 465 470cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc atc aag gag 1853Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu
475 480 485ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc gca gtg gcc 1901Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala490 495 500ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag cga gcc ctg 1949Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu505 510 515 520gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca gct ttc tgg 1997Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp525 530 535gtt caa cat gac atg aag gat ggc act gcc tac tac ttc cat ctg cag 2045Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln540 545 550acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc ctc aac acc 2093Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr555 560 565tct cac ctg acc cgg gag gag atc cag tca gct gtc acc aag gtc act 2141Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr570 575 580gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc ggc ttt gtt 2189Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val585 590 595 600atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg cag aag ttt 2237Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe605 610 615gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca gtc atc aag 2285Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys620 625 630atc cag gct cat tgg cgg ggt tat agg cag cgg aag att tac ctg gag 2333Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu635 640 645tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc aag atc cag 2381Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln
650 655 660gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg agg cgt ctg 2429Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu665 670 675 680cac tac ttc cag aag aat gtt aac tcc att gtg aag atc cag gca ttt 2477His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe685 690 695ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta gtg cat gca 2525Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala700 705 710ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat ctc ttg aat 2573Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn715 720 725caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg aag ctc cag 2621Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln730 735 740gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg gag cag gac 2669Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp745 750 755 760ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag aac cgg atc 2717Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile765 770 775act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc aag agg aat 2765Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn780 785 790aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag aag ggt tta 2813Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu795 800 805aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca tac caa cac 2861Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His810 815 820ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc aag ctg atc 2909Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile
825 830 835 840ttt cag atg cca cag aac aaa acc acc aag ttc atg gag gca gtg att 2957Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile845 850 855ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc tat ctc ctg 3005Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu860 865 870ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag tca aag gtg 3053Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val875 880 885gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg gtg agg ctg 3101Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu890 895 900gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc ctg cag gag 3149Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu905 910 915 920att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa gtg ctc agc 3197Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser925 930 935gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc aac cag act 3245Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr940 945 950gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat gtc acc ccg 3293Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro955 960 965gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg gac atc gcc 3341Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala970 975 980cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta gcc atc acc 3389Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr985 990 9951000tca tct gtg gac caa att ccg tat ggg atg cga tat gtg gcc aaa gtc 3437Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val
100510101015ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca gac agc gag 3485Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu102010251030gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc ctg aac cca 3533Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro103510401045gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg gca gct ggt 3581Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly105010551060gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct gtg gct cag 3629Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln1065 107010751080ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg cag agc cag 3677Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln108510901095cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac ctc aag ttc 3725His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe110011051110agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca gag gag cgt 3773Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg111511201125ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc aaa ccc atg 3821Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met113011351140gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg ctg ttg ctg 3869Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu1145 115011551160gag cac cag gac tgc att gcc cct gat cac caa gac ccc ctg cat gag 3917Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu116511701175ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac ctt att ggt 3965Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly
118011851190gag agc atc gct gca gat ggg cac aca gac ctg agc aag cta gaa gtg 4013Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val119512001205tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca gat gct gat 4061Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp121012151220gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag ctg ttg gcc 4109Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala1225 123012351240gat atc ata cag ttc cat cct ggg gac acc ctc aag gag atc ctg tcc 4157Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser124512501255ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag ctg atg agc 4205Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser126012651270cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg cga cga cac 4253Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His127512801285cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag aag cag cgg 4301Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg129012951300cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg ttg gtc agc 4349Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser1305 131013151320gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc aag gac atc 4397Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile132513301335cgc aac cag cac aga cac agg cac agg cgg aag gca gag ctg gtg aag 4445Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala G1u Leu Val Lys134013451350ctg cag gcc aca tta cag ggc ctg agc act aag acc acc ttc tat gag 4493Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu
135513601365gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc ctg gac cac 4541Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His137013751380ctg gcc cec gac tcc aag agt tct ggg aag ggg aag aag cag cct tct 4589Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser1385 139013951400ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc ttg gtg gaa 4637Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu140514101415att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc ttt gac atc 4685Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile142014251430acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc aag ttc ctg 4733Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu143514401445ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat ctc ctg cag 4781Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln145014551460ctc cag tat gag ggt gtg gct gtc atg aaa ctc ttc aac aag gcc aaa 4829Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys1465 147014751480gtc aat gtc aac ctt ctc atc ttc ctc ctc aac aag aag ttt ttg cgg 4877Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg148514901495aagtgacagaggc aaagggtgct acccaagccc ctcttacctc tctggatgct 4930Lysttctttaaca ctaactcacc actgtgcttc cctgcagaca cccagagctc aggactgggc 4990aaggcccagg gattctcacc ccttccccag ctgggaggag cttgcctgcc tggccacaga 5050cagtgtatct tctaattggc taaagtgggc cttgcccaga gtccagctgt gtggctttta 5110tcatgcatga caaacccctg gctttcctgc cagatggatt ctcatccctt acagctgact 5170
cttccaggca atttccatag atctgcagtc ctgcctctgc cacagtctct ctgttgtccc 5230cacatctacc caacttcctg tactgttgcc cttctgatgt taataaaagc agctgttact 5290ccc 5293<210>2<211>1497<212>PRT<213>智人(Homo sapiens)<400>2Met Pro Arg Val Val Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe1 5 10 15Arg Leu Gly Leu Ala Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys20 25 30Phe Thr Ala Glu Glu Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr35 40 45Gly Leu Gin Leu Pro Ala Phe Ser Lys Ile Gly Gly Ile Leu Ala Asn50 55 60Glu Leu Ser Val Asp Glu Ala Ala Val His Ala Ala Val Leu Ala Ile65 70 75 80Asn Glu Ala Val Glu Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu85 90 95Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala100 105 110Val Tyr Gln Glu Met Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn115 120 125Ala Arg Asn His Asp Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr130 135 140Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile Asn His Val Asn Val His145 150 155 160
Gly Ala Leu Glu Val Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu165 170 175Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val180 185 190Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg195 200 205Glu Gln Lys Ala Gln Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu210 215 220Glu Val Gln Ala Gly Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu225 230 235 240Gln Ala Met Leu His Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg245 250 255Gly Val Ala Ala Asp Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln260 265 270Leu Pro Pro Val Tyr Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu275 280 285Ala Val Leu Gln Gln Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe290 295 300Val Ala Val Glu Met Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu305 310 315 320Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala325 330 335Thr Gly Leu Ala Glu Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp340 345 350Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu355 360 365Ser Trp Asn Asp Leu Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr370 375 380Gln Glu Glu Thr Asp Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala385 390 395 400
Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro405 410 415Ala Ala Gly Leu Asp Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His420 425 430Leu Leu Leu Val Ala Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp435 440 445Pro Gly Ala Val Leu Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg450 455 460Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala465 470 475 480Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg485 490 495Val Leu Arg Asn Pro Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys500 505 510Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln515 520 525Arg Pro Ala Asp Thr Ala Phe Trp Val Gln His Asp Met Lys Asp Gly530 535 540Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln545 550 555 560Pro Pro Gly Cys Pro Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile565 570 575Gln Ser Ala Val Thr Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu580 585 590Trp Lys Ala Asn Val Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg595 600 605Gly Phe Leu Val Arg Gln Lys Phe Ala Glu His Ser His Phe Leu Arg610 615 620Thr Trp Leu Pro Ala Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr
625 630 635 640Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn645 650 655Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala660 665 670Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn675 680 685Ser Ile Val Lys Ile Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp690 695 700Asp Tyr Arg Ile Leu Val His Ala Pro His Pro Pro Leu Ser Val Val705 710 715 720Arg Arg Phe Ala His Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala725 730 735Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg740 745 750Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile755 760 765Gly Leu Leu Val Lys Asn Arg Ile Thr Leu Gln Glu Val Val Ser His770 775 780Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met785 790 795 800Val Leu Asp Lys Gln Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg805 810 815Gln Lys Leu Glu Ala Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln820 825 830Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr835 840 845Thr Lys Phe Met Glu Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser850 855 860
Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu865 870 875 880Gln Glu Glu Ile Lys Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr885 890 895Gly Asn Pro Thr Val Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly900 905 910Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp915 920 925Val Leu Glu Asp Lys Val Leu Ser Val His Thr Asp Pro Val His Leu930 935 940Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser945 950 955 960His Leu Pro Tyr Asp Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu965 970 975Val Gln Arg Arg Leu Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr980 985 990Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr99510001005Gly Met Arg Tyr Val Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys101010151020Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu1025 103010351040Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe104510501055Asp Ile Val Ala Met Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg106010651070His Ala Leu Gly Ala Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly107510801085Lys Ala Phe Ser Gly Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr109010951100
Leu Glu Glu Thr His Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys1105 111011151120Gln Val Pro Glu Pro Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp112511301135Met Val Ala Val Ala Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu114011451150Val Asn Thr His Arg Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro115511601165Asp His Gln Asp Pro Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu117011751180Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His1185 119011951200Thr Asp Leu Ser Lys Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe120512101215Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu122012251230Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly123512401245Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu125012551260Ala Ala His Lys Gln Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln1265 127012751280Thr Pro Glu Pro Leu Arg Arg His Arg Ser Leu Thr Ala His Ser Leu128512901295Leu Pro Leu Ala Glu Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg130013051310Leu Glu Ala Leu Gly Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu131513201325Val Asp Glu Leu Ala Lys Asp Ile Arg Asn Gln His Arg His Arg His
133013351340Arg Arg Lys Ala Glu Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu1345 135013551360Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln136513701375Tyr Ile Arg Ala Cys Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser138013851390Gly Lys Gly Lys Lys Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu139514001405Leu Glu Lys Gly Val Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His141014151420Phe Arg Asn Val Ile Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys1425 143014351440Phe Glu Val Asn Ala Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln144514501455Leu His Tyr Gln Asp Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val146014651470Met Lys Leu Phe Asn Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe147514801485Leu Leu Asn Lys Lys Phe Leu Arg Lys14901495<210>3<211>5317<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(12)..(4904)<223>LBFL109 Clone B
<400>3gaaggaggaa catg gag agg aga gca gcg ggc cca ggc tgg gca 44Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala1 5 10gcc tat gaa cgc ctc aca gct gag gag atg gat gag cag agg cgg cag 92Ala Tyr Glu Arg Leu Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln15 20 25aat gtt gcc tat cag tac ctg tgc cgg ctg gag gag gcc aag cgc tgg 140Asn Val Ala Tyr Gln Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp30 35 40atg gag gcc tgc ctg aag gag gag ctt cct tcc ccg gtg gag ctg gag 188Met Glu Ala Cys Leu Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu45 50 55gag agc ctt cgg aat gga gtg ctg ctg gcc aag ctg ggc cac tgt ttt 236Glu Ser Leu Arg Asn Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe60 65 70 75gca ccc tcc gtg gtt ccg ttg aag aag atc tac gat gtg gag cag ctg 284Ala Pro Ser Val Val Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu80 85 90cgg tac cag gca act ggc tta cat ttc cgt cac aca gac aac atc aac 332Arg Tyr Gln Ala Thr Gly Leu His Phe Arg His Thr Asp Asn Ile Asn95 100 105ttt tgg cta tct gca ata gcc cac atc ggt ctg cct tcg acc ttc ttc 380Phe Trp Leu Ser Ala Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe110 115 120cca gag acc acg gac atc tat gac aaa aag aac atg ccc cgg gta gtc 428Pro Glu Thr Thr Asp Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val125 130 135tac tgc atc cat gct ctc agt ctc ttc ctc ttc cgg ctg gga ttg gcc 476Tyr Cys Ile His Ala Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala140 145 150 155cct cag ata cat gat cta tac ggg aaa gtg aaa ttc aca gct gag gaa 524Pro Gln Ile His Asp Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu160 165 170
ctc agc aac atg gcg tcc gaa ctg gcc aaa tat ggc ctc cag ctg cct 572Leu Ser Asn Met Ala Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro175 180 185gcc ttc agc aag atc ggg ggc atc ttg gcc aat gag ctc tcg gtg gat 620Ala Phe Ser Lys Ile Gly Gly lle Leu Ala Asn Glu Leu Ser Val Asp190 195 200gag gct gca gtc cat gca gct gtt ctt gcc atc aat gaa gca gtg gag 668Glu Ala Ala Val His Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu205 210 215cga ggg gtg gtg gag gac acc ctg gct gcc ttg cag aat ccc agt gct 716Arg Gly Val Val Glu Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala220 225 230 235ctt ctg gag aat ctc cga gag cct ctg gca gcc gtc tac cag gag atg 764Leu Leu Glu Asn Leu Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met240 245 250ctg gcc cag gcc aag atg gag aag gca gcc aat gcc agg aac cat gat 812Leu Ala Gln Ala Lys Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp255 260 265gac aga gaa agc cag gac atc tat gac cac tac cta act cag gct gaa 860Asp Arg Glu Ser Gln Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu270 275 280atc cag ggc aat atc aac cat gtc aac gtc cat ggg gct cta gaa gtt 908Ile Gln Gly Asn Ile Asn His Val Asn Val His Gly Ala Leu Glu Val285 290 295gtt gat gat gcc ctg gaa aga cag agc cct gaa gcc ttg ctc aag gcc 956Val Asp Asp Ala Leu Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala300 305 310 315ctt caa gac cct gcc ctg gcc ctg cga ggg gtg agg aga gac ttt gct 1004Leu Gln Asp Pro Ala Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala320 325 330gac tgg tac ctg gag cag ctg aac tca gac aga gag cag aag gca cag 1052Asp Trp Tyr Leu Glu Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln335 340 345
gag ctg ggc ctg gtg gag ctt ctg gaa aag gag gaa gtc cag gct ggt 1100Glu Leu Gly Leu Val Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly350 355 360gtg gct gca gcc aac aca aag ggt gat cag gaa caa gcc atg ctc cac 1148Val Ala Ala Ala Asn Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His365 370 375gct gtg cag cgg atc aac aaa gcc atc cgg agg gga gtg gcg gct gac 1196Ala Val Gln Arg Ile Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp380 385 390 395act gtg aag gag ctg atg tgc cct gag gcc cag ctg cct cca gtg tac 1244Thr Val Lys Glu Leu Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr400 405 410cct gtt gca tcg tct atg tac cag ctg gag ctg gca gtg ctc cag cag 1292Pro Val Ala Ser Ser Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln415 420 425cag cag ggg gag ctt ggc cag gag gag ctc ttc gtg gct gtg gag atg 1340Gln Gln Gly Glu Leu Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met430 435 440ctc tca gct gtg gtc ctg att aac cgg gcc ctg gag gcc cgg gat gcc 1388Leu Ser Ala Val Val Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala445 450 455agt ggc ttc tgg agc agc ctg gtg aac cct gcc aca ggc ctg gct gag 1436Ser Gly Phe Trp Ser Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu460 465 470 475gtg gaa gga gaa aat gcc cag cgt tac ttc gat gcc ctg ctg aaa ttg 1484Val Glu Gly Glu Asn Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu480 485 490cga cag gag cgt ggg atg ggt gag gac ttc ctg agc tgg aat gac ctg 1532Arg Gln Glu Arg Gly Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu495 500 505cag gcc acc gtg agc cag gtc aat gca cag acc cag gaa gag act gac 1580Gln Ala Thr Val Ser Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp510 515 520
cgg gtc ctt gca gtc agc ctc atc aat gag gct ctg gac aaa ggc agc 1628Arg Val Leu Ala Val Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser525 530 535cct gag aag act ctg tct gcc cta ctg ctt cct gca gct ggc cta gat 1676Pro Glu Lys Thr Leu Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp540 545 550 555gat gtc agc ctc cct gtc gcc cct cgg tac cat ctc ctc ctt gtg gca 1724Asp Val Ser Leu Pro Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala560 565 570gcc aaa agg cag aag gcc cag gtg aca ggg gat cct gga gct gtg ctg 1772Ala Lys Arg Gln Lys Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu575 580 585tgg ctt gag gag atc cgc cag gga gtg gtc aga gcc aac cag gac act 1820Trp Leu Glu Glu Ile Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr590 595 600aat aca gct cag aga atg gct ctt ggt gtg gct gcc atc aat caa gcc 1868Asn Thr Ala Gln Arg Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala605 610 615atc aag gag ggc aag gca gcc cag act gag cgg gtg ttg agg aac ccc 1916Ile Lys Glu Gly Lys Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro620 625 630 635gca gtg gcc ctt cga ggg gta gtt ccc gac tgt gcc aac ggc tac cag 1964Ala Val Ala Leu Arg Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln640 645 650cga gcc ctg gaa agt gcc atg gca aag aaa cag cgt cca gca gac aca 2012Arg Ala Leu Glu Ser Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr655 660 665gct ttc tgg gtt caa cat gac atg aag gat ggc act gcc tac tac ttc 2060Ala Phe Trp Val Gln His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe670 675 680cat ctg cag acc ttc cag ggg atc tgg gag caa cct cct ggc tgc ccc 2108His Leu Gln Thr Phe Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro685 690 695
ctc aac acc tct cac ctg acc cgg gag gag atc cag tca gct gtc acc 2156Leu Asn Thr Ser His Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr700 705 710 715aag gtc act gct gcc tat gac cgc caa cag ctc tgg aaa gcc aac gtc 2204Lys Val Thr Ala Ala Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val720 725 730ggc ttt gtt atc cag ctc cag gcc cgc ctc cgt ggc ttc cta gtt cgg 2252Gly Phe Val Ile Gln Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg735 740 745cag aag ttt gct gag cat tcc cac ttt ctg agg acc tgg ctc cca gca 2300Gln Lys Phe Ala Glu His Ser His Phe Leu Arg Thr Trp Leu Pro Ala750 755 760gtc atc aag atc cag gct cat tgg cgg ggt tat agg cag cgg aag att 2348Val Ile Lys Ile Gln Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile765 770 775tac ctg gag tgg ttg cag tat ttt aaa gca aac ctg gat gcc ata atc 2396Tyr Leu Glu Trp Leu Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile780 785 790 795aag atc cag gcc tgg gcc cgg atg tgg gca gct cgg agg caa tac ctg 2444Lys Ile Gln Ala Trp Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu800 805 810agg cgt ctg cac tac ttc cag aag aat gtt aac tcc att gtg aag atc 2492Arg Arg Leu His Tyr Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile815 820 825cag gca ttt ttc cga gcc agg aaa gcc caa gat gac tac agg ata tta 2540Gln Ala Phe Phe Arg Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu830 835 840gtg cat gca ccc cac cct cct ctc agt gtg gta cgc aga ttt gcc cat 2588Val His Ala Pro His Pro Pro Leu Ser Val Val Arg Arg Phe Ala His845 850 855ctc ttg aat caa agc cag caa gac ttc ttg gct gag gca gag ctg ctg 2636Leu Leu Asn Gln Ser Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu860 865 870 875
aag ctc cag gaa gag gta gtt agg aag atc cga tcc aat cag cag ctg 2684Lys Leu Gln Glu Glu Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu880 885 890gag cag gac ctc aac atc atg gac atc aag att ggc ctg ctg gtg aag 2732Glu Gln Asp Leu Asn Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys895 900 905aac cgg atc act ctg cag gaa gtg gtc tcc cac tgc aag aag ctg acc 2780Asn Arg Ile Thr Leu Gln Glu Val Val Ser His Cys Lys Lys Leu Thr910 915 920aag agg aat aag gaa cag ctg tca gat atg atg gtt ctg gac aag cag 2828Lys Arg Asn Lys Glu Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln925 930 935aag ggt tta aag tcg ctg agc aaa gag aaa cgg cag aaa cta gaa gca 2876Lys Gly Leu Lys Ser Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala940 945 950 955tac caa cac ctc ttc tac ctg ctc cag act cag ccc atc tac ctg gcc 2924Tyr Gln His Leu Phe Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala960 965 970aag ctg atc ttt cag atg cca cag aac aaa acc acc aag ttc atg gag 2972Lys Leu Ile Phe Gln Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu975 980 985gca gtg att ttc agc ctg tac aac tat gcc tcc agc cgc cga gag gcc 3020Ala Val Ile Phe Ser Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala990 9951000tat ctc ctg ctc cag ctg ttc aag aca gca ctc cag gag gaa atc aag 3068Tyr Leu Leu Leu Gln Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys100510101015tca aag gtg gag cag ccc cag gac gtg gtg aca ggc aac cca aca gtg 3116Ser Lys Val Glu Gln Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val1020 102510301035gtg agg ctg gtg gtg aga ttc tac cgt aat ggg cgg gga cag agt gcc 3164Val Arg Leu Val Val Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala104010451050
ctg cag gag att ctg ggc aag gtt atc cag gat gtg cta gaa gac aaa 3212Leu Gln Glu Ile Leu Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys105510601065gtg ctc agc gtc cac aca gac cct gtc cac ctc tat aag aac tgg atc 3260Val Leu Ser Val His Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile107010751080aac cag act gag gcc cag aca ggg cag cgc agc cat ctc cca tat gat 3308Asn Gln Thr Glu Ala Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp108510901095gtc acc ccg gag cag gcc ttg agc cac ccc gag gtc cag aga cga ctg 3356Val Thr Pro Glu Gln Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu1100 110511101115gac atc gcc cta cgc aac ctc ctc gcc atg act gat aag ttc ctt tta 3404Asp Ile Ala Leu Arg Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu112011251130gcc atc acc tca tct gtg gac caa att ccg tat ggg atg cga tat gtg 3452Ala Ile Thr Ser Ser Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val113511401145gcc aaa gtc ctg aag gca act ctg gca gag aaa ttc cct gac gcc aca 3500Ala Lys Val Leu Lys Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr115011551160gac agc gag gtc tat aag gtg gtc ggg aac ctc ctg tac tac cgc ttc 3548Asp Ser Glu Val Tyr Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe116511701175ctg aac cca gct gtg gtg gct cct gac gcc ttc gac att gtg gcc atg 3596Leu Asn Pro Ala Val Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met1180 118511901195gca gct ggt gga gcc ctg gct gcc ccc cag cgc cat gcc ctg ggg gct 3644Ala Ala Gly Gly Ala Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala120012051210gtg gct cag ctc cta cag cac gct gcg gct ggc aag gcc ttc tct ggg 3692Val Ala Gln Leu Leu Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly121512201225
cag agc cag cac cta cgg gtc ctg aat gac tat ctg gag gaa aca cac 3740Gln Ser Gln His Leu Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His123012351240ctc aag ttc agg aag ttc atc cat aga gcc tgc cag gtg cca gag cca 3788Leu Lys Phe Arg Lys Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro124512501255gag gag cgt ttt gca gtg gac gag tac tca gac atg gtg gct gtg gcc 3836Glu Glu Arg Phe Ala Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala1260 126512701275aaa ccc atg gtg tac atc acc gtg ggg gag ctg gtc aac acg cac agg 3884Lys Pro Met Val Tyr Ile Thr Val Gly Glu Leu Val Asn Thr His Arg128012851290ctg ttg ctg gag cac cag gac tgc att gcc cct gat cac caa gac ccc 3932Leu Leu Leu Glu His Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro129513001305ctg cat gag ctc ctg gag gat ctt ggg gag ctg ccc acc atc cct gac 3980Leu His Glu Leu Leu Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp131013151320ctt att ggt gag agc atc gct gca gat ggg cac aca gac ctg agc aag 4028Leu Ile Gly Glu Ser Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys132513301335cta gaa gtg tcc ctg acg ctg acc aac aag ttt gaa gga cta gag gca 4076Leu Glu Val Ser Leu Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala1340 134513501355gat gct gat gac tcc aac acc cgt agc ctg ctt ctg agc acc aag cag 4124Asp Ala Asp Asp Ser Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln136013651370ctg ttg gcc gat atc ata cag ttc cat cct ggg gac acc ctc aag gag 4172Leu Leu Ala Asp Ile Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu137513801385atc ctg tcc ctc tcg gct tcc aga gag caa gaa gca gcc cac aag cag 4220Ile Leu Ser Leu Ser Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln139013951400
ctg atg agc cga cgc cag gcc tgt aca gcc cag aca ccg gag cca ctg 4268Leu Met Ser Arg Arg Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu140514101415cga cga cac cgc tca ctg aca gct cac tcc ctc ctg cca ctg gca gag 4316Arg Arg His Arg Ser Leu Thr Ala His Ser Leu Leu Pro Leu A1a Glu1420 142514301435aag cag cgg cgc gtc ctg cgg aac ctg cgc cga ctt gaa gcc ctg ggg 4364Lys Gln Arg Arg Val Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly144014451450ttg gtc agc gcc aga aat ggc tac cag ggg cta gtg gac gag ctg gcc 4412Leu Val Ser Ala Arg Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala145514601465aag gac atc cgc aac cag cac aga cac agg cac agg cgg aag gca gag 4460Lys Asp Ile Arg Asn Gln His Arg His Arg His Arg Arg Lys Ala Glu147014751480ctg gtg aag ctg cag gcc aca tta cag ggc ctg agc act aag acc acc 4508Leu Val Lys Leu Gln Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr148514901495ttc tat gag gag cag ggt gac tac tac agc cag tac atc cgg gcc tgc 4556Phe Tyr Glu Glu Gln Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys1500 150515101515ctg gac cac ctg gcc ccc gac tcc aag agt tct ggg aag ggg aag aag 4604Leu Asp His Leu Ala Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys152015251530cag cct tct ctt cat tac act gct gct cag ctc ctg gaa aag ggt gtc 4652Gln Pro Ser Leu His Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val153515401545ttg gtg gaa att gaa gat ctt ccc gcc tct cac ttc aga aac gtc atc 4700Leu Val Glu Ile Glu Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile155015551560ttt gac atc acg ccg gga gat gag gca gga aag ttt gaa gta aat gcc 4748Phe Asp Ile Thr Pro Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala156515701575
aag ttc ctg ggt gtg gac atg gag cga ttt cag ctt cac tat cag gat 4796Lys Phe Leu Gly Val Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp1580 158515901595crc ctg cag ctc cag tat gag ggt gtg gct gtc atg aaa crc ttc aac 4844Leu Leu Gln Leu Gln Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn160016051610aag gcc aaa gtc aat gtc aac ctt ctc arc ttc crc ctc aac aag aag 4892Lys Ala Lys Val Asn Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys161516201625ttt ttg cgg aag tgacag aggcaaaggg tgctacccaa gcccctctta 4940Phe Leu Arg Lys1630cctctctgga tgctttcttt aacactaact caccactgtg cttccctgca gacacccaga 5000gctcaggact gggcaaggcc cagggattct caccccttcc ccagctggga ggagcttgcc 5060tgcctggcca cagacagtgt atcttctaat tggctaaagt gggccttgcc cagagtccag 5120ctgtgtggct tttatcatgc atgacaaacc cctggctttc ctgccagatg gattctcatc 5180ccttacagct gactcttcca ggcaatttcc atagatctgc agtcctgcct ctgccacagt 5240ctctctgttg tccccacatc tacccaactt cctgtactgt tgcccttctg atgttaataa 5300aagcagctgt tactccc 5317<210>4<211>1631<212>PRT<213>智人(Homo sapiens)<400>4Met Glu Arg Arg Ala Ala Gly Pro Gly Trp Ala Ala Tyr Glu Arg Leu1 5 10 15Thr Ala Glu Glu Met Asp Glu Gln Arg Arg Gln Ash Val Ala Tyr Gln20 25 30
Tyr Leu Cys Arg Leu Glu Glu Ala Lys Arg Trp Met Glu Ala Cys Leu35 40 45Lys Glu Glu Leu Pro Ser Pro Val Glu Leu Glu Glu Ser Leu Arg Asn50 55 60Gly Val Leu Leu Ala Lys Leu Gly His Cys Phe Ala Pro Ser Val Val65 70 75 80Pro Leu Lys Lys Ile Tyr Asp Val Glu Gln Leu Arg Tyr Gln Ala Thr85 90 95Gly Leu His Phe Arg His Thr Asp Asn Ile Asn Phe Trp Leu Ser Ala100 105 110Ile Ala His Ile Gly Leu Pro Ser Thr Phe Phe Pro Glu Thr Thr Asp115 120 125Ile Tyr Asp Lys Lys Asn Met Pro Arg Val Val Tyr Cys Ile His Ala130 135 140Leu Ser Leu Phe Leu Phe Arg Leu Gly Leu Ala Pro Gln Ile His Asp145 150 155 160Leu Tyr Gly Lys Val Lys Phe Thr Ala Glu Glu Leu Ser Asn Met Ala165 170 175Ser Glu Leu Ala Lys Tyr Gly Leu Gln Leu Pro Ala Phe Ser Lys Ile180 185 190Gly Gly Ile Leu Ala Asn Glu Leu Ser Val Asp Glu Ala Ala Val His195 200 205Ala Ala Val Leu Ala Ile Asn Glu Ala Val Glu Arg Gly Val Val Glu210 215 220Asp Thr Leu Ala Ala Leu Gln Asn Pro Ser Ala Leu Leu Glu Asn Leu225 230 235 240Arg Glu Pro Leu Ala Ala Val Tyr Gln Glu Met Leu Ala Gln Ala Lys245 250 255Met Glu Lys Ala Ala Asn Ala Arg Asn His Asp Asp Arg Glu Ser Gln260 265 270
Asp Ile Tyr Asp His Tyr Leu Thr Gln Ala Glu Ile Gln Gly Asn Ile275 280 285Asn His Val Asn Val His Gly Ala Leu Glu Val Val Asp Asp Ala Leu290 295 300Glu Arg Gln Ser Pro Glu Ala Leu Leu Lys Ala Leu Gln Asp Pro Ala305 310 315 320Leu Ala Leu Arg Gly Val Arg Arg Asp Phe Ala Asp Trp Tyr Leu Glu325 330 335Gln Leu Asn Ser Asp Arg Glu Gln Lys Ala Gln Glu Leu Gly Leu Val340 345 350Glu Leu Leu Glu Lys Glu Glu Val Gln Ala Gly Val Ala Ala Ala Asn355 360 365Thr Lys Gly Asp Gln Glu Gln Ala Met Leu His Ala Val Gln Arg Ile370 375 380Asn Lys Ala Ile Arg Arg Gly Val Ala Ala Asp Thr Val Lys Glu Leu385 390 395 400Met Cys Pro Glu Ala Gln Leu Pro Pro Val Tyr Pro Val Ala Ser Ser405 410 415Met Tyr Gln Leu Glu Leu Ala Val Leu Gln Gln Gln Gln Gly Glu Leu420 425 430Gly Gln Glu Glu Leu Phe Val Ala Val Glu Met Leu Ser Ala Val Val435 440 445Leu Ile Asn Arg Ala Leu Glu Ala Arg Asp Ala Ser Gly Phe Trp Ser450 455 460Ser Leu Val Asn Pro Ala Thr Gly Leu Ala Glu Val Glu Gly Glu Asn465 470 475 480Ala Gln Arg Tyr Phe Asp Ala Leu Leu Lys Leu Arg Gln Glu Arg Gly485 490 495Met Gly Glu Asp Phe Leu Ser Trp Asn Asp Leu Gln Ala Thr Val Ser
500 505 510Gln Val Asn Ala Gln Thr Gln Glu Glu Thr Asp Arg Val Leu Ala Val515 520 525Ser Leu Ile Asn Glu Ala Leu Asp Lys Gly Ser Pro Glu Lys Thr Leu530 535 540Ser Ala Leu Leu Leu Pro Ala Ala Gly Leu Asp Asp Val Ser Leu Pro545 550 555 560Val Ala Pro Arg Tyr His Leu Leu Leu Val Ala Ala Lys Arg Gln Lys565 570 575Ala Gln Val Thr Gly Asp Pro Gly Ala Val Leu Trp Leu Glu Glu Ile580 585 590Arg Gln Gly Val Val Arg Ala Asn Gln Asp Thr Asn Thr Ala Gln Arg595 600 605Met Ala Leu Gly Val Ala Ala Ile Asn Gln Ala Ile Lys Glu Gly Lys610 615 620Ala Ala Gln Thr Glu Arg Val Leu Arg Asn Pro Ala Val Ala Leu Arg625 630 635 640Gly Val Val Pro Asp Cys Ala Asn Gly Tyr Gln Arg Ala Leu Glu Ser645 650 655Ala Met Ala Lys Lys Gln Arg Pro Ala Asp Thr Ala Phe Trp Val Gln660 665 670His Asp Met Lys Asp Gly Thr Ala Tyr Tyr Phe His Leu Gln Thr Phe675 680 685Gln Gly Ile Trp Glu Gln Pro Pro Gly Cys Pro Leu Asn Thr Ser His690 695 700Leu Thr Arg Glu Glu Ile Gln Ser Ala Val Thr Lys Val Thr Ala Ala705 710 715 720Tyr Asp Arg Gln Gln Leu Trp Lys Ala Asn Val Gly Phe Val Ile Gln725 730 735
Leu Gln Ala Arg Leu Arg Gly Phe Leu Val Arg Gln Lys Phe Ala Glu740 745 750His Ser His Phe Leu Arg Thr Trp Leu Pro Ala Val Ile Lys Ile Gln755 760 765Ala His Trp Arg Gly Tyr Arg Gln Arg Lys Ile Tyr Leu Glu Trp Leu770 775 780Gln Tyr Phe Lys Ala Asn Leu Asp Ala Ile Ile Lys Ile Gln Ala Trp785 790 795 800Ala Arg Met Trp Ala Ala Arg Arg Gln Tyr Leu Arg Arg Leu His Tyr805 810 815Phe Gln Lys Asn Val Asn Ser Ile Val Lys Ile Gln Ala Phe Phe Arg820 825 830Ala Arg Lys Ala Gln Asp Asp Tyr Arg Ile Leu Val His Ala Pro His835 840 845Pro Pro Leu Ser Val Val Arg Arg Phe Ala His Leu Leu Asn Gln Ser850 855 860Gln Gln Asp Phe Leu Ala Glu Ala Glu Leu Leu Lys Leu Gln Glu Glu865 870 875 880Val Val Arg Lys Ile Arg Ser Asn Gln Gln Leu Glu Gln Asp Leu Asn885 890 895Ile Met Asp Ile Lys Ile Gly Leu Leu Val Lys Asn Arg Ile Thr Leu900 905 910Gln Glu Val Val Ser His Cys Lys Lys Leu Thr Lys Arg Asn Lys Glu915 920 925Gln Leu Ser Asp Met Met Val Leu Asp Lys Gln Lys Gly Leu Lys Ser930 935 940Leu Ser Lys Glu Lys Arg Gln Lys Leu Glu Ala Tyr Gln His Leu Phe945 950 955 960Tyr Leu Leu Gln Thr Gln Pro Ile Tyr Leu Ala Lys Leu Ile Phe Gln965 970 975
Met Pro Gln Asn Lys Thr Thr Lys Phe Met Glu Ala Val Ile Phe Ser980 985 990Leu Tyr Asn Tyr Ala Ser Ser Arg Arg Glu Ala Tyr Leu Leu Leu Gln99510001005Leu Phe Lys Thr Ala Leu Gln Glu Glu Ile Lys Ser Lys Val Glu Gln101010151020Pro Gln Asp Val Val Thr Gly Asn Pro Thr Val Val Arg Leu Val Val1025 103010351040Arg Phe Tyr Arg Asn Gly Arg Gly Gln Ser Ala Leu Gln Glu Ile Leu104510501055Gly Lys Val Ile Gln Asp Val Leu Glu Asp Lys Val Leu Ser Val His106010651070Thr Asp Pro Val His Leu Tyr Lys Asn Trp Ile Asn Gln Thr Glu Ala107510801085Gln Thr Gly Gln Arg Ser His Leu Pro Tyr Asp Val Thr Pro Glu Gln109010951100Ala Leu Ser His Pro Glu Val Gln Arg Arg Leu Asp Ile Ala Leu Argl105 111011151120Asn Leu Leu Ala Met Thr Asp Lys Phe Leu Leu Ala Ile Thr Ser Ser112511301135Val Asp Gln Ile Pro Tyr Gly Met Arg Tyr Val Ala Lys Val Leu Lys114011451150Ala Thr Leu Ala Glu Lys Phe Pro Asp Ala Thr Asp Ser Glu Val Tyr115511601165Lys Val Val Gly Asn Leu Leu Tyr Tyr Arg Phe Leu Asn Pro Ala Val117011751180Val Ala Pro Asp Ala Phe Asp Ile Val Ala Met Ala Ala Gly Gly Ala1185 119011951200Leu Ala Ala Pro Gln Arg His Ala Leu Gly Ala Val Ala Gln Leu Leu
120512101215Gln His Ala Ala Ala Gly Lys Ala Phe Ser Gly Gln Ser Gln His Leu122012251230Arg Val Leu Asn Asp Tyr Leu Glu Glu Thr His Leu Lys Phe Arg Lys123512401245Phe Ile His Arg Ala Cys Gln Val Pro Glu Pro Glu Glu Arg Phe Ala125012551260Val Asp Glu Tyr Ser Asp Met Val Ala Val Ala Lys Pro Met Val Tyr1265 127012751280Ile Thr Val Gly Glu Leu Val Asn Thr His Arg Leu Leu Leu Glu His128512901295Gln Asp Cys Ile Ala Pro Asp His Gln Asp Pro Leu His Glu Leu Leu130013051310Glu Asp Leu Gly Glu Leu Pro Thr Ile Pro Asp Leu Ile Gly Glu Ser131513201325Ile Ala Ala Asp Gly His Thr Asp Leu Ser Lys Leu Glu Val Ser Leu133013351340Thr Leu Thr Asn Lys Phe Glu Gly Leu Glu Ala Asp Ala Asp Asp Ser1345 135013551360Asn Thr Arg Ser Leu Leu Leu Ser Thr Lys Gln Leu Leu Ala Asp Ile136513701375Ile Gln Phe His Pro Gly Asp Thr Leu Lys Glu Ile Leu Ser Leu Ser138013851390Ala Ser Arg Glu Gln Glu Ala Ala His Lys Gln Leu Met Ser Arg Arg139514001405Gln Ala Cys Thr Ala Gln Thr Pro Glu Pro Leu Arg Arg His Arg Ser141014151420Leu Thr Ala His Ser Leu Leu Pro Leu Ala Glu Lys Gln Arg Arg Val1425 143014351440
Leu Arg Asn Leu Arg Arg Leu Glu Ala Leu Gly Leu Val Ser Ala Arg144514501455Asn Gly Tyr Gln Gly Leu Val Asp Glu Leu Ala Lys Asp Ile Arg Asn146014651470Gln His Arg His Arg His Arg Arg Lys Ala Glu Leu Val Lys Leu Gln147514801485Ala Thr Leu Gln Gly Leu Ser Thr Lys Thr Thr Phe Tyr Glu Glu Gln149014951500Gly Asp Tyr Tyr Ser Gln Tyr Ile Arg Ala Cys Leu Asp His Leu Ala1505 151015151520Pro Asp Ser Lys Ser Ser Gly Lys Gly Lys Lys Gln Pro Ser Leu His152515301535Tyr Thr Ala Ala Gln Leu Leu Glu Lys Gly Val Leu Val Glu Ile Glu154015451550Asp Leu Pro Ala Ser His Phe Arg Asn Val Ile Phe Asp Ile Thr Pro155515601565Gly Asp Glu Ala Gly Lys Phe Glu Val Asn Ala Lys Phe Leu Gly Val157015751580Asp Met Glu Arg Phe Gln Leu His Tyr Gln Asp Leu Leu Gln Leu Gln1585 159015951600Tyr Glu Gly Val Ala Val Met Lys Leu Phe Asn Lys Ala Lys Val Asn160516101615Val Asn Leu Leu Ile Phe Leu Leu Asn Lys Lys Phe Leu Arg Lys162016251630<210>5<211>3608<212>DNA<213>智人(Homo sapiens)
<220>
<221>CDS<222>(424)..(1908)<223>Clone LBFL110<400>5ggcggcgaga gcagctgcag ctcgcatctc aggcagtacc tagaggagct gccggtgcct 60cctcagaaca tctcctgatc gctacccagg accaggcacc aaggacaggg agtcccaggc120gcacaccccc cattctgggt cccccaggcc cagaccccca ctctgccaca ggttgcatct180tgacctggtc ctcctgcaga agtggcccct gtggtcctgc tctgagactc gtccctgggc240gcccctgcag cccctttcta tgactccatc tggatttggc tggctgtggg gacgcggtcc300gaggggcggc ctggctctca gcgtggtggc agccagctct ctggccacca tggcaaatgc360tgagatctga ggggacaagg ctctacagcc tcagccaggg gcactcagct gttgcagggt420gtgatg gag aac aaa gct atg tac cta cac acc gtc agc gac tgt 465Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys1 5 10gac acc agc tcc atc tgt gag gat tcc ttt gat ggc agg agc ctg tcc 513Asp Thr Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser15 20 25 30aag ctg aac ctg tgt gag gat ggt cca tgt cac aaa cgg cgg gca agc 561Lys Leu Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser35 40 45atc tgc tgt acc cag ctg ggg tcc ctg tcg gcc ctg aag cat gct gtc 609Ile Cys Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val50 55 60ctg ggg ctc tac ctg ctg gtc ttc ctg att ctt gtg ggc atc ttc atc 657Leu Gly Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile65 70 75tta gca gtg tcc agg ccg cgc agc tcc cct gac gac ctg aag gcc ctg 705Leu Ala yal Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu80 85 90
act cgc aat gtg aac cgg ctg aat gag agc ttc cgg gac ttg cag ctg 753Thr Arg Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu95 100 105 110cgg ctg ctg cag gct ccg ctg caa gcg gac ctg acg gag cag gtg tgg 801Arg Leu Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp115 120 125aag gtg cag gac gcg ctg cag aac cag tca gac tcg ttg ctg gcg ctg 849Lys Val Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu130 135 140gcg ggc gca gtg cag cgg ctg gag ggc gcg ctg tgg ggg ctg cag gcg 897Ala Gly Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala145 150 155cag gcg gtg cag acc gag cag gcg gtg gcc ctg ctg cgg gac cgc acg 945Gln Ala Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr160 165 170ggc cag cag agc gac acg gcg cag ctg gag ctc tac cag ctg cag gtg 993Gly Gln Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val175 180 185 190gag agc aac agt agc cag ctg ctg ctg agg cgc cac gcg ggc ctg ctg 1041Glu Ser Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu195 200 205gac ggg ctg gcg cgc agg gtg ggc atc ctg ggc gag gag ctg gcc gac 1089Asp Gly Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp210 215 220gtg ggc ggc gtg ctg cgc ggc ctc aac cac agc ctg tcc tac gac gtg 1137Val Gly Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val225 230 235gcc ctc cac cgc acg cgg ctg cag gac ctg cgg gtg ctg gtg agc aac 1185Ala Leu His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn240 245 250gcc agc gag gac acg cgc cgc ctg cgc ctg gcg cac gta ggc atg gag 1233Ala Ser Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu255 260 265 270
ctg cag ctg aag cag gag ctg gcc atg ctc aac gcg gtc acc gag gac 1281Leu Gln Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp275 280 285ctg cgc ctc aag gac tgg gag cac tcc atc gca ctg cgg aac atc tcc 1329Leu Arg Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser290 295 300ctc gcg aaa ggg cca ccg gga ccc aaa ggt gat cag ggg cat gaa gga 1377Leu Ala Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly305 310 315aag gaa ggc agg cct ggc atc cct gga ttg cct gga ctt cga ggt ctg 1425Lys Glu Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu320 325 330ccc ggg gag aga ggt acc cca gga ttg ccc ggg ccc aag ggc gat gat 1473Pro Gly Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp335 340 345 350ggg aag ctg ggg gcc aca gga cca atg ggc atg cgt ggg ttc aaa ggt 1521Gly Lys Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly355 360 365gac cga ggc cca aaa gga gag aaa gga gag aaa gga gac aga gct ggg 1569Asp Arg Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly370 375 380gat gcc agt ggc gtg gag gcc ccg atg atg atc cgc ctg gtg aat ggc 1617Asp Ala Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly385 390 395tca ggt ccg cac gag ggc cgc gtg gaa gtg tac cac gac cgg cgt tgg 1665Ser Gly Pro His Glu Gly Arg Val G1u Val Tyr His Asp Arg Arg Trp400 405 410ggc acc gtg tgt gac gac ggc tgg gac aag aag gac gga gac gtg gtg 1713Gly Thr Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val415 420 425 430tgc cgc atg ctc ggc ttc cgc ggt gtg gag gag gtg tac cgc aca gct 1761Cys Arg Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala435 440 445
cga ttc ggg caa ggc act ggg agg atc tgg atg gat gac gtt gcc tgc 1809Arg Phe Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys450 455 460aag ggc aca gag gaa acc atc ttc cgc tgc agc ttc tcc aaa tgg ggg 1857Lys Gly Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly465 470 475gtg aca aac tgt gga cat gcc gaa gat gcc agc gtg aca tgc aac aga 1905Val Thr Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg480 485 490cac tg aaagtgggca gagcccaagt tcggggtcct gcacagagca cccttcctgc 1960His495atccctgggg tggggcacag ctcggggcca ccctgaccat gcctcgacca caccccgtcc 2020agcattctca gtcctcacac ctgcatccca ggaccgtggg ggccggtcgt catttccctc 2080ttgaacatgt gctccgaagt ataactctgg gacctactgc ccgtctctct cttccaccag 2140gttcctgcat gaggagccct gatcaactgg atcaccactt tgcccagcct ctgaacacca 2200tgcaccaggc ctcaatatcc cagttccctt tggcctttta gttacaggtg aatgctgaga 2260atgtgtcaga gacaagtgca gcagcagcga tggttggtag tatagatcat ttactcttca 2320gacaattccc aaacctccat tagtccaaga gtttctacat cttcctcccc agcaagaggc 2380aacgtcaagt gatgaatttc ccccctttac tctgcctctg ctccccattt gctagtttga 2440ggaagtgaca tagaggagaa gccagctgta ggggcaagag ggaaatgcaa gtcacctgca 2500ggaatccagc tagatttgga gaagggaatg aaactaacat tgaatgacta ccatggcacg 2560ctaaatagta tcttgggtgc caaattcatg tatccactta gctgcattgg tccagggcat 2620gtcagtctgg atacagcctt acctccaggt agcacttaac tggtccattc acctagactg 2680caagtaagaa gacaaaatga ctgagaccgt gtgcccacct gaacttattg tctttacttg 2740gcctgagcta aaagcttggg tgcaggacct gtgtaactag aaagttgcct acttcagaac 2800
ctccagggcg tgagtgcaag gtcaaacatg actggcttcc aggccgacca tcaatgtagg 2860aggagagctg atgtggaggg tgacatgggg gctgcccatg ttaaacctga gtccagtgct 2920ctggcattgg gcagtcacgg ttaaagccaa gtcatgtgtg tctcagctgt ttggaggtga 2980tgattttgca tcttccaagc ctcttcaggt gtgaatctgt ggtcaggaaa acacaagtcc 3040taatggaacc cttagggggg aaggaaatga agattcccta taacctctgg gggtggggag 3100taggaataag gggcttgggc ctccataaat ctgcaatctg caccctcctc ctagagacag 3160ggagatcgtg ttctgctttt tacatgagga gcagaactgg gccatacaca tgttcaagaa 3220ctaggggagc tacctggtag caagtgagtg cagacccacc tcaccttggg ggaatctcaa 3280actcataggc ctcagataca cgatcacctg tcatatcagg tgagcactgg cctgcttggg 3340gagagacctg ggcccctcca ggtgtaggaa cagcaacact cctggctgac aactaagcca 3400atatggccct aggtcattct tgcttccaat atgcttgcca ctccttaaat gtcctaatga 3460tgagaaactc tctttctgac caattgctat gtttacataa cacgcatgta ctcatgcatc 3520ccttgccaga gcccatatat gtatgcatat ataaacatag cactttttac tacatagctc 3580agcacattgc aaggtttgca tttaagtt 3608<210>6<211>495<212>PRT<213>智人(Homo sapiens)<400>6Met Glu Asn Lys Ala Met Tyr Leu His Thr Val Ser Asp Cys Asp Thr1 5 10 15Ser Ser Ile Cys Glu Asp Ser Phe Asp Gly Arg Ser Leu Ser Lys Leu20 25 30Asn Leu Cys Glu Asp Gly Pro Cys His Lys Arg Arg Ala Ser Ile Cys35 40 45
Cys Thr Gln Leu Gly Ser Leu Ser Ala Leu Lys His Ala Val Leu Gly50 55 60Leu Tyr Leu Leu Val Phe Leu Ile Leu Val Gly Ile Phe Ile Leu Ala65 70 75 80Val Ser Arg Pro Arg Ser Ser Pro Asp Asp Leu Lys Ala Leu Thr Arg85 90 95Asn Val Asn Arg Leu Asn Glu Ser Phe Arg Asp Leu Gln Leu Arg Leu100 105 110Leu Gln Ala Pro Leu Gln Ala Asp Leu Thr Glu Gln Val Trp Lys Val115 120 125Gln Asp Ala Leu Gln Asn Gln Ser Asp Ser Leu Leu Ala Leu Ala Gly130 135 140Ala Val Gln Arg Leu Glu Gly Ala Leu Trp Gly Leu Gln Ala Gln Ala145 150 155 160Val Gln Thr Glu Gln Ala Val Ala Leu Leu Arg Asp Arg Thr Gly Gln165 170 175Gln Ser Asp Thr Ala Gln Leu Glu Leu Tyr Gln Leu Gln Val Glu Ser180 185 190Asn Ser Ser Gln Leu Leu Leu Arg Arg His Ala Gly Leu Leu Asp Gly195 200 205Leu Ala Arg Arg Val Gly Ile Leu Gly Glu Glu Leu Ala Asp Val Gly210 215 220Gly Val Leu Arg Gly Leu Asn His Ser Leu Ser Tyr Asp Val Ala Leu225 230 235 240His Arg Thr Arg Leu Gln Asp Leu Arg Val Leu Val Ser Asn Ala Ser245 250 255Glu Asp Thr Arg Arg Leu Arg Leu Ala His Val Gly Met Glu Leu Gln260 265 270Leu Lys Gln Glu Leu Ala Met Leu Asn Ala Val Thr Glu Asp Leu Arg
275 280 285Leu Lys Asp Trp Glu His Ser Ile Ala Leu Arg Asn Ile Ser Leu Ala290 295 300Lys Gly Pro Pro Gly Pro Lys Gly Asp Gln Gly His Glu Gly Lys Glu305 310 315 320Gly Arg Pro Gly Ile Pro Gly Leu Pro Gly Leu Arg Gly Leu Pro Gly325 330 335Glu Arg Gly Thr Pro Gly Leu Pro Gly Pro Lys Gly Asp Asp Gly Lys340 345 350Leu Gly Ala Thr Gly Pro Met Gly Met Arg Gly Phe Lys Gly Asp Arg355 360 365Gly Pro Lys Gly Glu Lys Gly Glu Lys Gly Asp Arg Ala Gly Asp Ala370 375 380Ser Gly Val Glu Ala Pro Met Met Ile Arg Leu Val Asn Gly Ser Gly385 390 395 400Pro His Glu Gly Arg Val Glu Val Tyr His Asp Arg Arg Trp Gly Thr405 410 415Val Cys Asp Asp Gly Trp Asp Lys Lys Asp Gly Asp Val Val Cys Arg420 425 430Met Leu Gly Phe Arg Gly Val Glu Glu Val Tyr Arg Thr Ala Arg Phe435 440 445Gly Gln Gly Thr Gly Arg Ile Trp Met Asp Asp Val Ala Cys Lys Gly450 455 460Thr Glu Glu Thr Ile Phe Arg Cys Ser Phe Ser Lys Trp Gly Val Thr465 470 475 480Asn Cys Gly His Ala Glu Asp Ala Ser Val Thr Cys Asn Arg His485 490 495<210>7<211>3162
<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(405)..(1835)<223>Clone LBFLl23<400>7tggccggggt gccccgcaaa gagagacaag ggagaaaaag acagcaggga aaaccccggg 60gaggagaagg cgaaagagaa ggtggagctc agagaagggg gccggctccc cagctccatg120tggccgccgc cgctgcgggt ctgtgggggc agagggcggc ggctcccagg gcagcgcgta180gcgggaccga ttgcctaata ctccggcagg ggccggggcc gcagctggct cggataaata240gccgcccggc tggcccggag ctgcagggga gagcggcggc cgcgatcccc accacaccac300cagcccggcc gcacggggca ctgagccggg tgctgagcac cggaggcccc gccgaggccg360ggactcagga cctgcagaga aacgcctcct gattttgtct taca atg gaa ctt 413Met Glu Leu1aaa aag tcg cct gac ggt gga tgg ggc tgg gtg att gtg ttt gtc tcc 461Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val Phe Val Ser5 10 15ttc ctt act cag ttt ttg tgt tac gga tcc cca cta gct gtt gga gtc 509Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala Val Gly Val20 25 30 35ctg tac ata gaa tgg ctg gat gcc ttt ggt gaa gga aaa gga aaa aca 557Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys Gly Lys Thr40 45 50gcc tgg gtt gga tcc ctg gca agt gga gtt ggc ttg ctt gca agt cct 605Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu Ala Ser Pro55 60 65gtc tgc agt ctc tgt gtc rca tct ttt gga gca aga cct gtc aca arc 653Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro Val Thr Ile
70 75 80ttc agt ggc ttc atg gtg gct gga ggc ctg atg ttg agc agt ttt gct 701Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser Ser Phe Ala85 90 95ccc aat atc tac ttt ctg ttt ttt tcc tat ggc att gtt gta ggt tca 749Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val Val Gly Ser100 105 110 115agc gtt ggc ctt ttc ata tat gct gct ctg cag agg atg ctg gtt gag 797Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met Leu Val Glu120 125 130ttc tat gga ctg gat gga tgc ttg ctg att gtg ggt gct tta gct tta 845Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala Leu Ala Leu135 140 145aat ata tta gcc tgt ggc agt ctg atg aga ccc ctc caa tct tct gat 893Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln Ser Ser Asp150 155 160tgt cct ttg cct aaa aaa ata gct cca gaa gat cta cca gat aaa tac 941Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro Asp Lys Tyr165 170 175tcc att tac aat gaa aaa gga aag aat ctg gaa gaa aac ata aac att 989Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn Ile Asn Ile180 185 190 195ctt gac aag agc tac agt agt gag gaa aaa tgc agg atc acg tta gcc 1037Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile Thr Leu Ala200 205 210aat ggt gac tgg aaa caa gac agc cta ctt cat aaa aac ccc aca gtg 1085Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn Pro Thr Val215 220 225aca cac aca aaa gag cct gaa acg tac aaa aag aaa gtt gca gaa cag 1133Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val Ala Glu Gln230 235 240aca tat ttt tgc aaa cag ctt gcc aag agg aag tgg cag tta tat aaa 1181Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln Leu Tyr Lys
245 250 255aac tac tgt ggt gaa act gtg gct ctt ttt aaa aac aaa gta ttt tca 1229Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys Val Phe Ser260 265 270 275gcc ctt ttc att gct atc tta ctc ttt gac atc gga ggg ttt cca cct 1277Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly Phe Pro Pro280 285 290tca tta ctt atg gaa gat gta gca aga agt tca aac gtg aaa gaa gaa 1325Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val Lys Glu Glu295 300 305gag ttt att atg cca ctt att tcc att ata ggc att atg aca gca gtt 1373Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met Thr Ala Val310 315 320ggt aaa ctg ctt tta ggg ata ctg gct gac ttc aag tgg att aat acc 1421Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp Ile Asn Thr325 330 335ttg tat ctt tat gtt gct acc tta atc atc atg ggc cta gcc ttg tgt 1469Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu Ala Leu Cys340 345 350 355gca att cca ttt gcc aaa agc tat gtc aca ttg gcg ttg ctt tct ggg 1517Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu Ala Leu Leu Ser Gly360 365 370atc cta ggg ttt ctt act ggt aat tgg tcc atc ttt cca tat gtg acc 1565Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro Tyr Val Thr375 380 385acg aag act gtg gga att gaa aaa tta gcc cat gcc tat ggg ata tta 1613Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr Gly Ile Leu390 395 400atg ttc ttt gct gga ctt gga aat agc cta gga cca ccc atc gtt ggt 1661Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro Ile Val Gly405 410 415tgg ttt tat gac tgg acc cag acc tat gat att gca ttt tat ttt agt 1709Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe Tyr Phe Ser
420 425 430 435ggc ttc tgc gtc ctg ctg gga ggt ttt att ctg ctg ctg gca gcc ttg 1757Gly Phe Cys Val Leu Leu Gly Gly Phe Ile Leu Leu Leu Ala Ala Leu440 445 450ccc tct tgg gat aca tgc aac aag caa ctc ccc aag cca gct cca aca 1805Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro Ala Pro Thr455 460 465act ttc ttg tac aaa gtt gcc tct aat gtt tagaa gaatattgga 1850Thr Phe Leu Tyr Lys Val Ala Ser Asn Val470 475agacactatt tttgctattt tataccatat agcaacgata ttttaacaga tctcaagcaa 1910attttctaga gtcaagacta ttttctcata gcaaaatttc acaatgactg actctgaatg 1970aattattttt ttttttttat atatcctatt ttttatgtag tgtatgcgta gcctctatct 2030cgtatttttt tctatttctc ctccccacac catcaatggg actattctgt tttgctgtta 2090ttcactagtt cttaacattg taaaaagttt gaccagcctc agaaggcttt ctctgtgtaa 2150agaagtataa tttctctgct gactccattt aatccactgc aaggcaccta gagagactgc 2210tcctatttta aaagtgatgc aagcatcatg ataagatatg tgtgaagccc actaggaaat 2270aaatcattct cttctctatg tttgacttgc tagtaaacag aagacttcaa gccagccagg 2330aaattaaagt ggcgactaaa acagccttaa gaattgcagt ggagcaaatt ggtcattttt 2390taaaaaaata tattttaacc tacagtcacc agttttcatt attctattta cctcactgaa 2450gtactcgcat gttgtttggt acccactgag caactgtttc agttcctaag gtatttgctg 2510agatgtgggt gaactccaaa tggagaagta gtcactgtag actttcttca tggttgacca 2570ctccaacctt gctcactttt gcttcttggc catccactca gctgatgttt cctgggaagt 2630gctaatttta cctgtttcca aattggaaac acatttctca atcattccgt tctggcaaat 2690gggaaacatc catttgcttt gggcacagtg gggatgggct gcaagttctt gcatatcctc 2750
ccagtgaagc atttatttgc tactatcaga ttttaccact atcaaatata attcaagggc 2810agaattaaac gtgagtgtgt gtgtgtgtgt gtgtgtgtgt gctatgcatg ctctaagtct 2870gcatgggata tgggaatgga aaagggcaat aagaaattaa tacccttatg cagttgcatt 2930taaccttaag aaaaatgtcc ttgggataaa ctccaatgtt taatacattg attttttttc 2990taaagaaatg ggttttaaac tttggtatgc atcagaattc cctatagatc tttttgaaaa 3050tataggtacc tgggtatcac acatagaact tttaattctg ctggtgtagg ctgttgccca 3110aacatctata attttactga gctcttcaag tgattctgat aacacagcct gg 3162<210>8<211>477<212>PRT<213>智人(Homo sapiens)<400>8Met Glu Leu Lys Lys Ser Pro Asp Gly Gly Trp Gly Trp Val Ile Val1 5 10 15Phe Val Ser Phe Leu Thr Gln Phe Leu Cys Tyr Gly Ser Pro Leu Ala20 25 30Val Gly Val Leu Tyr Ile Glu Trp Leu Asp Ala Phe Gly Glu Gly Lys35 40 45Gly Lys Thr Ala Trp Val Gly Ser Leu Ala Ser Gly Val Gly Leu Leu50 55 60Ala Ser Pro Val Cys Ser Leu Cys Val Ser Ser Phe Gly Ala Arg Pro65 70 75 80Val Thr Ile Phe Ser Gly Phe Met Val Ala Gly Gly Leu Met Leu Ser85 90 95Ser Phe Ala Pro Asn Ile Tyr Phe Leu Phe Phe Ser Tyr Gly Ile Val100 105 110Val Gly Ser Ser Val Gly Leu Phe Ile Tyr Ala Ala Leu Gln Arg Met115 120 125
Leu Val Glu Phe Tyr Gly Leu Asp Gly Cys Leu Leu Ile Val Gly Ala130 135 140Leu Ala Leu Asn Ile Leu Ala Cys Gly Ser Leu Met Arg Pro Leu Gln145 150 155 160Ser Ser Asp Cys Pro Leu Pro Lys Lys Ile Ala Pro Glu Asp Leu Pro165 170 175Asp Lys Tyr Ser Ile Tyr Asn Glu Lys Gly Lys Asn Leu Glu Glu Asn180 185 190Ile Asn Ile Leu Asp Lys Ser Tyr Ser Ser Glu Glu Lys Cys Arg Ile195 200 205Thr Leu Ala Asn Gly Asp Trp Lys Gln Asp Ser Leu Leu His Lys Asn210 215 220Pro Thr Val Thr His Thr Lys Glu Pro Glu Thr Tyr Lys Lys Lys Val225 230 235 240Ala Glu Gln Thr Tyr Phe Cys Lys Gln Leu Ala Lys Arg Lys Trp Gln245 250 255Leu Tyr Lys Asn Tyr Cys Gly Glu Thr Val Ala Leu Phe Lys Asn Lys260 265 270Val Phe Ser Ala Leu Phe Ile Ala Ile Leu Leu Phe Asp Ile Gly Gly275 280 285Phe Pro Pro Ser Leu Leu Met Glu Asp Val Ala Arg Ser Ser Asn Val290 295 300Lys Glu Glu Glu Phe Ile Met Pro Leu Ile Ser Ile Ile Gly Ile Met305 310 315 320Thr Ala Val Gly Lys Leu Leu Leu Gly Ile Leu Ala Asp Phe Lys Trp325 330 335Ile Asn Thr Leu Tyr Leu Tyr Val Ala Thr Leu Ile Ile Met Gly Leu340 345 350Ala Leu Cys Ala Ile Pro Phe Ala Lys Ser Tyr Val Thr Leu A1a Leu
355 360 365Leu Ser Gly Ile Leu Gly Phe Leu Thr Gly Asn Trp Ser Ile Phe Pro370 375 380Tyr Val Thr Thr Lys Thr Val Gly Ile Glu Lys Leu Ala His Ala Tyr385 390 395 400Gly Ile Leu Met Phe Phe Ala Gly Leu Gly Asn Ser Leu Gly Pro Pro405 410 415Ile Val Gly Trp Phe Tyr Asp Trp Thr Gln Thr Tyr Asp Ile Ala Phe420 425 430Tyr Phe Ser Gly Phe Cys Val Leu Leu Gly 61y Phe Ile Leu Leu Leu435 440 445Ala Ala Leu Pro Ser Trp Asp Thr Cys Asn Lys Gln Leu Pro Lys Pro450 455 460Ala Pro Thr Thr Phe Leu Tyr Lys Val Ala Ser Asn Val465 470 475<210>9<211>4891<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(89)..(1150)<223>Clone LBFLl31<400>9acgcctggtt cccgggaaga ctcgccagca ccagggggtg ggggagtgcg agctgaaagc 60tgctggagag tgagcagccc tagcaggg atg gac atg atg ctg ttg gtg cag 112Met Asp Met Met Leu Leu Val Gln1 5ggt gct tgt tgc tcg aac cag tgg ctg gcg gcg gtg ctc ctc agc ctg 160Gly Ala Cys Cys Ser Asn Gln Trp Leu Ala Ala Val Leu Leu Ser Leu
10 15 20tgc tgc ctg cta ccc tcc tgc ctc ccg gct gga cag agt gtg gac ttc 208Cys Cys Leu Leu Pro Ser Cys Leu Pro Ala Gly Gln Ser Val Asp Phe25 30 35 40ccc tgg gcg gcc gtg gac aac atg atg gtc aga aaa ggg gac acg gcg 256Pro Trp Ala Ala Val Asp Asn Met Met Val Arg Lys Gly Asp Thr Ala45 50 55gtg ctt agg tgt tat ttg gaa gat gga gct tca aag ggt gcc tgg ctg 304Val Leu Arg Cys Tyr Leu Glu Asp Gly Ala Ser Lys Gly Ala Trp Leu60 65 70aac cgg tca agt att att ttt gcg gga ggt gat aag tgg tca gtg gat 352Asn Arg Ser Ser Ile Ile Phe Ala Gly Gly Asp Lys Trp Ser Val Asp75 80 85cct cga gtt tca att tca aca ttg aat aaa agg gac tac agc ctc cag 400Pro Arg Val Ser Ile Ser Thr Leu Asn Lys Arg Asp Tyr Ser Leu Gln90 95 100ata cag aat gta gat gtg aca gat gat ggc cca tac acg tgt tct gtt 448Ile Gln Asn Val Asp Val Thr Asp Asp Gly Pro Tyr Thr Cys Ser Val105 110 115 120cag act caa cat aca ccc aga aca atg cag gtg cat cta act gtg caa 496Gln Thr Gln His Thr Pro Arg Thr Met Gln Val His Leu Thr Val Gln125 130 135gtt cct cct aag ata tat gac atc tca aat gat atg acc gtc aat gaa 544Val Pro Pro Lys Ile Tyr Asp Ile Ser Asn Asp Met Thr Val Asn Glu140 145 150gga acc aac gtc act ctt act tgt ttg gcc act ggg aaa cca gag cct 592Gly Thr Asn Val Thr Leu Thr Cys Leu Ala Thr Gly Lys Pro Glu Pro155 160 165tcc att tct tgg cga cac atc tcc cca tca gcg aaa cca ttt gaa aat 640Ser Ile Ser Trp Arg His Ile Ser Pro Ser Ala Lys Pro Phe Glu Asn170 175 180gga caa tat ttg gac att tat gga att aca agg gac cag gct ggg gaa 688Gly Gln Tyr Leu Asp Ile Tyr Gly Ile Thr Arg Asp Gln Ala Gly Glu
185 190 195 200tat gaa tgc agt gcg gaa aat gat gtg tca ttc cca gat gtg agg aaa 736Tyr Glu Cys Ser Ala Glu Asn Asp Val Ser Phe Pro Asp Val Arg Lys205 210 215gta aaa gtt gtt gtc aac ttt gct cct act att cag gaa att aaa tct 784Val Lys Val Val Val Asn Phe Ala Pro Thr Ile Gln Glu Ile Lys Ser220 225 230ggc acc gtg acc ccc gga cgc agt ggc ctg ata aga tgt gaa ggt gca 832Gly Thr Val Thr Pro Gly Arg Ser Gly Leu Ile Arg Cys Glu Gly Ala235 240 245ggt gtg ccg cct cca gcc ttt gaa tgg tac aaa gga gag aag aag ctc 880Gly Val Pro Pro Pro Ala Phe Glu Trp Tyr Lys Gly Glu Lys Lys Leu250 255 260ttc aat ggc caa caa gga att att att caa aat ttt agc aca aga tcc 928Phe Asn Gly Gln Gln Gly Ile Ile Ile Gln Asn Phe Ser Thr Arg Ser265 270 275 280att ctc act gtt acc aac gtg aca cag gag cac ttc ggc aat tat act 976Ile Leu Thr Val Thr Asn Val Thr Gln Glu His Phe Gly Asn Tyr Thr285 290 295tgt gtg gct gcc aac aag cta ggc aca acc aat gcg agc ctg cct ctt 1024Cys Val Ala Ala Asn Lys Leu Gly Thr Thr Asn Ala Ser Leu Pro Leu300 305 310aac cct cca agt aca gcc cag tat gga att acc ggg agc gct gat gtt 1072Asn Pro Pro Ser Thr Ala Gln Tyr Gly Ile Thr Gly Ser Ala Asp Val315 320 325ctt ttc tcc tgc tgg tac ctt gtg ttg aca ctg tcc tct ttc acc agc 1120Leu Phe Ser Cys Trp Tyr Leu Val Leu Thr Leu Ser Ser Phe Thr Ser330 335 340ata ttc tac ctg aag aat gcc att cta caa taaattcaaa gacccataaa 1170Ile Phe Tyr Leu Lys Asn Ala Ile Leu Gln345 350aggcttttaa ggattctctg aaagtgctga tggctggatc caatctggta cagtttgtta 1230
aaagcagcgt gggatataat cagcagtgct tacatgggga tgatcgcctt ctgtagaatt 1290gctcattatg taaatacttt aattctactc ttttttgatt agctacatta ccttgtgaag 1350cagtacacat tgtccttttt ttaagacgtg aaagctctga aattactttt agaggatatt 1410aattgtgatt tcatgtttgt aatctacaac ttttcaaaag cattcagtca tggtctgcta 1470ggttgcaggc tgtagtttac aaaaacgaat attgcagtga atatgtgatt ctttaaggct 1530gcaatacaag cattcagttc cctgtttcaa taagagtcaa tccacattta caaagatgca 1590tttttttctt ttttgataaa aaagcaaata atattgcctt cagattattt cttcaaaata 1650taacacatat ctagattttt ctgctcgcat gatattcagg tttcaggaat gagccttgta 1710atataactgg ctgtgcagct ctgcttctct ttcctgtaag ttcagcatgg gtgtgccttc 1770atacaataat atttttctct ttgtctccaa ctaatataaa atgttttgct aaatcttaca 1830atttgaaagt aaaaataaac cagagtgatc aagttaaacc atacactatc tctaagtaac 1890gaaggagcta ttggactgta aaaatctctt cctgcactga caatggggtt tgagaatttt 1950gccccacact aactcagttc ttgtgatgag agacaattta ataacagtat agtaaatata 2010ccatatgatt tctttagttg tagctaaatg ttagatccac cgtgggaaat tattcccttt 2070aaaatgacag cacagtccac tcaaaggatt gcctagcaat acagcatctt ttcctttcac 2130tagtccaagc caaaaatttt aagatgattt gtcagaaagg gcacaaagtc ctatcaccta 2190atattacaag agttggtaag cgctcatcat taattttatt ttgtggcagc taagttagta 2250tgacagaggc agtgctcctg tggacaggag cattttgcat attttccatc tgaaagtatc 2310actcagttga tagtctggaa tgcatgttat atattttaaa acttccaaaa tatattataa 2370caaacattct atatcggtat gtagcagacc aatctctaaa atagctaatt cttcaataaa 2430atctttctat atagccattt cagtgcaaac aagtaaaatc aaaaaagacc atcctttatt 2490tttccttaca tgatatatgt aagatgcgat caaataaaga caaaacacca gtgatgagaa 2550
tatcttaaga taagtaatta tcaaattatt gtgaatgtta aattatttct actataaaga 2610agcaaaacta catttttgaa ggaaaatgct gttactctaa cattaattta caggaatagt 2670ttgatggttt cactctttac taaagaaagg ccatcacctt gaaagccatt ttacaggttt 2730gatgaagtta ccaatttcag tacacctaaa tttctacaaa tagtcccctt ttacaagttg 2790taacaacaaa gaccctataa taaaattaga tacaagaaat tttgcagtgg ttatacatat 2850ttgagatatc tagtatgttg ccctagcagg gatggcttaa aaactgtgat tttttttctt 2910caagtaaaac ttagtcccaa agtacatcat aaatcaattt taactagaaa aatgaatctt 2970aaatgagggg acataagtat actctttcca caaaatggca ataataaggc ataaagctag 3030taaatctact aactgtaata aatgtatgac attattttga ttgatacatt aaaaaagagt 3090ttttagaaca aatatggcat ttaactttat tatttatttg cttttaagaa atattctttg 3150tggaattgtt gaataaacta taaaatatta ttttgtattg cagctttaaa gtggcacact 3210ccataataat ctacctacta gaaatagtgg tgctaccaca aaaaatgtta accatcagta 3270ccattgtttg ggagaaagaa acaggtcaag aatgcatatt attcagtgac cgctttccta 3330gagttaaaat acctcctctt tgtaaggttt gtaggtaaat tgaggtataa actatggatg 3390aaccaaataa ttagttcaaa gtgttgtcat gattccaaat ttgtggagtc tggtgttttt 3450accatagaat gtgacagaag tacagtcata gctcagtagc tatatgtatt tgcctttatg 3510ttagaagaga ctttcttgag tgacattttt aaatagagga ggtattcact atgtttttct 3570gtatcacagc agcattccta gtccttaggc cctcggacag agtgaaatca tgagtattta 3630tgagttcaat attgtcaaat aaggctacag tatttgcttt tttgtgtgaa tgtattgcat 3690ataatgttca agtagatgat tttacattta tggacatata aaacgtctga ttaccccatt 3750ttatcagtcc tgactgtaca agattgttgc aatttcagaa tagcagtttt ataaattgat 3810ttatctttta atctataaca atttgtgtta gctgttcatt tcaggattat attttctaca 3870
agttccactt gtgggactcc ttttgttgcc cctatttttt tttaaagaag gaagaaagaa 3930aaatgagtag cagtttaaaa atgagaatgg agagaaaaga aaaagaatga aaaggaaagg 3990cagtaaagag ggaaaaaaaa ggaaggatgg aaggaatgaa ggaaggaagg gaggaagggg 4050agaaggtagg aagaaagaaa ggatgagagg gaaggaagaa tcagagtatt agggtagtta 4110acttacacat ttgcattctt agttatactg caagtggtgt aactatgttt ttcaatgatc 4170gcatttgaaa cataagtcct attataccat taagttccta ttatgcagca attatataat 4230aaaaagtact gcccaagtta tagtaatgtg ggtgtttttg agacactaaa agatttgaga 4290gggagaattt caaacttaaa gccacttttg gggggtttat aacttaactg aaaaattaat 4350gcttcatcat aacatttaag ctatatctag aaagtagact ggagaactga gaaaattacc 4410caggtaattc agggaaaaaa aaaaaatata tatatatata aataccccta catttgaagt 4470cagaaaactc tgaaaaactg aattatcaaa gtcaatcatc tataatgatc aaatttactg 4530aacaattgtt aatttatcca ttgtgcttag ctttgtgaca cagccaaaag ttacctattt 4590aatcttttca ataaaaattg ttttttgaaa tccagaaatg atttaaaaag aggtcaggtt 4650tttaactatt tattgaagta tgtggatgtc cagtatttca atagatatga atatgaataa 4710atggtatgcc ttaagattct ttgaatatgt atttacttta aagactggaa aaagctcttc 4770ctgtctttta gtaaacatcc atatttcata acctgatgta aaatatgttg tactgtttcc 4830aataggggaa tataaactca gtttatcaat taaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4890a 4891<210>10<211>354<212>PRT<213>智人(Homo sapiens)<400>10Met Asp Met Met Leu Leu Val Gln Gly Ala Cys Cys Ser Asn Gln Trp
1 5 10 15Leu Ala Ala Val Leu Leu Ser Leu Cys Cys Leu Leu Pro Ser Cys Leu20 25 30Pro Ala Gly Gln Ser Val Asp Phe Pro Trp Ala Ala Val Asp Asn Met35 40 45Met Val Arg Lys Gly Asp Thr Ala Val Leu Arg Cys Tyr Leu Glu Asp50 55 60Gly Ala Ser Lys Gly Ala Trp Leu Asn Arg Ser Ser Ile Ile Phe Ala65 70 75 80Gly Gly Asp Lys Trp Ser Val Asp Pro Arg Val Ser Ile Ser Thr Leu85 90 95Asn Lys Arg Asp Tyr Ser Leu Gln Ile Gln Asn Val Asp Val Thr Asp100 105 110Asp Gly Pro Tyr Thr Cys Ser Val Gln Thr Gln His Thr Pro Arg Thr115 120 125Met Gln Val His Leu Thr Val Gln Val Pro Pro Lys Ile Tyr Asp Ile130 135 140Ser Asn Asp Met Thr Val Asn Glu Gly Thr Asn Val Thr Leu Thr Cys145 150 155 160Leu Ala Thr Gly Lys Pro Glu Pro Ser Ile Ser Trp Arg His Ile Ser165 170 175Pro Ser Ala Lys Pro Phe Glu Asn Gly Gln Tyr Leu Asp Ile Tyr Gly180 185 190Ile Thr Arg Asp Gln Ala Gly Glu Tyr Glu Cys Ser Ala Glu Asn Asp195 200 205Val Ser Phe Pro Asp Val Arg Lys Val Lys Val Val Val Asn Phe Ala210 215 220Pro Thr Ile Gln Glu Ile Lys Ser Gly Thr Val Thr Pro Gly Arg Ser225 230 235 240
Gly Leu Ile Arg Cys Glu Gly Ala Gly Val Pro Pro Pro Ala Phe Glu245 250 255Trp Tyr Lys Gly Glu Lys Lys Leu Phe Asn Gly Gln Gln Gly Ile Ile260 265 270Ile Gln Asn Phe Ser Thr Arg Ser Ile Leu Thr Val Thr Asn Val Thr275 280 285Gln Glu His Phe Gly Asn Tyr Thr Cys Val Ala Ala Asn Lys Leu Gly290 295 300Thr Thr Asn Ala Ser Leu Pro Leu Asn Pro Pro Ser Thr Ala Gln Tyr305 310 315 320Gly Ile Thr Gly Ser Ala Asp Val Leu Phe Ser Cys Trp Tyr Leu Val325 330 335Leu Thr Leu Ser Ser Phe Thr Ser Ile Phe Tyr Leu Lys Asn Ala Ile340 345 350Leu Gln<210>11<211>3098<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(223)..(1569)<223>LBFL164<400>11gtttatcgcg cacatctcgc ggcgaggagg agaggccgga agggcgcccc agccccaagg 60ctcctgcccc gcctgggcct ccggctttcg tttccccgca acgcttcgct ttcgtttccc120gctggcgcct ggctccctcc gggtttcgtt tcccgccggc gcctggctcc cgccaggttt180cgtttccgag gcggggccga gggcggcgtc gctgaggcgc cc atg gcc ttc 231
Met Ala Phe1gcc cgc cgg ctc ctg cgc ggg cca ctg tcg ggg ccg ctg ctc ggg cgg 279Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu Leu Gly Arg5 10 15cgc ggg gtc tgc gct ggg gcc atg gct ccg ccg cgc cgc ttc gtc ctg 327Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg Phe Val Leu20 25 30 35gag ctt ccc gac tgc acc ctg gct cac ttc gcc cta ggc gcc gac gcc 375Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly Ala Asp Ala40 45 50ccc ggc gac gca gac gcc ccc gac ccc cgc ctg gcg gcg ctg ctg ggg 423Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala Leu Leu Gly55 60 65ccc ccg gag cgc agc tac tcg ctg tgc gtg ccc gtg acc ccg gac gcc 471Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr Pro Asp Ala70 75 80ggc tgc ggg gcc cgg gtc cgg gcg gcg cgg ctg cac cag cgc ctg ctg 519Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln Arg Leu Leu85 90 95cac cag ctg cgc cgc ggc ccc ttc cag cgg tgc cag ctg ctc agg ctg 567His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu Leu Arg Leu100 105 110 115ctc tgc tac tgc ccg ggc ggc cag gcc ggc ggc gca cag caa ggc ttc 615Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln Gln Gly Phe120 125 130ctg ctg cgc gac ccc ctg gat gac cct gac acc cgg caa gcg ctg ctc 663Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln Ala Leu Leu135 140 145gag ctg ctg ggc gcc tgc cag gag gca cca cgc ccg cac ttg ggc gag 711Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His Leu Gly Glu150 155 160ttc gag gcc gac ccg cgc ggc cag ctg tgg cag cgc ctc tgg gag gtg 759
Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu Trp Glu Val165 170 175caa gac ggc agg cgg ctg cag gtg ggc tgc gca cag gtc gtg ccc gtc 807Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val Val Pro Val180 185 190 195ccg gag ccc ccg ctg cac ccg gtg gtg cca gac ttg ccc agt tcc gtg 855Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro Ser Ser Val200 205 210gtc ttc ccg gac cgg gaa gcc gcc cgg gcc gtt ttg gag gag tgt acc 903Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu Glu Cys Thr215 220 225tcc ttt att cct gaa gcc cgg gca gtg ctt gac ctg gtc gac cag tgc 951Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val Asp Gln Cys230 235 240cca aaa cag atc cag aaa gga aag ttc cag gtt gtt gcc atc gaa gga 999Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala Ile Glu Gly245 250 255ctg gat gcc acg ggt aaa acc acg gtg acc cag tca gtg gca gat tca 1047Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val Ala Asp Ser260 265 270 275ctt aag gct gtc ctc tta aag tca cca ccc tct tgc att ggc cag tgg 1095Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile Gly Gln Trp280 285 290agg aag atc ttt gat gat gaa cca act atc att aga aga gct ttt tac 1143Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg Ala Phe Tyr295 300 305tct ttg ggc aat tat att gtg gcc tcc gaa ata gct aaa gaa tct gcc 1191Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys Glu Ser Ala310 315 320aaa tct cct gtg att gta gac agg tac tgg cac agc acg gcc acc tat 1239Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr Ala Thr Tyr325 330 335gct ata gcc act gag gtg agt ggg ggt ctc cag cac ctg ccc cca gcc 1287
Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu Pro Pro Ala340 345 350 355cat cac cct gtg tac cag tgg cca gag gac ctg ctc aaa cct gac ctt 1335His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys Pro Asp Leu360 365 370atc ctg ctg ctc act gtg agt cct gag gag agg ttg cag agg ctg cag 1383Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln Arg Leu Gln375 380 385ggc cgg ggc atg gag aag acc agg gaa gaa gca gaa ctt gag gcc aac 1431Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu Glu Ala Asn390 395 400agt gtg ttt cgt caa aag gta gaa atg tcc tac cag cgg atg gag aat 1479Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg Met Glu Asn405 410 415cct ggc tgc cat gtg gtt gat gcc agc ccc tcc aga gaa agg gtc ctg 1527Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu Arg Val Leu420 425 430 435cag acg gta tta agc cta atc cag aat agt ttt agt gaa ccg t 1570Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu Pro440 445agttactctg gccaggtgcc acgtctaact agattagatg ttgtttgaaa catctacatc 1630caccatttgt tatgcagtgt tcccaaattt ctgttctaca agcatgttgt gtggcagaaa 1690actggagacc aggcatctta attttacttc agccatcgta ccctcttctg actgatggac 1750ccgtcatcac aaaggtccct ctcatcatgt tccagtgaga ggccagcgat tgctttcttc 1810ctggcatagt aaacattttc ttggaacata tgtttcactt aatcactacc aaatatctgg 1870aagacctgtc ttactcagac agcaccaggt gtacagaagc agcagacaag atcttccaga 1930tcagcaggga gaccccggag cctctgcttc tcctacactg gcatgctgat gagatcgtga 1990catgcccaca ttggcttctt ccacatctgg ttgcactcgt catgatgggc tcgctgcatc 2050tccctcagtc ccaaattcta gagccaagtg ttcctgcaga ggctgtctat gtgtcctggc 2110
tgcccaagga cactcctgca gagccatttt tgggtaagga acacttacaa agaaggcatt 2170gatcttgtgt ctgaggctca gagccctttt gataggcttc tgagtcatat ataaagacat 2230tcaagccaag atgctccaac tgcaaatata ccaaccttct ctgaattata ttttgcttat 2290ttatatttct tttctttttt tctaaagtat ggctctgaat agaatgcaca ttttccattg 2350aactggatgc atttcattta gccaatccag taatttattt atattaatct atacaatatg 2410tttcctcagc ataggagcta tgattcatta attaaaagtg gagtcaaaac gctaaatgca 2470atgtttgttg tgtattttca ttacacaaac ttaatttgtc ttgttaaata agtacagtgg 2530atcttggagt gggatttctt ggtaaattat cttgcacttg aatgtctcat gattacatat 2590gaaatcgctt tgacatatct ttagacagaa aaaagtagct gagtgagggg gaaattatag 2650agctgtgtga ctttagggag taggttgaac caggtgatta cctaaaattc cttccagttc 2710aaaggcagat aaatctgtaa attattttat cctatctacc atttcttaag aagacattac 2770tccaaaataa ttaaatttaa ggctttatca ggtctgcata tagaatctta aattctaata 2830aagtttcatg ttaatgtcat aggattttta aaagagctat aggtaatttc tatataatat 2890gtgtatatta aaatgtaatt gatttcagtt gaaagtattt taaagctgat aaatagcatt 2950agggttcttt gcaatgtggt atctagctgt attattggtt ttatttactt taaacatttt 3010gaaaagctta tactggcagc ctagaaaaac aaacaattaa tgtatcttta tgtccctggc 3070acatgaataa actttgctgt ggtttact 3098<210>12<211>449<212>PRT<213>智人(Homo sapiens)<400>12Met Ala Phe Ala Arg Arg Leu Leu Arg Gly Pro Leu Ser Gly Pro Leu1 5 10 15
Leu Gly Arg Arg Gly Val Cys Ala Gly Ala Met Ala Pro Pro Arg Arg20 25 30Phe Val Leu Glu Leu Pro Asp Cys Thr Leu Ala His Phe Ala Leu Gly35 40 45Ala Asp Ala Pro Gly Asp Ala Asp Ala Pro Asp Pro Arg Leu Ala Ala50 55 60Leu Leu Gly Pro Pro Glu Arg Ser Tyr Ser Leu Cys Val Pro Val Thr65 70 75 80Pro Asp Ala Gly Cys Gly Ala Arg Val Arg Ala Ala Arg Leu His Gln85 90 95Arg Leu Leu His Gln Leu Arg Arg Gly Pro Phe Gln Arg Cys Gln Leu100 105 110Leu Arg Leu Leu Cys Tyr Cys Pro Gly Gly Gln Ala Gly Gly Ala Gln115 120 125G1n Gly Phe Leu Leu Arg Asp Pro Leu Asp Asp Pro Asp Thr Arg Gln130 135 140Ala Leu Leu Glu Leu Leu Gly Ala Cys Gln Glu Ala Pro Arg Pro His145 150 155 160Leu Gly Glu Phe Glu Ala Asp Pro Arg Gly Gln Leu Trp Gln Arg Leu165 170 175Trp Glu Val Gln Asp Gly Arg Arg Leu Gln Val Gly Cys Ala Gln Val180 185 190Val Pro Val Pro Glu Pro Pro Leu His Pro Val Val Pro Asp Leu Pro195 200 205Ser Ser Val Val Phe Pro Asp Arg Glu Ala Ala Arg Ala Val Leu Glu210 215 220Glu Cys Thr Ser Phe Ile Pro Glu Ala Arg Ala Val Leu Asp Leu Val225 230 235 240Asp Gln Cys Pro Lys Gln Ile Gln Lys Gly Lys Phe Gln Val Val Ala
245 250 255Ile Glu Gly Leu Asp Ala Thr Gly Lys Thr Thr Val Thr Gln Ser Val260 265 270Ala Asp Ser Leu Lys Ala Val Leu Leu Lys Ser Pro Pro Ser Cys Ile275 280 285Gly Gln Trp Arg Lys Ile Phe Asp Asp Glu Pro Thr Ile Ile Arg Arg290 295 300Ala Phe Tyr Ser Leu Gly Asn Tyr Ile Val Ala Ser Glu Ile Ala Lys305 310 315 320Glu Ser Ala Lys Ser Pro Val Ile Val Asp Arg Tyr Trp His Ser Thr325 330 335Ala Thr Tyr Ala Ile Ala Thr Glu Val Ser Gly Gly Leu Gln His Leu340 345 350Pro Pro Ala His His Pro Val Tyr Gln Trp Pro Glu Asp Leu Leu Lys355 360 365Pro Asp Leu Ile Leu Leu Leu Thr Val Ser Pro Glu Glu Arg Leu Gln370 375 380Arg Leu Gln Gly Arg Gly Met Glu Lys Thr Arg Glu Glu Ala Glu Leu385 390 395 400Glu Ala Asn Ser Val Phe Arg Gln Lys Val Glu Met Ser Tyr Gln Arg405 410 415Met Glu Asn Pro Gly Cys His Val Val Asp Ala Ser Pro Ser Arg Glu420 425 430Arg Val Leu Gln Thr Val Leu Ser Leu Ile Gln Asn Ser Phe Ser Glu435 440 445Pro<210>13<211>1893
<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(418)..(1392)<223>LBFLl67 Clone #20<400>13agtccagctg ccgttaggcg ctgggatagt cgcacgctgg atgcatctac gtccgccgag 60cccctggggc gaagaggccg cgtccgcctt catttgtggc cggtgcttcg ccccctgacc120cttcgccccc aaagaccagc tctaacgtga gcgcctcggc cgccctgccc cagcctcgta180cacgccgcca gcctcgccca gccggtgtcc ggagaccctc gggccgtgtc catttgtggg240caaagccagc ggggcaggct tggccagagt gcaccactcg gcgccgtccc aggcccgacg300ctctgggcgc gcccggaacc ccaggttcgc ggcccgtgtt tccgaccggc ggagggggct360cagcggcccg atcccacgga agcgcgctcg gaggggtggg acccggccgg accggag 417atg gcg ccg cca gcg ggc ggg gcg gcg gcg gcg gcc tcg gac ttg ggc 465Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly1 5 10 15tcc gcc gca gtg crc ttg gct gtg cac gcc gcg gtg agg ccg ctg ggc 513Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly20 25 30gcc ggg cca gac gcc gag gca cag ctg cgg agg ctg cag ctg agc gcg 561Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala35 40 45gac cct gag cgg cct ggg cgc ttc cgg ctg gag ctg ctg ggc gcg gga 609Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly50 55 60cct ggg gcg gtt aat ttg gag tgg ccc ctg gag tca gtt tcc tac acc 657Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr65 70 75 80
atc cga ggc ccc acc cag cac gag cta cag cct cca cca gga ggg cct 705Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro85 90 95gga acc ctc agc ctg cac ttc ctc aac cct cag gaa gct cag cgg tgg 753Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp100 105 110gca gtc cta gtc cga ggt gcc acc gtg gaa gga cag aat ggc agc aag 801Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys115 120 125agc aac tca cca cca gcc ttg ggc cca gaa gca tgc cct gtc tcc ctg 849Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu130 135 140ccc agt ccc ccg gaa gcc tcc aca ctc aag ggc cct cca cct gag gca 897Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala145 150 155 160gat ctt cct agg agc cct gga aac ttg acg gag aga gaa gag ctg gca 945Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala165 170 175ggg agc ctg gcc cgg gct att gca ggt gga gac gag aag ggg gca gcc 993Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala180 185 190caa gtg gca gcc gtc ctg gcc cag cat cgt gtg gcc ctg agt gtt cag 1041G1n Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln195 200 205ctt cag gag gcc tgc ttc cca cct ggc ccc atc agg ctg cag gtc aca 1089Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr210 215 220ctt gaa gac gct gcc tct gcc gca tcc gcc gcg tcc tct gca cac gtt 1137Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val225 230 235 240gcc ctg cag gtc cac ccc cac tgc act gtt gca gct ctc cag gag cag 1185Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln245 250 255
gtg ttc tca gag ctc ggt ttc cog cca gcc gtg caa cgc tgg gtc atc 1233Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile260 265 270gga cgg tgc ctg tgt gtg cct gag cgc agc crt gcc tct tac ggg gtt 1281Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val275 280 285cgg cag gat ggg gac cct gct ttc ctc tac ttg ctg tca gct cct cga 1329Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg290 295 300gaa gcc cca ggt cag tcc tcg atg ggg gtg ggg tgt ggg agg tgg ggt 1377Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly305 310 315 320gca gcc cca cag tcc tgagctcc accccctcag ccacaggacc tagccctcag 1430Ala Ala Pro Gln Ser325cacccccaga agatggacgg ggaacttgga cgcttgtttc ccccatcatt ggggctaccc 1490ccaggccccc agccagctgc ctccagcctg cccagtccac tccagcccag ctggtcctgt 1550ccttcctgca ccttcatcaa tgccccagac cgccctggct gtgagatgtg tagcacccag 1610aggccctgca cttgggaccc ccttgctgca gcttccacct agcagccacc agaggtacca 1670gaggtggcac aggcagggga ggtggggggc cagggcagaa tccacaggaa tgacccagct 1730cctcccccac aggttacaag gggagagtgg cccttccctc acaagtccga catctccagg 1790cccccactga actccgggga cctctactga ctgcttgctg ggacagtcac cagggttggg 1850gggaagggcc acaaaatgaa accattaaag acccttaaga gcc 1893<210>14<211>325<212>PRT<213>智人(Homo sapiens)<400>14Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly
1 5 10 15Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly20 25 30Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala35 40 45Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly50 55 60Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr65 70 75 80Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro85 90 95Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp100 105 110Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys115 120 125Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu130 135 140Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala145 150 155 160Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala165 170 175Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala180 185 190Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln195 200 205Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr210 215 220Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val225 230 235 240
Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln245 250 255Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile260 265 270Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val275 280 285Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg290 295 300Glu Ala Pro Gly Gln Ser Ser Met Gly Val Gly Cys Gly Arg Trp Gly305 310 315 320Ala Ala Pro Gln Ser325<210>15<211>1597<212>DNA<213>智人(Homo sapiens)<220>
<221>CDS<222>(271)..(1431)<223>LBFLl67 Clone #46<400>15gtgagcgcct cggccgccct gccccagcct cgtacacgcc gccagctcgc ccagccggtg 60tccggagacc ctcgggccgt gtccatttgt gggcaaagcc agcggggcag gcttggccag120agtgcaccac tcggcgccgt cccaggcccg acgctctggg cgcgcccgga accccaggtt180cgcggcccgt gtttccgacc ggcggagggg gctcagcggc ccgatcccac ggaagcgcgc240tcggaggggt gggacccggc cggaccggag atg gcg ccg cca gcg ggc ggg gcg 294Met Ala Pro Pro Ala Gly Gly Ala1 5gcg gcg gcg gcc tcg gac ttg ggc tcc gcc gca gtg ctc ttg gct gtg 342
Ala Ala Ala Ala Ser Asp Leu Gly Ser Ala Ala Val Leu Leu Ala Val10 15 20cac gcc gcg gtg agg ccg ctg ggc gcc ggg cca gac gcc gag gca cag 390His Ala Ala Val Arg Pro Leu Gly Ala Gly Pro Asp Ala Glu Ala Gln25 30 35 40ctg cgg agg ctg cag ctg agc gcg gac cct gag agg cct ggg cgc ttc 438Leu Arg Arg Leu Gln Leu Ser Ala Asp Pro Glu Arg Pro Gly Arg Phe45 50 55cgg ctg gag ctg ctg ggc gcg gga cct ggg gcg gtt aat ttg gag tgg 486Arg Leu Glu Leu Leu Gly Ala Gly Pro Gly Ala Val Asn Leu Glu Trp60 65 70ccc ctg gag tca gtt tcc tac acc atc cga ggc ccc acc cag cac gag 534Pro Leu Glu Ser Val Ser Tyr Thr Ile Arg Gly Pro Thr Gln His Glu75 80 85cta cag cct cca cca gga ggg cct gga acc ctc agc ctg cac ttc ctc 582Leu Gln Pro Pro Pro Gly Gly Pro Gly Thr Leu Ser Leu His Phe Leu90 95 100aac cct cag gaa gct cag cgg tgg gca gtc cta gtc cga ggt gcc acc 630Asn Pro Gln Glu Ala Gln Arg Trp Ala Val Leu Val Arg Gly Ala Thr105 110 115 120gtg gaa gga cag aat ggc agc aag agc aac tca cca cca gcc ttg ggc 678Val Glu Gly Gln Asn Gly Ser Lys Ser Asn Ser Pro Pro Ala Leu Gly125 130 135cca gaa gca tgc cct gtc tcc ctg ccc agt ccc ccg gaa gcc tcc aca 726Pro Glu Ala Cys Pro Val Ser Leu Pro Ser Pro Pro Glu Ala Ser Thr140 145 150ctc aag ggc cct cca cct gag gca gat ctt cct agg agc cct gga aac 774Leu Lys Gly Pro Pro Pro Glu Ala Asp Leu Pro Arg Ser Pro Gly Asn155 l60 165ttg acg gag aga gaa gag ctg gca ggg agc ctg gcc cgg gct att gca 822Leu Thr Glu Arg Glu Glu Leu Ala Gly Ser Leu Ala Arg Ala Ile Ala170 175 180ggt gga gac gag aag ggg gca gcc caa gtg gca gcc gtc ctg gcc cag 870
Gly Gly Asp Glu Lys Gly Ala Ala Gln Val Ala Ala Val Leu Ala Gln185 190 195 200cat cgt gtg gcc ctg agt gtt cag ctt cag gag gcc tgc ttc cca cct 918His Arg Val Ala Leu Ser Val Gln Leu Gln Glu Ala Cys Phe Pro Pro205 210 215ggc ccc atc agg ctg cag gtc aca ctt gaa gac gct gcc tct gcc gca 966Gly Pro Ile Arg Leu Gln Val Thr Leu Glu Asp Ala Ala Ser Ala Ala220 225 230tcc gcc gcg tcc tct gca cac gtt gcc ctg cag gtc cac ccc cac tgc 1014Ser Ala Ala Ser Ser Ala His Val Ala Leu Gln Val His Pro His Cys235 240 245act gtt gca gct ctc cag gag cag gtg ttc tca gag ctc ggt ttc ccg 1062Thr Val Ala Ala Leu Gln Glu Gln Val Phe Ser Glu Leu Gly Phe Pro250 255 260cca gcc gtg caa cgc tgg gtc atc gga cgg tgc ctg tgt gtg cct gag 1110Pro Ala Val Gln Arg Trp Val Ile G1y Arg Cys Leu Cys Val Pro Glu265 270 275 280cgc agc ctt gcc tct tac ggg gtt cgg cag gat ggg gac cct gct ttc 1158Arg Ser Leu Ala Ser Tyr Gly Val Arg Gln Asp Gly Asp Pro Ala Phe285 290 295ctc tac ttg ctg tca gct cct cga gaa gcc cca gcc aca gga cct agc 1206Leu Tyr Leu Leu Ser Ala Pro Arg Glu Ala Pro Ala Thr Gly Pro Ser300 305 310cct cag cac ccc cag aag atg gac ggg gaa ctt gga cgc ttg ttt ccc1254Pro Gln His Pro Gln Lys Met Asp Gly Glu Leu Gly Arg Leu Phe Pro315 320 325cca tca ttg ggg cta ccc cca ggc ccc cag cca gct gcc tcc agc ctg 1302Pro Ser Leu Gly Leu Pro Pro Gly Pro Gln Pro Ala Ala Ser Ser Leu330 335 340ccc agt cca ctc cag ccc agc tgg tcc tgt cct tcc tgc acc ttc atc 1350Pro Ser Pro Leu Gln Pro Ser Trp Ser Cys Pro Ser Cys Thr Phe Ile345 350 355 360aat gcc cca gac cgc cct ggc tgt gag atg tgt agc acc cag agg ccc 1398
Asn Ala Pro Asp Arg Pro Gly Cys Glu Met Cys Ser Thr Gln Arg Pro365 370 375tgc act tgg gac ccc ctt gct gca gct tcc acc tagcagcca ccagaggtta 1450Cys Thr Trp Asp Pro Leu Ala Ala Ala Ser Thr380 385caaggggaga gtggcccttc cctcacaagt ccgacatctc caggccccca ctgaactccg 1510gggacctcta ctgactgctt gctgggacag tcaccagggt tggggggaag ggccacaaaa 1570tgaaaccatt aaagaccctt aagagcc 1597<210>16<211>387<212>PRT<213>智人(Homo sapiens)<400>16Met Ala Pro Pro Ala Gly Gly Ala Ala Ala Ala Ala Ser Asp Leu Gly1 5 10 15Ser Ala Ala Val Leu Leu Ala Val His Ala Ala Val Arg Pro Leu Gly20 25 30Ala Gly Pro Asp Ala Glu Ala Gln Leu Arg Arg Leu Gln Leu Ser Ala35 40 45Asp Pro Glu Arg Pro Gly Arg Phe Arg Leu Glu Leu Leu Gly Ala Gly50 55 60Pro Gly Ala Val Asn Leu Glu Trp Pro Leu Glu Ser Val Ser Tyr Thr65 70 75 80Ile Arg Gly Pro Thr Gln His Glu Leu Gln Pro Pro Pro Gly Gly Pro85 90 95Gly Thr Leu Ser Leu His Phe Leu Asn Pro Gln Glu Ala Gln Arg Trp100 105 110Ala Val Leu Val Arg Gly Ala Thr Val Glu Gly Gln Asn Gly Ser Lys115 120 125
Ser Asn Ser Pro Pro Ala Leu Gly Pro Glu Ala Cys Pro Val Ser Leu130 135 140Pro Ser Pro Pro Glu Ala Ser Thr Leu Lys Gly Pro Pro Pro Glu Ala1451 50 155 160Asp Leu Pro Arg Ser Pro Gly Asn Leu Thr Glu Arg Glu Glu Leu Ala165 170 175Gly Ser Leu Ala Arg Ala Ile Ala Gly Gly Asp Glu Lys Gly Ala Ala180 185 190Gln Val Ala Ala Val Leu Ala Gln His Arg Val Ala Leu Ser Val Gln195 200 205Leu Gln Glu Ala Cys Phe Pro Pro Gly Pro Ile Arg Leu Gln Val Thr210 215 220Leu Glu Asp Ala Ala Ser Ala Ala Ser Ala Ala Ser Ser Ala His Val225 230 235 240Ala Leu Gln Val His Pro His Cys Thr Val Ala Ala Leu Gln Glu Gln245 250 255Val Phe Ser Glu Leu Gly Phe Pro Pro Ala Val Gln Arg Trp Val Ile260 265 270Gly Arg Cys Leu Cys Val Pro Glu Arg Ser Leu Ala Ser Tyr Gly Val275 280 285Arg Gln Asp Gly Asp Pro Ala Phe Leu Tyr Leu Leu Ser Ala Pro Arg290 295 300Glu Ala Pro Ala Thr Gly Pro Ser Pro Gln His Pro Gln Lys Met Asp305 310 315 320Gly Glu Leu Gly Arg Leu Phe Pro Pro Ser Leu Gly Leu Pro Pro Gly325 330 335Pro Gln Pro Ala Ala Ser Ser Leu Pro Ser Pro Leu Gln Pro Ser Trp340 345 350Ser Cys Pro Ser Cys Thr Phe Ile Asn Ala Pro Asp Arg Pro Gly Cys355 360 365
Glu Met Cys Ser Thr Gln Arg Pro Cys Thr Trp Asp Pro Leu Ala Ala370 375 380Ala Ser Thr385<210>17<211>21<212>DNA<213>人工序列<220>
<223>引物<400>17gctgaagcag gaaaatcgct t 21<210>18<211>21<212>DNA<213>人工序列<220>
<223>引物<400>18tgagacggag tctcactcgg t 21<210>19<211>24<212>DNA<213>人工序列<220>
<223>引物<400>19
gtttttccta attttggcat gaac 24<210>20<211>19<212>DNA<213>人工序列<220>
<223>引物<400>20cgcccaagct tttcctttt 19<210>21<211>26<212>DNA<213>人工序列<220>
<223>引物<400>21caccctttgc ctctgtcact tccgca 26<210>22<211>23<212>DNA<213>人工序列<220>
<223>引物<400>22gctggagcac caggactgca ttg23<210>23<211>24
<212>DNA<213>人工序列<220>
<223>引物<400>23ggagctgagc agcagtgtaa tgaa 24<210>24<211>25<212>DNA<213>人工序列<220>
<223>引物<400>24gaggcctgcc tgaaggagga gcttc 25<210>25<211>26<212>DNA<213>人工序列<220>
<223>引物<400>25tctggaagta gtgcagacgc ctcagg 26<210>26<211>26<212>DNA<213>人工序列<220>
<223>引物
<400>26agccaacgtc ggctttgtta tccagc 26<210>27<211>25<212>DNA<213>人工序列<220>
<223>引物<400>27gctgtcagat atgatggttc tggac 25<210>28<211>24<212>DNA<213>人工序列<220>
<223>引物<400>28ccagcctcac cactgttggg ttgc 24<210>29<211>23<212>DNA<213>人工序列<220>
<223>引物<400>29cattctctga gctgtattag tgt23
<210>30<211>21<212>DNA<213>人工序列<220>
<223>引物<400>30cctgagctgg aatgacctgc a 21<210>31<211>22<212>DNA<213>人工序列<220>
<223>引物<400>31ctttgtgttg gctgcagcca ca 22<210>32<211>24<212>DNA<213>人工序列<220>
<223>引物<400>32tgaggagaga ctttgctgac tggt 24<210>33<211>20<212>DNA<213>人工序列
<220>
<223>引物<400>33gtcctgtctg gcggtgccga20<210>34<211>42<212>DNA<213>人工序列<220>
<223>引物<400>34gctccaggat cccctgtcac ctgggccttc tgccttttgg ct 42<210>35<211>28<212>DNA<213>人工序列<220>
<223>引物<400>35ccatatggag aggagagcag cgggccca 28<210>36<211>23<212>DNA<213>人工序列<220>
<223>引物
<400>36gaaggaggaa catggagagg aga23<210>37<211>27<212>DNA<213>人工序列<220>
<223>引物<400>37ccatatgccc cgggtagtct actgcat27<210>38<211>33<212>DNA<213>人工序列<220>
<223>引物<400>38gtcgactcga gtcacttccg caaaaacttc ttg 33<210>39<211>22<212>DNA<213>人工序列<220>
<223>引物<400>39tccattccga aggctctcct cc 22<210>40
<211>23<212>DNA<213>人工序列<220>
<223>引物<400>40gtctgtgtga cggaaatgta agc23<210>41<211>23<212>DNA<213>人工序列<220>
<223>引物<400>41gaaggtcgaa ggcagaccga tgt23<210>42<211>24<212>DNA<213>人工序列<220>
<223>引物<400>42gaatgtgtca gagacaagtg cagc 24<210>43<211>26<212>DNA<213>人工序列<220>
<223>引物<400>43tgtagaaact cttggactaa tggagg 26<210>44<211>29<212>DNA<213>人工序列<220>
<223>引物<400>44gtatgcatca gaattcccta tagatcttt 29<210>45<211>21<212>DNA<213>人工序列<220>
<223>引物<400>45tagatgtttg ggcaacagcc t 21<210>46<211>32<212>DNA<213>人工序列<220>
<223>引物<400>46ttccttcacc aaaggcatcc agccattcta tg 32
<210>47<211>28<212>DNA<213>人工序列<220>
<223>引物<400>47aaatgtctga ttaccccatt ttatcagt 28<210>48<211>24<212>DNA<213>人工序列<220>
<223>引物<400>48taatcctgaa atgaacagct aaca 24<210>49<211>30<212>DNA<213>人工序列<220>
<223>引物<400>49taatgttaga gtaacagcat tttccttcaa 30<210>50<211>29<212>DNA
<213>人工序列<220>
<223>引物<400>50tgccccacac taactcagtt cttgtgatg 29<210>51<211>29<212>DNA<213>人工序列<220>
<223>引物<400>51aaggctttat caggtctgca tatagaatc 29<210>52<211>28<212>DNA<213>人工序列<220>
<223>引物<400>52gcaaagaacc ctaatgctat ttatcagc 28<210>53<211>22<212>DNA<213>人工序列<220>
<223>引物
<400>53gagaagacca gggaagaagc ag 22<210>54<211>19<212>DNA<213>人工序列<220>
<223>引物<400>54ggacggggaa cttggacgc 19<210>55<211>20<212>DNA<213>人工序列<220>
<223>引物<400>55aagtgcaggg cctctgggtg20<210>56<211>19<212>DNA<213>人工序列<220>
<223>引物<400>56cgctgggtca tcggacggt 19
权利要求
1.分离的核酸分子,选自(a)包括SEQ ID NO1、3、5、7、9、11、13或15的分离的核酸分子,(b)编码SEQ ID NO2、4、6、8、10、12、14或16的分离的核酸分子,(c)分离的核酸分子,其编码的蛋白在癌症中表达,并与SEQ ID NO1、3、5、7、9、11、13或15中的全部连续的序列表现出至少大约75%的核苷酸序列同一性,以及(d)包括与(a)、(b)或(c)中核酸分子互补的序列的分离的核酸分子。
2.权利要求1的分离的核酸分子,其中的核酸分子包括SEQ IDNO1的390-4880位核苷酸,SEQ ID NO3的12-4904位核苷酸,SEQ IDNO5的424-1908位核苷酸,SEQ ID NO7的405-1835位核苷酸,SEQID NO9的89-1150位核苷酸,SEQ ID NO11的223-1569位核苷酸,SEQ ID NO13的418-1392位核苷酸,或SEQ ID NO15的271-1431位核苷酸。
3.权利要求1的分离的核酸分子,其中核酸分子包括SEQ IDNO1的390-4883位核苷酸,SEQ ID NO3的12-4907位核苷酸,SEQ IDNO5的424-1911位核苷酸,SEQ ID NO7的405-1838位核苷酸,SEQID NO9的89-1153位核苷酸,SEQ ID NO11的223-1572位核苷酸,SEQ ID NO13的418-1395位核苷酸,或SEQ ID NO15的271-1434位核苷酸。
4.权利要求1的分离的核酸分子,其中核酸分子的组成为SEQ IDNO1的390-4883位核苷酸,SEQ ID NO3的12-4907位核苷酸,SEQ IDNO5的424-1908位核苷酸,SEQ ID NO7的405-1835位核苷酸,SEQID NO9的89-1153位核苷酸,SEQ ID NO11的223-1569位核苷酸,SEQ ID NO13的418-1395位核苷酸,或SEQ ID NO15的271-1434位核苷酸。
5.权利要求1-4任一项的分离的核酸分子,其中该核酸分子与一个或多个表达控制元件可操作地连接。
6.含有权利要求1-4任一项的分离的核酸分子的载体。
7.被转化以含有权利要求1-4任一项的核酸分子的宿主细胞。
8.含有权利要求6的载体的宿主细胞。
9.权利要求8的宿主细胞,其中该宿主细胞选自原核宿主细胞和真核宿主细胞。
10.一种生产多肽的方法,包括培养以权利要求1-4任一项的核酸分子转化的宿主细胞,培养条件为由所述核酸分子编码的蛋白被表达。
11.权利要求10的方法,其中该宿主细胞选自原核宿主细胞和真核宿主细胞。
12.通过权利要求10的方法生产的分离的多肽。
13.分离的多肽或蛋白,选自包括SEQ ID NO2、4、6、8、10、12、14或16的氨基酸序列的蛋白和与SEQ ID NO2、4、6、8、10、12、14或16具有至少大约75%氨基酸序列同一性的蛋白。
14.与权利要求13的多肽结合的分离的抗体或抗原结合的抗体片段。
15.权利要求14的抗体,其中该抗体是单克隆或多克隆抗体。
16.一种鉴定试剂的方法,所述试剂能够调节编码权利要求13的蛋白的核酸表达,包括将表达核酸的细胞暴露于试剂;以及确定试剂是否调节该核酸的表达,从而鉴定调节编码蛋白的核酸表达的试剂。
17.一种鉴定试剂的方法,所述试剂调节权利要求13的蛋白的水平或至少一种活性,包括将表达蛋白的细胞暴露于试剂;确定试剂是否调节该蛋白的水平或至少一种活性,从而鉴定调节蛋白的水平或至少一种活性的试剂。
18.权利要求17的方法,其中的试剂调节蛋白的一种活性。
19.一种调节编码权利要求13的蛋白的核酸表达的方法,包括施用有效量的调节编码所述蛋白的核酸表达的试剂。
20.一种调节权利要求13的蛋白的至少一种活性的方法,包括施用有效量的调节所述蛋白的至少一种活性的试剂。
21.一种鉴定权利要求13的蛋白的结合配体的方法,包括将该蛋白暴露于潜在的结合配体;以及确定潜在的结合配体是否与该蛋白结合,从而鉴定蛋白的结合配体。
22.一种鉴定试剂的方法,所述试剂调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用,包括将该蛋白和该配体暴露于试剂;以及确定该试剂是否调节结合配体与该蛋白的结合,从而鉴定调节结合配体与该蛋白的结合的试剂。
23.一种调节权利要求21的结合配体和权利要求13的蛋白之间的相互作用的方法,包括施用有效量的调节结合配体与该蛋白的结合的试剂。
24.一种非人的转基因动物,被修饰以含有权利要求1-4任一项的核酸分子。
25.权利要求24的转基因动物,其中的核酸分子含有阻止编码的蛋白表达的突变。
26.一种治疗对象疾病状态的方法,包括在患病的细胞中插入基因构建物,该构建物中含有与启动子或增强子元件连接的权利要求1-4任一项的分离的核酸分子,以便该核酸分子的表达抑制该疾病。
27.权利要求26的方法,其中在患病的细胞中插入基因构建物是在体内完成的。
28.权利要求26的方法,其中在患病的细胞中插入基因构建物还包括病毒或质粒因子的使用,并且在体外或体内完成。
29.一种诊断对象疾病状态的方法,包括确定权利要求1-4或13任一项的核酸分子或蛋白的表达水平。
30.权利要求26和29的方法,其中的疾病状态是癌症。
31.权利要求26和29的方法,其中的疾病状态是恶性肿瘤。
32.权利要求31的方法,其中的恶性肿瘤发生在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃。
33.一种含有稀释剂和多肽或蛋白的组合物,其中该多肽或蛋白选自含有SEQ ID NO2、4、6、8、10、12、14或16氨基酸序列的分离的多肽;含有SEQ ID NO2、4、6、8、10、12、14或16的至少10个氨基酸片段的分离的多肽;含有SEQ ID NO2、4、6、8、10、12、14或16的保守氨基酸置换的分离的多肽;含有SEQ ID NO2、4、6、8、10、12、14或16的自然存在的氨基酸序列变体的分离的多肽;以及与SEQ ID NO2、4、6、8、10、12、14或16表现出至少大约75%氨基酸序列同一性的分离的多肽。
全文摘要
本发明总地涉及来自癌症病人的人组织中基因表达的变化。具体来说,本发明涉及在乳腺、结肠、食管、肾脏、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、直肠和/或胃的癌症组织与相应的正常组织相比差异表达的人基因家族。
文档编号C12N15/12GK1705745SQ200380101640
公开日2005年12月7日 申请日期2003年10月16日 优先权日2002年10月18日
发明者李寿振, 高尚锡, 李福万, 郑铉浩, 赵成浩, 梁斗锡 申请人:株式会社Lg生命科学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1