肝癌相关的基因家族的制作方法

文档序号:3553436阅读:765来源:国知局
专利名称:肝癌相关的基因家族的制作方法
技术领域
本发明总体上涉及肝癌患者的肝组织中基因表达的改变,所述肝癌患者同时患有肝硬化或肝炎。本发明特别涉及与发炎或硬化的肝组织相比在肝癌组织或其它恶性肿瘤中差异表达的人类基因家族。
背景技术
肝病一般,肝病被分类为导致肝脏功能故障或丧失全部功能的疾病。例如,肝硬化是一类慢性肝病,其中肝脏细胞被损坏然后被瘢痕组织代替,因此减少了正常肝组织的数量。肝硬化通常是由滥用酒精引起的,但是有肝炎感染的患者或有其它胆汁疾病的患者也会发展为肝硬化。通常认为慢性的乙型肝炎,丙型肝炎,和肝硬化都表现出与原发性肝癌有着很强的相关性,尽管所涉及的机理到目前还不是很了解(Wu等人,(2001)Oncogene 203674-3682)。大约10-20%的慢性乙型肝炎感染会导致原发性肝癌。其它的因素例如酒精的消费,营养贫乏和黄曲霉毒素也都与原发性肝癌和肝硬化相关。
肝硬化的特征在于广泛存在的结节以及纤维化。受损的或死亡的肝细胞被纤维状的瘢痕组织代替,导致了纤维化。肝细胞以一种反常的形式进行再生,产生了被纤维组织围绕的结节。所述纤维化和结节的形成导致了对肝脏结构成分的扭曲和封闭,从而破坏了血流和生化功能。
利用患者所表现出的明显症状对肝硬化进行诊断通常是容易的,但是在其早期阶段是很难诊断肝硬化的。在早期阶段出现的一些细微的改变包括红色的手掌,白色上体出现红点,腮腺肥大,手掌内腱的纤维化和男子乳房发育症。X光和放射性追踪检测测试法可能是有效的,但是诊断必须经常要通过肝脏的活组织切片检查来进行。
与肝硬化的病理学不同,在原发性肝癌中,肝细胞成为异常的,它们生长不受控制并形成了恶性的肿瘤。所述疾病也称为肝细胞癌(HCC)或恶性肝细胞瘤。由于转移的结果从身体的其它部分扩散到肝脏的癌是一种不同的疾病。由于症状不明确,HCC在其早期很难进行诊断。这些症状包括食欲丧失和体重降低,发烧,疲劳和虚弱。随着癌症的发展,上腹部可能出现疼痛,并进一步发展为背部和右肩的疼痛。在上腹部可能会出现肿胀或可触摸到的肿块,同时会出现黄疸和黑尿。当癌转移时,它一般指向肺或脑。
HCC的诊断可以通过血液检测进行,特别是,例如检测肿瘤标记例如α-胎蛋白。大约50-70%的HCC患者表现出升高的α-胎蛋白水平。另外的检测方法包括非放射性成像(腹部的或胸部的X光片,血管造影,CT扫描和MRIs),使用放射性材料的肝脏扫描和肝脏的活组织切片检查。由于疾病的发现通常都太晚了,所以HCC的治疗通常是不成功的,但是其方法包括外科手术切除癌,化学疗法或放射疗法,它们单独或组合使用。尽管HCC在美国不是非常普遍,但是它在亚洲和非洲的部分地区是非常普遍的,这主要是由于肝炎病毒感染的高发病率(http//cis.nci.nih.gov/;http//cancer.med.upenn.edu/disease/liver/intro_liver.html)。
肝脏疾病中的分子变化与肝病的发展和进展相关的肝脏细胞中的分子变化知之甚少。因此,需要研究与肝病的发展和进展有关的基因表达水平的改变和鉴定新分子标记。此外,如果想要成功地进行干扰以中断或缓解肝病,就需要建立可以精确评价肝硬化或HCC的早期表现的方法。同样,为了防止或停止肝病的发展而采用的疗法的发展依赖于基因的鉴定,所述基因负责肝细胞的癌变和癌变肝细胞的生长或与肝硬化有关的组织损伤的诱导和瘢痕形成。

发明内容
本发明是基于新的基因家族的发现,其分别被命名为LBFL302和LBFL303,与肝硬化(LC)或慢性肝炎(CH)相比,它们在肝细胞癌(HCC)和其它的恶性肿瘤中差异性表达。本发明包括分离的核酸分子,其选自下列含有SEQ ID NO1,3,5或7的分离的核酸分子;编码SEQ IDNO6或8的分离的核酸分子;编码肝癌中所表达的蛋白并与SEQ IDNO5的整个连续序列表现出至少95%核苷酸序列同一性的分离的核酸分子;编码肝癌中所表达的蛋白并与SEQ ID NO7的整个连续序列表现出至少75%核苷酸序列同一性的分离的核酸分子;和包含上述任一核酸分子的互补链的分离的核酸分子。
本发明进一步包括可操作地连接到一种或多种表达控制元件的核酸分子,包括包含所述分离的核酸分子的载体。本发明进一步包括经转化含有本发明核酸分子的宿主细胞,以及生产蛋白质的方法,所述方法包括步骤在可以表达所述蛋白质的条件下培养用本发明核酸分子转化的宿主细胞。
本发明进一步提供选自下列的分离的多肽包含SEQ ID NO2,4,6或8的氨基酸序列的分离多肽;包含SEQ ID NO2或4中至少10个氨基酸的片段的分离多肽;包含SEQ ID NO2或4的保守氨基酸替代的分离多肽;和包含SEQ ID NO2或4的天然存在的突变氨基酸序列的分离多肽。本发明的多肽还包括这样的多肽,它们的氨基酸序列与SEQ ID NO2或4的序列具有至少大约50%,60%,70%或75%氨基酸序列同一性,优选至少大约80%,进一步优选至少大约90-95%,和最优选至少95-98%的序列同一性,本发明还包括与SEQ ID NO6或8具有至少大约95%氨基酸序列同一性的蛋白质。
本发明进一步提供与本发明多肽特异性结合的分离的抗体或抗原结合型抗体片段,包括单克隆和多克隆抗体。
本发明进一步提供了鉴定一种物质的方法,所述物质可以调控编码本发明蛋白的核酸的表达,该方法包括将表达该核酸分子的细胞暴露于所述物质;和确认所述物质是否调控所述核酸分子的表达,从而鉴定可以调控编码所述蛋白的核酸分子表达的物质。
本发明进一步提供鉴定物质的方法,该物质可以调控本发明蛋白的水平或该蛋白的至少一种活性,该方法包括将表达该蛋白的细胞暴露于所述物质;和确认所述物质是否可以调控所述蛋白的水平或该蛋白的至少一种活性,从而鉴定可以调控所述蛋白的水平或该蛋白的至少一种活性的物质。
本发明进一步提供鉴定本发明蛋白的结合配偶体(partner)的方法,包括步骤将所述蛋白暴露于潜在的结合配偶体;和确认所述潜在的结合配偶体是否结合到所述蛋白上,从而鉴定所述蛋白的结合配偶体。
本发明进一步提供调控编码本发明蛋白的核酸分子表达的方法,包括步骤施用有效量的调控编码所述蛋白的核酸分子表达的物质。本发明还提供了调控本发明蛋白的至少一种活性的方法,包括步骤施用有效量的调控本发明蛋白的至少一种活性的物质。
本发明进一步包括经修饰含有本发明核酸分子的非人类转基因动物,或者经修饰含有突变的核酸分子从而可以阻止所编码的本发明多肽的表达的非人类转基因动物。
本发明还包括非人类转基因动物,这些动物中含有SEQ ID NO1,3,5,7或9的一部分或全长的基因的全部或一部分已经从所述动物的基因组中敲除或删除。
本发明进一步提供肝癌和其它癌症的诊断方法,包括步骤从受试者中获得组织,血液,尿或其它样品,以及检测本发明多肽或核酸分子的表达水平。
本发明进一步包括组合物,该组合物包含稀释剂和选自下列的蛋白或多肽含有SEQ ID NO2,4,6,8或10的氨基酸序列的分离多肽;含有SEQ ID NO2,4,6,8或10中至少10个氨基酸的片段的分离多肽;含有SEQ ID NO2或4的保守氨基酸替代的分离多肽;SEQID NO2或4的天然存在的氨基酸序列变体;分离的多肽,其氨基酸序列与SEQ ID NO2或4的氨基酸序列具有至少大约50%,60%,70%或75%的氨基酸序列同一性,优选至少大约80%,进一步优选至少大约90-95%,和最优选至少大约95-98%的序列同一性;以及与SEQID NO6,8或10具有至少大约95%氨基酸序列同一性的多肽。
附图的简要说明

图1图1是LBFL302——BC4变体(SEQ ID NO2)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图2图2是LBFL302——BC7变体(SEQ ID NO4)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图3图3是LBFL303——GE6克隆(SEQ ID NO6)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图4图4是LBFL303——MB5克隆(SEQ ID NO8)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
图5图5是LBFL303——IE4克隆(SEQ ID NO10)的开放读码框所编码蛋白的疏水图。分析是根据Kyte-Doolittle和Goldman等人的方法进行的。
本发明最优选的实施方式I.概述本发明部分地基于新基因家族(LBFL302和LBFL303)的鉴定,与肝炎或肝硬化患者的人类肝脏组织相比,所述基因家族在癌变人类肝脏组织和其它恶性肿瘤中差异表达。这些基因家族相应于SEQ ID NOS1和3的人类cDNA(LBFL302),和SEQ ID NOS5,7和9的人类cDNA(LBFL303)。
本发明的基因和蛋白可以用作诊断试剂或标记以检测肝癌,或者将样品中的肝癌和肝硬化组织进行区分。它们还可以作为那些可调控基因表达或活性的物质的靶标使用。例如,可以鉴定调控与肿瘤生长相关的生物过程的物质,所述生物过程包括肝癌的增生过程。
II.具体实施方式
A.与肝癌相关的蛋白本发明提供了分离的蛋白,所述蛋白的等位基因变体,和所述蛋白的保守氨基酸替代。如此处所述,“蛋白”或“多肽”部分地是指具有SEQ ID NO2,4,6,8或10所述的人类氨基酸序列的蛋白。这两个词也涉及天然存在的具有与上面特定提到的序列有细微不同的氨基酸序列的等位基因变体和蛋白。虽然等位基因变体具有与上面提到的序列细微不同的氨基酸序列,但是其仍具有相同或相似的与这些蛋白相关的生物功能。
如此处所述,涉及人类氨基酸序列SEQ ID NO2,4,6,8或10的蛋白家族是指已经从人类和生物体中分离出来的蛋白质。下面描述了鉴定和分离与这些蛋白有关的蛋白家族中其它成员的方法。
本发明的蛋白优选是分离形式。如此处所述,当利用物理,机械或化学方法将蛋白质从通常与该蛋白相关的细胞成分中分离出来后,所述蛋白可以说是分离的。本领域的普通技术人员可以很容易的利用标准的纯化方法得到分离的蛋白。
本发明的蛋白进一步包括SEQ ID NO2,4,6,8或10的插入,删除或保守氨基酸替代变体。如此处所述,保守变体是指没有不利地影响蛋白生物功能的氨基酸序列改变。当所述改变的序列阻止或破坏了所述蛋白相关的生物功能时,所述替代,插入或删除被认为不利地影响了该蛋白质。例如,在一定情况下蛋白的总电荷,结构或疏水/亲水特性可能有所改变但并没有不利地影响生物活性。因此,可以对氨基酸序列进行改变,例如赋予蛋白更多的疏水或亲水特性但又不会不利地影响该蛋白的生物活性。
通常,所述等位基因变体,保守替代变体,和LBFL302基因编码的蛋白家族成员将具有与SEQ ID NO2或4的序列保持至少大约50%,60%,70%或75%氨基酸序列同一性的氨基酸序列,更优选至少大约80%,进一步优选至少大约90-95%,和最优选至少大约99%或99.5%的序列同一性。进一步,LBFL303基因编码的蛋白家族的成员将具有与SEQ ID NO6,8或10的序列保持至少大约50%,60%,70%或75%氨基酸序列同一性的氨基酸序列,更优选至少大约80-90%,进一步优选至少大约91-94%,和最优选至少大约95%或98%的序列同一性。这些序列的同一性或同源性定义为,在将序列进行比对并引入缺口(如果必要)以达到最大百分比同源性后,候选序列中与SEQ ID NO2,4,6,8或10序列中相同的氨基酸残基的百分比,其中所述比对中不考虑将任何保守替代作为序列同一性的一部分(参考B部分中的相关参数)。融合蛋白,或对所述肽序列进行的N端,C端或内部延伸,删除,或插入不能被解释为影响同源性。
因此,本发明的蛋白包括具有SEQ ID NO2,4,6,8或10所示的氨基酸序列的分子;具有这些蛋白的至少大约3,4,5,6,10,15,20,25,30,35或更多氨基酸残基的连续序列的其片段;氨基酸序列变体,其中一个或多个氨基酸残基插入到所公开的编码序列的N端或C端或其中间;所述公开的序列的氨基酸序列变体,或如上所述的其片段,它们已经被至少一个残基所替换。这些片段,也称为肽或多肽,可能包含所述蛋白的抗原性区域,功能性区域,这些区域被确认为是与已知蛋白的功能域相对应的氨基酸序列的区域,也可以包含显著亲水的区域。这些区域通过使用常用的蛋白质序列分析软件可以很容易的进行确认,所述软件例如MacVector(Oxford Molecular)。
预见到的变体进一步包括那些含有预先确定的突变(例如通过同源重组,定点诱变或PCR诱变)的变体,以及其它动物品种(包括但不限于兔子,小鼠,大鼠,猪,牛,绵羊,马和非人灵长类动物)的相应蛋白,和所述蛋白家族的等位基因或其它天然存在的变体;以及衍生物,其中所述蛋白质通过用天然存在的氨基酸以外的部分(例如可探测的部分,如酶或放射性同位素)进行替换,化学修饰,酶促修饰和其它合适方法修饰而得到共价修饰。
本发明进一步提供了一种包含本发明的蛋白或多肽以及稀释剂的组合物。合适的稀释剂可以是水性或非水性溶剂或其组合,该稀释剂可以包含对所述蛋白或多肽的稳定性,溶解性,活性和/或储藏有益的额外组分,例如水溶性盐或甘油。
如下面所描述的,该蛋白家族的成员可以被(1)用于鉴定可以调控该蛋白的水平或至少一种活性的物质,(2)用于鉴定该蛋白的结合配偶体,(3)用作抗原来产生多克隆或单克隆抗体,(4)用作肝癌和其它增生疾病的治疗试剂或靶标和(5)用作肝癌和其它增生疾病的诊断试剂或标记。
B.核酸分子本发明进一步提供了编码具有SEQ ID NO2,4,6,8或10的蛋白和此处所述的相关蛋白的核酸,优选是分离形式。如此处所述,“核酸”被定义为编码上面所述蛋白或肽的RNA或DNA,或是编码所述此类肽的核酸序列的互补序列;在合适的严紧条件下与SEQ ID NO1,3,5,7或9的核酸进行杂交并且保持稳定结合于其上;编码与SEQ IDNO2或4的肽序列具有至少大约50%,60%,70%或75%,优选至少大约80%,进一步优选至少大约85%,和最优选至少大约90%,95%,98%,99%,99.5%或更高同一性的多肽,或者编码与SEQ ID NO6或8的肽序列具有至少大约50%,60%,70%或75%,优选至少大约80-90%,进一步优选至少大约91-92%,和最优选至少大约93%,95%,98%,99%或更高同一性的多肽;或与SEQ ID NO1或3的开放读码框具有至少50%,60%,70%或75%,优选至少大约80%,进一步优选至少大约85%,和更进一步优选至少大约90%,95%,98%,99%,99.5%或更高的核苷酸序列同一性,或与SEQ ID NO5,7或9的开放读码框具有至少50%,60%,70%或75%,优选至少大约80-90%,进一步优选至少大约91-92%,和更进一步优选至少大约93%,95%,98%,99%或更高的核苷酸序列同一性。
本发明进一步包括与SEQ ID NO1,3,5,7或9的互补序列进行特异杂交的分离的核酸分子,特别是与开放读码框进行特异杂交的分子。与SEQ ID NO1,3,5,7或9的互补序列进行特异杂交的核酸分子一般在严紧的杂交条件下进行这样的杂交。
特别涉及的是基因组DNA,cDNA,mRNA和反义分子,以及建立在可选择骨架上的或包括可选择碱基的核酸,无论其是天然来源还是人工合成的。然而,所述杂交或互补的核酸将被进一步确定为相对于已有技术中的核酸是新颖的和非显而易见的,包括那些编码本发明蛋白质的核酸、与其互补的核酸以及在合适的严紧条件下与其杂交的核酸。
核苷酸或氨基酸序列水平的同源性或同一性通过BLAST(基本局部比对检索工具)分析进行确定,所述分析使用经过修改以适应序列相似性搜索的程序blastp,blastn,blastx,tblastn和tblastx(Altschul等人.,(1997)Nucleic Acids Res 253389-3402,和Karlin等人.,(1990)Proc Natl Acad Sci USA 872264-2268,二者都完整引入作为参考)的算法。BLAST程序使用的方法首先考虑查询序列和数据库序列之间的相似片段(带有或不带有缺口),然后评价鉴定的所有匹配(match)的统计学显著性,最后仅仅把那些达到预先确定的显著性阈值的匹配相加。对于序列数据库相似性搜索的基本情况的讨论,可以参考Altschul等人,(1994)Nature Genetics 6119-129,这里将其完整引入作为参考。柱状图(Histogram),描述(descriptions),比对(alignments),预期值(expect)(也就是,报告与数据库序列匹配的统计学显著性阈值),阈值(cutoff),矩阵和过滤器(filter) (低复杂性)的搜索参数全部使用其缺省设置。blastp,blastx,tblastn,和tblastx所用的缺省记分矩阵是BLOSUM62矩阵(Henikoff等人.,(1992)Proc NatlAcad Sci USA 8910915-10919,全文引入作为参考),其被推荐用于那些长度超过85个核苷酸或氨基酸的查询序列。
对于blastn,记分矩阵由M(即,对匹配残基的奖励分值)与N(即,对错配残基的罚分)的比率来设定,其中M和N的缺省数值分别为5和-4。blastn的四个参数设定如下Q=10(裂口产生罚分);R=10(裂口延伸罚分);wink=1(在查询序列中每个winkth位置产生的字串命中值(hit));和gapw-16(设定窗口宽度,在该窗口中产生缺口比对)。等同的Blastp参数设置为Q=9;R=2;wink=1;和gapw=32。存在于10.0版的GCG包中的用于在序列之间进行比较的Bestfit使用了DNA参数GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分),而蛋白比较中的等同参数为GAP=88和LEN=2。
“严紧条件”如下(1)采用低离子强度和高温进行洗涤,例如,50℃下用0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,或(2)在杂交中采用甲酰胺之类的变性剂,例如42℃下的50%(vol/vol)甲酰胺和0.1%的牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/pH6.5的50mM磷酸钠和750mM NaCl,75mM柠檬酸钠。另外一个例子是42℃下在50%甲酰胺,5×SSC(0.75M NaCl,0.075M柠檬酸钠),50mM磷酸钠(pH6.8),0.1%焦磷酸钠盐,5×Denhardt’s溶液,声波处理的鲑精DNA(50μg/ml),0.1%SDS,和10%的硫酸葡聚糖中杂交,并在42℃下于0.2×SSC和0.1%SDS中洗涤。本领域的技术人员可以轻易地确定和改变合适的严紧条件以取得清晰的可探测的杂交信号。优选的分子是那些在上述条件下与SEQ ID NO1,3,5或7的互补序列杂交并编码功能性或全长蛋白的分子。进一步优选的杂交分子是那些在上述条件下与SEQ ID NO1,3,5,7或9的开放读码框的互补链进行杂交的分子。
如此处所述,当核酸分子与编码其它多肽的核酸分子污染物基本分开后,该核酸分子被认为是“分离的”。
本发明进一步提供了所公开的核酸分子的片段。如此处所述,核酸分子的片段是指编码序列或非编码序列的一个小部分。所述片段的大小由其使用目的来决定。例如,如果这个片段是用于编码蛋白的活性部分,则所述片段就需要足够长以编码蛋白的功能区域。举例来说,可以制备编码相应于预测的抗原性区域的肽的片段。如果所述片段是用作核酸探针或PCR引物,则片段长度应该使得在探测/引发中得到相对少数目的假阳性(参考H部分中的讨论)。
用作探针或聚合酶链式反应(PCR)的特异引物,或用来合成编码本发明蛋白的基因序列的本发明核酸分子的片段(即,合成的寡核苷酸)可以通过化学技术轻易地进行合成,例如Matteucci等人的亚磷酰胺方法((1981),J Am Chem Soc 1033185-3191),或使用自动合成的方法合成。另外,更大的DNA片段可以利用公知的技术简单地进行合成,例如首先合成一组定义基因中不同模块片段的寡核苷酸,然后将这些寡核苷酸连接在一起来产生完整的修饰基因。
本发明的核酸分子可以被进一步的修饰以包含用于诊断和探测目的的可检测标记。本领域中有很多公知的所述标记,可以很轻易地将其用于这里所述的编码分子中。适合的标记包括,但不限于,生物素标记,放射性标记或荧光标记的核苷酸等。本领域技术人员可以很轻易地利用任意一种此类标记得到本发明核酸分子的标记变体。
C.其它相关核酸分子的分离如上所描述的,具有SEQ ID NO1,3,5,7或9的核酸分子的鉴定和表征使本领域普通技术人员可以分离核酸分子,该核酸分子编码蛋白家族中除了上面所述序列的其它成员。进一步,本发明公开的核酸分子使本领域技术人员可以分离那些编码蛋白家族中除了具有SEQ IDNO2,4,6,8或10的蛋白的其它成员的核酸分子。
例如,本领域技术人员可以轻易地使用SEQ ID NO2,4,6,8或10的氨基酸序列制备抗体探针以筛选来自适当细胞的表达文库。通常,来自哺乳动物(如用纯化蛋白免疫的兔子,如下所述)的多克隆抗血清或者单克隆抗体可用于探测哺乳动物的cDNA或基因组表达文库,例如入gtll文库,以获得编码蛋白质家族其它成员的合适序列。克隆的cDNA序列可表达为一种融合蛋白,用其自身的控制序列直接进行表达,或者通过构建体进行表达,所述构建体使用适合于表达所述酶的特定宿主的控制序列。
可选择的,这里所提到的编码序列的一部分可以被合成并用作探针以从任何哺乳动物中得到编码该蛋白家族成员的DNA。制备包括大约18-20个核苷酸(编码大约6-7个氨基酸的片段)的低聚物,并将其用于筛选基因组DNA或cDNA文库以在严紧条件下或足以除去不必要的假阳性的严紧条件下得到杂交。
另外,可以制备寡核酸引物对以用于聚合酶链式反应(PCR)来选择性克隆编码核酸分子。使用了所述PCR引物的PCR变性/退火/延伸循环在本领域是公知的,并可以轻易地进行调整以用于分离其它的编码核酸分子。
编码该蛋白家族的其它成员的核酸分子也可以利用任何已有的计算方法在已有的基因组或其它序列信息中来获得,这些计算方法包括但不限于PSI-BLAST(Altschul等人,(1997)Nucleic Acids Res 253389-3402);PHI-BLAST(Zhang等人,(1998)Nucleic Acids Res 263986-3990),3D-PSSM(Kelly等人,(2000)J Mol Biol 299(2)499-520);和其它计算分析方法(Shi等人,(1999)Biochem BiophysRes Commun 262(1)132-138和Matsunami等人,(2000)Nature404(6778)601-604)。
D.包含核酸分子的rDNA分子本发明进一步提供包含了编码序列的重组DNA分子(rDNAs)。如此处所用,rDNA分子是进行了分子原位操作的DNA分子。生产rDNA分子的方法在本领域是公知的,例如,参考Sambrook等人,MolecularCloning-A Laboratory Manual,第三版.,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,2001。在优选的rDNA分子中,编码DNA序列是与表达控制序列和/或载体序列可操作地连接在一起的。
如同本领域所公知的,可操作地连接于本发明蛋白家族的一种编码序列的载体和/或表达控制序列的选择直接依赖于所需的功能特性,例如蛋白表达,还依赖于转化的宿主细胞。本发明预期的载体至少可以指导rDNA分子中结构基因的复制或使其插入到宿主染色体中,优选还可以指导表达。
用于调整可操作性连接的蛋白编码序列的表达控制元件在本领域是公知的,包括但不限于,诱导型启动子,组成型启动子,分泌信号,和其它调控元件。优选,诱导型启动子是可以轻易控制的,例如响应于宿主细胞培养基中的营养物。
在一个实施方案中,包含编码核酸分子的载体将包括原核复制子,即,能在原核宿主细胞中指导重组DNA分子的自主复制并使其保持在染色体外,所述宿主细胞例如为用所述重组DNA分子转化的细菌宿主细胞。所述复制子在本领域是公知的。另外,包含原核复制子的载体还可以包括一种基因,所述基因的表达可以提供可探测标记例如抗药性。典型的细菌抗药性基因是那些提供了氨苄青霉素,卡那霉素,氯霉素或四环素抗性的基因。
包括原核复制子的载体还可进一步包括可以指导编码基因序列在细菌宿主细胞中表达(转录和翻译)的原核或噬菌体启动子,所述细菌例如为大肠杆菌。启动子是DNA序列形成的表达控制元件,其可以允许结合RNA聚合酶并可以引发转录过程。与细菌宿主兼容的启动子序列一般提供于质粒载体中,所述质粒载体包含方便的限制性酶切位点以插入本发明的DNA片段。典型的所述质粒载体是来自BioRad实验室(Richmond,CA)的pUC8,pUC9,pBR322和pBR329,来自Pharmacia(Piscataway,NJ)的pPL和pKK223。
与真核细胞兼容的表达载体,优选那些与脊椎动物细胞(例如肝细胞)兼容的载体也可以用于形成包含编码序列的rDNA分子。真核细胞表达载体,包括病毒载体,是本领域所公知的并可以利用多种商业途径获得。通常,所述载体是以包含方便的限制性酶切位点以插入所需DNA片段的形式提供的。典型的所述载体是pSVL和pKSV-10(Pharmacia),pBPV-1/pML2d(International Biotechnologies,Inc.),pTDT1(ATCC,#31255),和这里所描述的pCDM8载体,以及类似真核表达载体。如果需要,所述载体可以被修饰成包含肝细胞特异的启动子。
用于构建本发明的rDNA分子的真核细胞表达载体进一步可以包括在真核细胞中有效的选择性标记,优选抗药性选择标记。优选的抗药性标记是可以导致新霉素抗性的基因,即,新霉素磷酸转移酶(neo)基因。(Southern等人,(1982)J Mol Anal Genet 1327-341)。可选择的,所述选择性标记可以位于其它质粒上,通过宿主细胞的共转染而引入两种载体,并通过在所述选择性标记的适当药物中培养来进行选择。
E.包含外源提供的编码核酸分子的宿主细胞本发明进一步提供了被编码本发明蛋白的核酸分子转化的宿主细胞。所述宿主细胞可以是原核的或真核的。用于表达本发明蛋白的真核细胞是没有限制的,只要所述细胞系与细胞培养方法兼容并与表达载体的增殖和基因产物的表达兼容。优选的真核宿主细胞包括,但不限于,酵母,昆虫和哺乳动物细胞,优选脊椎动物细胞例如那些来自小鼠,大鼠,猴子或人类的细胞系。优选的真核宿主细胞包括来自ATCC的编号为CCL61的中国仓鼠卵巢(CHO)细胞,来自ATCC的编号为CRL 1658的NIH瑞士小鼠胚胎细胞(NIH/3T3),幼仓鼠肾细胞(BHK),以及类似真核组织培养细胞系。
任何原核宿主都可以用来表达编码本发明蛋白的rDNA分子。优选的原核宿主是大肠杆菌。
用本发明rDNA分子对适当宿主细胞的转化可以利用公知的方法来完成,所述方法一般依赖于使用的载体和所用的宿主系统类型。对于原核宿主细胞的转化,可以典型地利用电穿孔和盐处理方法(参考,例如,Cohen等人,(1972)Proc Natl Acad Sci USA 69211O;和Sambrook等人,同上)。对于用包含rDNAs的载体对脊椎动物细胞的转化,可以典型地利用电穿孔,阳离子脂质或盐处理方法(参考,例如,Graham等人,(1973)Virol 52456;Wigler等人,(1979)Proc Natl Acad SciUSA 76;1373-1376)。
成功转化的细胞,即,包含本发明rDNA分子的细胞,其可以利用公知的技术来获得,包括对选择性标记的选择。例如,通过引入本发明的rDNA得到的细胞可以进行克隆以产生单个菌落。由那些菌落得到的细胞可以收获,裂解,而且它们的DNA成分可以利用如Southern或Berent等人描述的方法检测以确定是否存在该rDNA,该方法参考Southern,(1975)J Mol Biol 98503或Berent等人,(1985)Biotech3208,或者将从该细胞得到的蛋白利用免疫学方法进行检验。
F.使用rDNA分子生产重组蛋白本发明进一步提供使用这里所描述的核酸分子来生产本发明蛋白的方法。简而言之,重组形式的蛋白的生产一般包括以下步骤第一,得到编码本发明蛋白的核酸分子,例如包含下列,基本由下列组成或由下列组成的核酸分子SEQ ID NO1或SEQ ID NO3;SEQ ID NO1的核苷酸155-421或155-418;SEQ ID NO3的核苷酸139-405或139-402;SEQ ID NO5,SEQ ID NO7或SEQ ID NO9;SEQ ID NO5的核苷酸32-1387或32-1384;SEQ ID NO7的41-1504或41-1501;或者SEQ ID NO9的核苷酸31-1554或31-1551。如果所述编码序列是被内含子所打断的,就如同这些开放读码框,则其适于直接在任意的宿主中进行表达。
所述核酸分子然后优选与适当的控制序列进行可操作的连接,如上面所述的,以形成包含该蛋白开放读码框的表达单元。所述表达单元用于转化适当的宿主,而所述转化的宿主是在允许重组蛋白产生的条件下进行培养的。可选择地,所述重组蛋白从细胞或培养基中分离出来;在可以容忍一些杂质的情况下,蛋白的回收和纯化不是必需的。
前面的每一个步骤都可以使用多种方法进行。例如,可以从基因组片段得到所需的编码序列并直接用于适当的宿主。在多种细胞中可操作的表达载体的构建通过是利用如上面所述的适当复制子和控制序列完成。控制序列,表达载体,和转化方法依赖于用于表达所述基因的宿主细胞类型,其将在下面进行详细的描述。合适的限制性酶切位点(如果不是通常可获得的)可以添加到编码序列的末端以提供可切除的基因来插入到这些载体中。本领域技术人员可以利用现有技术轻易地调整任意已知的宿主/表达系统以适于本发明核酸分子的使用从而产生重组蛋白。
G.鉴定结合配偶体的方法本发明的另外一个实施方案提供了分离和鉴定本发明蛋白的结合配偶体的方法。一般而言,将本发明的蛋白与潜在结合配偶体或细胞的提取物或级分在允许本发明蛋白和潜在结合配偶体结合的条件下混合在一起。混合后,将已经与本发明蛋白结合的肽,多肽,蛋白或其它分子从该混合物中分离出来。与本发明蛋白结合的配偶体然后可以被移出并进而进行分析。为了鉴定和分离所述结合配偶体,可以使用完整的蛋白,例如包含SEQ ID NO2,4,6,8或10的完整氨基酸序列的蛋白。可选择的,也可以使用所述蛋白的片段。
如此处所述,细胞提取物是指从裂解或破碎的细胞中得到的制备物或级分。优选的细胞提取物来源是来自人类的肝脏肿瘤细胞或转化的肝脏细胞,例如,肝癌的活组织切片组织或组织培养细胞。可选择的,可以利用正常的组织或已有的细胞系来制备细胞提取物,尤其是采用来自肝脏的细胞系。
可以使用多种方法得到细胞的提取物。可以利用物理或化学的破碎方法来破碎细胞。物理破碎方法的例子包括,但不限于,声波处理和机械剪切。化学裂解方法的例子包括,但不限于,去污剂裂解和酶裂解。本领域普通技术人员可以轻易地对所述制备细胞提取物的方法进行调整以得到本发明方法所需的提取物。
一旦得到细胞的提取物,就将其在可以发生蛋白和结合配偶体结合的条件下与本发明的蛋白混合在一起。可以使用的条件有很多种,最优选该条件与人类细胞质中的条件非常相似。所用细胞提取物的特征,例如同渗容摩,pH,温度和浓度,都可以进行调整以优化蛋白与结合配偶体的结合。
在适当的条件下进行混合后,将结合复合物从混合物中分离。多种方法都可以用来分离所述混合物。例如,可以用本发明蛋白的特异抗体来免疫沉淀结合配偶体复合物。可选择的,可以使用标准的化学分离方法,例如色谱和密度/沉降离心方法。
在除去了提取物中没有结合的细胞组分后,可以利用常规的方法使结合配偶体从复合物上解离下来。例如,所述解离可以通过改变混合物的盐浓度或pH值来实现。
为了利于从混合的提取物中分离结合的结合配偶体对,可以将本发明的蛋白固定到固相载体上。例如,可以将所述蛋白附着到硝酸纤维素基质上或丙烯酸珠子上。将所述蛋白连接到固相载体上有利于从提取物的其它组分中分离肽/结合配偶体对。鉴定的结合配偶体可以是一种蛋白也可以是两种或多种蛋白组成的复合物。可选择的,所述结合配偶体可以使用Takayama或者Sauder等人描述的Far-Western检测方法或者使用表位标记的蛋白或GST融合蛋白来鉴定,参考Takayama等人,(1997)Methods Mol Biol 69171-184或者Sauder等人,(1996)J GenVirol 77991-996。
可选择的,本发明的核酸分子可以在酵母双杂交系统中或其它体内蛋白-蛋白检测系统使用。酵母双杂交系统已用来鉴定其它蛋白配偶体对,并且可以轻易地进行改变以使用这里所描述的核酸分子。
H.可调控编码肝癌相关基因的核酸表达的物质的鉴定方法本发明的另一个实施方案提供了调控核酸表达的物质的鉴定方法,其中所述核酸编码本发明的蛋白例如具有SEQ ID NO2,4,6,8或10的氨基酸序列的蛋白。所述检测方法可以使用任何已有的方法监控本发明核酸分子表达水平的改变。如此处所述,当一种物质增量或减量调节细胞中核酸的表达时,该物质被认为可以调控本发明核酸分子的表达。
在一种测试方法中,可以制备含有报告基因融合体的细胞系,所述报告基因融合体在下列核苷酸和任何可检测的融合配偶体之间形成由SEQ ID NO1的核苷酸155-421、SEQ ID NO3的核苷酸139-405、SEQ ID NO5的核苷酸32-1387、SEQ ID NO7的核苷酸41-1504、或SEQ ID NO9的核苷酸31-1554所定义的开放读码框和/或5’和/或3’调控元件。已知的可检测融合配偶体有很多并且很容易得到,包括萤火虫的荧光素酶和编码氯霉素乙酰转移酶的基因(Alam等人,(1990)AnalBiochem 188245-254)。然后将包括报告基因融合体的细胞系在适当的条件和时间暴露于待测物质。通过暴露于所述物质的样品和对照样品之间报告基因的差异表达,可以鉴定调控本发明核酸表达的物质。
另外一种测试方法可以用来监控所述物质调控编码本发明蛋白的核酸表达的能力,所述蛋白例如为具有SEQ ID NO2,4,6,8或10的蛋白。举例来说,mRNA的表达可以通过与本发明核酸的杂交来进行直接检测。将细胞系在适当条件和时间暴露于待测物质,总RNA或mRNA是通过如Sambrook等人所述的标准方法进行分离的,参考Sambrook等人,Molecular Cloning-A Laboratory Manual,第三版,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001。
优选的细胞是那些来自人类肝脏组织的细胞,举例来说,来自肝癌或肝癌并发肝硬化,或肝癌并发肝炎患者的用于肝脏活组织检查的组织或培养的细胞。可以使用的细胞系例如为ATCC编号为Nos.HB-8064,HB-8065或CRL-10741的肝细胞癌细胞系。
用于检测暴露于所述物质的细胞和对照细胞之间RNA表达水平差异的探针可以利用本发明的核酸进行制备。优选地,但不是必须地,设计仅在高严紧条件下与目标核酸进行杂交的探针。在高严紧条件下仅形成高度互补核酸杂交体。因此,检测条件的严紧程度决定了为了形成杂交体而在两条核酸链之间应该存在的互补性的数量。应该选择所述严紧性从而可以使探针目标杂交体和探针非目标杂交体之间的稳定性差异最大化。
可以利用本领域公知的方法从本发明的核酸来设计探针。例如,探针中G+C的含量和探针长度可以影响该探针结合到其目标序列的能力。探针特异性的优化方法通常是已有的,参考Sambrook等人,同上,或Ausubel等人,Short Protocols in Molecular Biology,第四版,John Wiley&Sons,Inc.,New York,1999。
杂交条件可以利用已有方法进行改进,例如那些Sambrook等人和Ausubel等人描述的适合于每一探针的方法。可以利用任何已有的方法进行总细胞RNA或polyA RNA富集的RNA的杂交。例如,可以将总细胞RNA或polyA RNA富集的RNA附着到固相载体上,在探针可以进行特异性杂交的条件下,所述固相载体暴露于至少一种所述探针,所述探针包含至少一种本发明序列或本发明序列的一部分。可选择的,包含至少一种本发明序列或本发明序列的一部分的核酸片段可以附着到固相载体上,例如硅片,多孔玻璃胶片或膜。然后在所述附着序列可以特异杂交的条件下将所述固相载体暴露于来自样品的细胞RNA或polyA RNA。所述固相载体和杂交方法是广泛可获得的,例如,那些由Beattie所公开的,参考(1995)WO 95/11755。通过检查给定的探针与来自未处理细胞群和来自暴露于所述物质的细胞群的RNA样品特异性杂交的能力,鉴定了可以增量或减量调节核酸表达的物质,所述核酸编码具有SEQ ID NO2,4,6,8或10的蛋白。
为了对mRNA进行定量或定性分析,杂交也可以利用RNaseProtection Assay来实现(即RPA,参考Ma等人,(1996)Methods10273-238)。简要的说,包含编码所述基因产物的cDNA和DNA依赖性的噬菌体特异性RNA聚合酶启动子(例如T7、T3或SP6 RNA聚合酶)的表达载体在所述cDNA分子的3’末端(噬菌体启动子的下游)线性化,其中所述线性化分子随后作为模板通过体外转录合成标记的cDNA的反义转录本。然后将所述标记的转录本与分离的RNA混合物(即,全部或分级的mRNA)通过45℃的过夜孵育进行杂交,缓冲液包含80%甲酰胺,40mM Pipes,pH6.4,0.4M NaCl和1mM EDTA。然后将得到的杂交体在包含40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中进行消化。钝化和提取外源蛋白后,将所述样品放在尿素/聚丙烯酰胺胶上进行分析。
在另外一种检测方法中,为了得到影响本发明基因产品表达的物质,首先鉴定生理上表达本发明基因产品的细胞或细胞系。如此鉴定的细胞和/或细胞系预期应该包含必要的细胞机制,使得当与具有合适表面传导机制和/或胞质溶胶级联传导的物质外源接触时,转录装置的调控精度得以保持。进一步,这些细胞或细胞系将用表达载体(例如,质粒或病毒载体)构建体进行转导或转染,该构建体包含可操作的编码本发明基因产物的结构基因的非翻译5’末端(含有启动子),所述5’末端与一种或多种抗原性片段融合,所述抗原性片段对于本发明基因产物来说是独特的,其中所述片段处于所述启动子的转录控制下并将被表达为多肽,所述多肽的分子量与天然存在的多肽相比是可以区别的,或者所述抗原性片段可能进一步包括免疫学上不同的标签或其它可探测标记。所述方法在本领域是公知的(参考Sambrook等人,同上)。
按上述方案进行转导或转染的细胞或细胞系随后在适当条件下与物质进行接触。例如,将药物可接受赋形剂中的该物质在含水生理缓冲溶液中与细胞接触,所述缓冲液例如为在37℃下孵育的生理pH的磷酸缓冲液(PBS),生理pH的Eagles平衡盐溶液(BSS),包含血清的PBS或BSS,或包含PBS或BSS和/或血清的条件培养基。所述条件可以由本领域技术人员根据需要进行调节。所述物质与细胞接触后,对所述细胞进行破碎并对裂解产物中的多肽进行分级,从而手机所述多肽级分,并与抗体接触以进一步进行免疫学检测(例如,ELISA,免疫沉淀反应或Western blot)。从“物质-结合”的样品中分离的蛋白级分将与对照样品进行比较(在对比样品中仅仅使赋形剂与细胞接触),与对比样品相比,“物质-结合”的样品中免疫学产生的信号的增加或减少将用于确定所述物质的功效。
H.调控肝癌相关蛋白的水平或至少一种活性的物质的鉴定方法本发明的另一个实施方案提供了鉴定调控本发明蛋白的水平或至少一种活性的物质的方法,所述蛋白例如为具有SEQ ID NO2,4,6,8或10的氨基酸序列的蛋白。所述方法或检验法可以使用用于监控或探测所需活性的任意方法。
在一种方法中,可以检验暴露于待测物质的细胞群体和未暴露的对照细胞群体之间的蛋白质相对数量。在所述方法中,可以使用特异性抗体之类的探针监控不同细胞群体中蛋白的差异表达。在适当的条件和时间下将细胞系或细胞群体暴露于待测物质。可以从暴露的细胞系或细胞群体和作为对照的未暴露的细胞系或细胞群体得到细胞裂解物。然后利用探针对细胞裂解物进行分析。
可以通过适当的免疫方案来免疫适当的哺乳动物宿主从而制备抗体探针,所述免疫利用了本发明的肽,多肽或蛋白,如果它们有足够长度的话,或者,如果需要的话,或如果需要提高免疫原性,应将其缀合于合适的载体上。连接于例如BSA,KLH或其它载体蛋白从而制备免疫原性缀合物的方法是本领域所公知的。在某些情况下,采用直接缀合,例如,采用碳二亚胺试剂可以是有效的;在其它情况下,可能需要用连接试剂例如那些由Pierce Chemical Co.(罗克福德,伊利诺斯州)提供的,来提供对半抗原的可接近性。半抗原肽可以用半胱氨酸残基在羧基末端或氨基末端进行延伸,或者利用半胱氨酸进行点缀,例如可以有利于与载体的连接。通常在适当的时间段并使用适当的佐剂来进行免疫原的施用,这是本领域已知的。在免疫过程中,获取抗体的滴定度来确定抗体形成是否足够。
虽然利用所述方法得到的多克隆抗血清可以满足一部分应用,但是对于药物组合物,优选使用单克隆制剂。如众所周知的,分泌所需单克隆抗体的永生化细胞系可以利用Kohler和Milstein的标准方法((1975)Nature 256495-497)或者能够实现淋巴细胞或脾细胞永生化的其改进方法来进行制备。分泌所需抗体的所述永生化细胞系利用免疫测定进行筛选,其中抗原是肽半抗原,多肽或蛋白。当鉴定了分泌所需抗体的适当永生化细胞培养物后,所述细胞可以在体外进行培养或在腹水中生产。
然后将所需的单克隆抗体从培养物的上清或从腹水的上清回收。含有免疫学显著的(抗原结合)部分的单克隆抗体或多克隆抗血清的片段,以及完整的抗体可以被用作拮抗剂。使用免疫反应性(抗原结合)抗体片段,例如Fab,Fab’,或F(ab’)2片段经常是优选的,特别是在治疗中,因为这些片段一般比整个免疫球蛋白更不具有免疫原性。
也可以利用现有技术通过重组的方法来制备抗体或抗原结合型片段。特异性结合到蛋白所需区域的抗体区域也可以以多物种来源的嵌合体形式进行制备,例如人源化抗体。
利用上述方法检测的物质可以进行随机选择或理性选择和设计。如此处所述,当不考虑特定序列而随即选取某物质时,该物质被认为是随即选择的,其中所述特定序列参与于本发明蛋白的单独结合或联合其底物、结合配偶体等与本发明蛋白结合。随机选择物质的一个例子是使用化学文库或肽组合文库,或生物的生长培养物。
如这里所使用的,当考虑靶位点的序列和/或与物质的作用相关的构象从而在非随机的基础上选取该物质时,所述物质被认为是理性选择或设计的。利用形成这些位点的肽序列可以对物质进行理性选择或设计。例如,理性选择的肽物质是这样一种多肽,其氨基酸序列与任一多功能性一致位点是相同的或是其衍生物。
本发明的物质可以是,例如,肽,小分子,维生素衍生物,和糖类。显性阴性蛋白,编码这些蛋白的DNA,这些蛋白的抗体,这些蛋白的肽片段或这些蛋白的模拟体可以引入到细胞中来实现功能。这里所用的“模拟体”是指对肽分子的一个或几个区域的修饰从而提供化学上与其亲本肽不同但在拓扑图形学和功能上与其亲本肽相似的结构(参考GrantMolecular Biology and Biotechnology,Meyers,编写,659-664页,VCH出版有限公司,纽约,1995)。本领域普通技术人员可以轻易地认识到,这里对于本发明中物质的结构性质没有限制。
本发明的肽物质可以利用本领域公知的标准固相(或液相)肽合成方法进行制备。另外,编码这些肽的DNA可以采用商业上可得的寡核酸合成设备来进行合成,并利用标准的重组生产系统进行重组生产。如果包括非基因编码的氨基酸,那么就必须使用固相肽合成来进行生产。
本发明的另一类物质是可以与本发明蛋白的关键位点发生免疫反应的抗体。所述抗体物质是通过利用具有肽免疫适当的哺乳动物受试者来获得的,所述肽含有预定被所述抗体所靶向的所述蛋白的那些部分作为抗原性区域。
J.调控肝癌相关蛋白的表达或至少一种活性的物质的应用如实施例中所提供的,本发明的蛋白和核酸,例如具有氨基酸序列SEQ ID NO2,4,6,8或10的蛋白,在癌变肝脏组织中差异表达。增量或减量调节或调控所述蛋白的表达或所述蛋白的至少一种活性的物质,例如激动剂或拮抗剂,可以用来调控与所述蛋白功能和活性有关的生物学和病理学过程。
如此处所述,受试者可以是任何哺乳动物,只要所述哺乳动物需要调控由本发明蛋白介导的病理学或生物学过程。术语“哺乳动物”是指属于哺乳动物纲的个体。本发明特别适用于治疗人类受试者。
病理学过程是指一类产生有害作用的生物学过程。例如,本发明蛋白的表达可能与肝细胞的繁殖或增生有关。如此处所述,当某物质减轻病理学过程的程度或严重性时,所述物质被认为调控该病理学过程。举例说明,通过施用可以以某种方式增量或减量调节或调控本发明蛋白的表达或至少一种活性的物质,从而防止肝癌或调控疾病进展。
本发明的物质可以被单独提供,或者可以与其它调控特定病理学过程的物质联合使用。例如,本发明的物质可以与其它已知的药物联合施用。如此处所述,当两种物质同时施用或以所述物质可以同时起作用的方式独立施用时,该两种物质被认为是联合施用的。
本发明的物质可以通过肠胃外的,皮下的,静脉内的,肌肉的,腹膜内的,透皮的,或口腔的途径施用。替代性的,或同时的,可以通过口服来施用。施用的剂量是由接受者的年龄,健康状况和体重,共同治疗的类型(如果有的话),治疗的频率,和需要达到的效果性质来决定的。
本发明进一步提供了组合物,该组合物含有一种或多种可以调控本发明蛋白的至少一种活性或其表达的物质。由于个体需要的差异,本领域普通技术人员可以确定每种成分有效量的最优化范围。典型的剂量包含0.1至100μg/kg体重。优选的剂量包含0.1至10μg/kg体重。最优选的剂量包含0.1至1μg/kg体重。
除了药理活性物质外,本发明的组合物还可以包含适当的药物可接受载体以递送至作用位点,所述载体包含有利于将活性成分加工成药学可利用的制剂的赋形剂和辅剂。肠胃外施用的适当配剂包括水溶形式活性化合物的水溶液,例如,水溶性盐。另外,可以施用活性化合物的悬浮物,例如合适的油性注射悬浮液。适当的亲脂溶剂或介质包括脂肪油,例如,芝麻油,或合成脂肪酸酯,例如,油酸乙酯或甘油三酯。水性注射悬浮液可以包含提高悬浮液粘度的物质,其包括,例如,羧甲基纤维素钠,山梨糖醇,和/或葡聚糖。可选的,悬浮液还可以包含稳定剂。也可以利用脂质体将所述物质包囊化从而将其运送到细胞内。
按照本发明进行系统施用的药物配剂可以配制成用于肠内,肠胃外或局部施用。实际上,这三种制剂形式可以同时使用以获得活性组份的系统施用。
进行口服的适当制剂包括硬质或软质明胶胶囊,丸剂,片剂,包括包衣片剂,酏剂,悬浮液,糖浆或吸入剂及其控释形式。
在本发明方法的实施中,可以将本发明的化合物单独使用或联合使用,或与其它的治疗剂或诊断剂联合使用。在优选的实施方案中,本发明的化合物可以与其它一般适用于这些病症的化合物按照一般可接受的医学实践联合施用。本发明的混合物可以在体内使用,一般在哺乳动物中,例如人类,绵羊,马,牛,猪,狗,猫,大鼠和小鼠,或者在体外使用。
K.转基因动物本发明还包括含有突变、敲除或修饰基因的转基因动物,所述基因相应于SEQ ID NO1,3,5,7或9的cDNA序列,或者编码多肽序列SEQ ID NO2,4,6,8或10或其具有至少大约3,4,5,6,10,15,20,25,30,35或更多氨基酸残基的连续序列的片段的开放读码框。转基因动物是经过基因修饰的动物,其中转入了重组的,外源的或克隆的基因材料。所述基因材料通常被称为“转基因”。所述转基因的核苷酸序列(在本案中为SEQ ID NO1,3,5,7或9的形式)被整合入通常没有该特定核苷酸序列的基因组座位,或该转基因的正常基因座位。所述转基因可以由来自同一物种的基因组或来自目标动物之外的其它物种基因组的核酸序列组成。
在一些实施方案中,可以构建这样的转基因动物,在这些动物体中删除了包含SEQ ID NO1,3,5,7或9的基因的全部或一部分。在相应于SEQ ID NO1,3,5,7或9相基因包含了一个或多个内含子的那些情况下,可以删除整个基因——所有的外显子,内含子和调控序列——。可以选择的,删除的部分也可以小于整个基因。例如,只是删除了一个外显子和/或内含子,从而产生表达本发明蛋白的修饰版本的动物。
术语“生殖细胞系转基因动物”是指一种转基因动物,在其生殖系细胞中引入了遗传改变或遗传信息,因此使所述转基因动物能够将该遗传信息传递给后代。如果所述后代实际具有了所述改变或遗传信息的一些或全部,则它们也是转基因动物。
所述改变或遗传信息对受体所属的动物物种来说可以是外来的,只对该特定受体个体来说是外来的,或可能是该受体已经具有的遗传信息。在最后一种情况下,改变或引入的基因的表达可能不同于其天然基因。
转基因动物可以通过不同的方法进行制备,包括转染,电穿孔,显微注射,对胚胎干细胞的基因靶向和重组病毒和逆转录病毒的感染(参考,例如,美国专利No.4,736,866;美国专利No.5,602,307;Mullins等人,(1993)Hypertension 22630-633;Brenin等人,(1997)Surg Oncol 699-110;Recombinant Gene Expression Protocols(Methods In Molecular Biology,Vol.62),Tuan,编辑,Humana Press,Totowa,NJ,1997)。
已经制备了很多重组的或转基因的小鼠,其中包括那些表达激活的致癌基因的小鼠(美国专利No.4,736,866);表达猿SV40 T-抗原的小鼠(美国专利No.5,728,915);缺少干扰素调节因子1(IRF-1)表达的小鼠(美国专利No.5,731,490);表现出多巴胺能功能紊乱的小鼠(美国专利No.5,723,719);表达至少一种参与血压控制的人类基因的小鼠(美国专利No.5,731,489);与自然存在的Alzheimer病的症状表现出极大相似度的小鼠(美国专利No.5,720,936);介导细胞粘附的能力降低的小鼠(美国专利No.5,602,307);具有牛生长激素基因的小鼠(Clutter等人,(1996)Genetics 1431753-1760);或者,可以产生全部人类抗体响应的小鼠(McCarthy(1997)Lancet349405)。
虽然小鼠和大鼠可以作为大多数转基因试验的选择,但在有些情况下优选或必须使用其它品种的动物。转基因方法已经成功的在很多非鼠类动物中进行,包括绵羊,山羊,猪,狗,猫,猴子,黑猩猩,仓鼠,兔子,牛和豚猪(参考,例如,Kim等人,(1997)Mol Reprod Dev46515-526;Houdebine,(1995)Reprod Nutr Dev 35609-617;Petters,(1994)Reprod Fertil Dev 6643-645;Schnieke等人,(1997)Science2782130-2133;和Amoah,(1997)J Animal Science 75578-585)。
可以通过任意有利于共转化多个核酸分子的方法将核酸片段引入到具有重组能力的哺乳动物细胞中。产生转基因动物的具体方法对本领域普通技术人员来说是公知的,其中包括美国专利No.5,489,743和美国专利No.5,602,307中所公开的。
L.诊断方法与非癌变的组织相比,本发明的基因和蛋白在癌变的肝脏组织(HCC)和其它癌症中差异表达,因此本发明的基因和蛋白可以用来诊断或监控肝癌或其它恶性肿瘤,追踪疾病的发展,或者区分HCC组织和肝硬化组织样品。使用本发明的核酸分子或蛋白诊断肝癌的一种方法包括从活体受试者中得到组织,所述组织包括肝脏组织。
分子生物学工具已经成为了常见的法医学技术。例如,包含SEQ IDNO1,SEQ ID NO3,SEQ ID NO5,SEQ ID NO7或SEQ ID NO9的全长或至少一部分序列的核酸探针可以用来确定核酸分子在法医学/病理学标本中的表达。进一步,核酸检测可以通过转录图谱分析的任意方法来实施。除了核酸分析,本发明的法医学方法可以指向本发明的蛋白,尤其是含有SEQ ID NO2,4,6,8或10的蛋白,从而确定所述基因的增量或减量调节。(Shiverick等人,(1975)Biochim BiophysActa 393124-133)。
本发明的方法可以包括用胶原酶或其它蛋白酶处理组织,从而使所述组织易于进行细胞裂解(Semenov等人,(1987)Biull Eksp BiolMed 104113-116)。进一步,可以从肝脏的不同区域得到活组织切片检查样品以进行分析。
探测本发明核酸或蛋白分子的检测法可以是任何可用的形式。核酸分子的典型检测法包括杂交或基于PCR的形式。检测本发明的蛋白,多肽或肽的典型检测法包括在任何可用的形式中使用抗体,可用的形式例如为原位结合检测法等(参考,Harlow&Lane,Antibodies-ALaboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1988)。在优选的实施方案中,所述检测是在适当的对照存在下进行的。
以上方法也可以用于其它的诊断方案,包括检测其它组织或器官中疾病情况的方案和方法,例如在探测到本发明核酸分子的表达的组织中进行。
无需进一步的说明,相信本领域的普通技术人员通过前面的描述和接下来的示例性实施例可以制造和使用本发明的化合物并实施所公开的方法。因此接下来的工作实施例具体的指出了本发明的优选实施方案,但是不能被认为是对公开内容的任何限制。
实施例实施例la鉴定肝细胞癌中差异表达的LBFL302mRNA将10个韩国患者分成两组,每组5个患者,并从其身上取得患者组织样品。一组的患者被诊断为具有慢性病毒性乙型肝炎(CH)并随后发展为肝癌(HCC)。这组患者为三男两女,年龄范围是34-63岁。第二组患者被诊断具有肝硬化(LC)。这些人随后也发展成为肝癌(HCC)。这组为四男一女,患者年龄范围是40-62岁。对于每一个患者,都从其肝脏的两个区域取得组织以产生一套活组织解剖样品。在第一患者组中(癌症/肝炎),样品取自肝脏肿瘤和含有发炎组织(肝炎引起的发炎)的周围非癌变区域。在第二组中(癌症/肝硬化),肝脏组织取自肿瘤和含有纤维化组织(肝硬化引起的纤维化区域)的周围非癌变区域。对该组织样品的每一个进行组织学分析,并将样品分为非癌变组或癌变组。
样品制备方法按照Affymetrix GeneChip Expression AnalysisManual进行,但稍加改变。首先使用Spex Certiprep 6800 Freezer Mill将冷冻组织碾碎成粉末。然后利用Trizol(Life Technologies)提取总RNA。每个样品(平均组织重300mg)产生200-500μg的总RNA。接下来,利用0ligotex mRNA Midi试剂盒(Qiagen)分离mRNA。由于mRNA稀释于终体积400μl中,因此需要进行乙醇沉淀步骤从而使其浓度达到1μg/μl。使用1-5μg的mRNA采用SuperScript Choice系统得到双链cDNA。第一链cDNA的合成用T7-(dT24)寡核苷酸引发。cDNA然后进行苯酚-氯仿提取并进行乙醇沉淀得到1μg/μl的终浓度。
按照标准的步骤从2μg的cDNA合成cRNA。为了对cRNA进行生物素标记,将核苷酸Bio-11-CTP和Bio-16-UTP(Enzo Diagnostics)加入反应体系中。在37℃孵育6小时后,按照Rneasy Mini试剂盒方案(Qiagen)清洗标记的cRNA。然后将cRNA在94℃片段化(5×片段化缓冲液200mM Tris-乙酸盐(pH8.1),500mM KOAc,150mM MgOAc)35分钟。
将55μg片段化的cRNA与Affymetrix Human Genome U95和U133阵列进行杂交24小时,杂交箱的设定为45℃和60rpm。在Affymetrix流体平台中清洗芯片并利用Streptavidin Phycoerythrin(SAPE)(Molecular Probes)进行染色。为了增强染色,两次添加SAPE溶液,并在两次添加间进行抗-链霉亲和素生物素化抗体染色步骤。与探针阵列的杂交用荧光测定扫描法进行检测(Hewlett Packard Gene ArrayScanner)。在杂交和扫描后,对微排列图像进行分析以进行质量控制,寻找主要的芯片缺陷和杂交信号中的异常。在所有的芯片通过了QC后,对数据进行分析,其中对于U95使用Affymetrix Microarray Suite(v4.0)和LIMS(v1.5),对于U133使用Affymetrix Microarray Suite(v5.0)和LIMS(v3.0)。
采用下述的统计方法,利用Affymetrix human GeneChip装置——U95和U133,确定了癌变和非癌变肝脏样品中基因的差异表达情况。(1)对于每一个基因,利用Affymetrix Microarray Suite(v4.0)检测U95的Affymetrix GeneChip平均差异值,Affymetrix Microarray Suite(v4.0)还为每一个GeneChip元件设置“Absent”(=没有检测到),“Present”(=检测到)或“Marginal”(=不能确定存在或不存在)标记。利用Affymetrix Microarray Suite(v5.0)确定了U133的信号值,Affymetrix Microarray Suite(v5.0)也设置了Absent,Present或Marginal标记。(2)使用括号中的标准(在癌变和非癌变肝脏组织样品中同时至少有10%的Present标记,而在癌变或非癌变肝脏样品组中有至少40%的Present标记),选择一组基因进行进一步的分析。(3)在U95数据的平均差异值基础上,将该组基因分成两组,即高表达组和低表达组。高表达组含有在癌变和非癌变样品两者中平均差异值大于或等于5的基因。剩下的基因被分入低表达组中。将高表达组中的平均差异值转变成对数值,而低表达组中的数值保持不变。对于U133数据,不考虑表达水平而将所有的信号都转变成对数值。(4)使用Analysis ofViariance方法(ANOVA)进行数据分析(Steel等人,Principles andProcedures of StatisticsA Biometrical Approach,第三版,McGraw-Hill,1997)。在进行最后分析之前,利用排除方法进行外部检测。在ANOVA分析中每次排除一个样品来确定从分析中去除特定样品是否对最后结果有显著影响。如果是,则所述特定样品被从最后分析中排除。在进行了外部检测后,通过ANOVA分析产生了以小于或等于0.05的P值差异表达的一系列基因。利用相似的步骤分析得到AffymetrixGeneChip U133芯片装置的数据。(5)额外再使用两个标准来减少由<p>

将糖和酵母拌入温热的牛奶中,静置发酵10分钟。加入其他配料揉捏,再静置发酵20分钟。做成面包形状,放入烤箱,在175℃烘烤45分钟。
芝麻面包

制备方法见白面包。
面团的基本配方

用捏揉钩以最慢的速度将所有配料混合,然后再以较快的速度完全混合均匀。烘烤面团前先使其冷却。
表2LBFL 302在下面的某些恶性肿瘤类型中增量调节,变化倍数为1.5或更高。
来自U95数据的51263_at 来自U133数据的226936_at1.膀胱 升---2.乳房浸润性管癌 升升3.子宫颈 升升4.结肠 升升5.肾 升升6.肝 升升7.肺 升升8.子宫肌层 升---9.卵巢 升升10.胰腺 升升11.直肠 升升12.皮肤 升升13.小肠 升---14.软组织升升15.脾升升16.胃升升通过结合于芯片序列片段no.51263_at的样品确定的GeneChip表达结果经使用Taqman检测(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到证实。在检测中使用从特异性Affymetrix片段(51263_at)的序列信息文件设计的PCR引物。检测每个RNA样品(10ng的总RNA)中的目标基因,其中使用了外面掺入的参考基因。为了这个目的,将四环素抗性基因用作外面添加的掺入物(spike)。该方法提供了相对表达量,其通过相对于恒定量的Tet spike Ct值的目标mRNA的循环阈值(cycle threshold)(Ct)来测定。所述样品组包括于U95GeneChips上进行分析的肝硬化(LC),慢性肝炎(CH)和肝细胞癌(HCC)组织的RNA。另外,几个没有在GeneChip上进行分析的新样品用于Q-RT-PCR来证实表达。Q-RT-PCR数据证明,与LC或CH活组织切片检查样品相比,在HCC中可以观察到LBFL302的增量表达。
实施例1b鉴定肝细胞癌中差异表达的LBFL303 mRNA将从19名韩国患者分成两组,从中得到患者组织样品。其中一组包括的9名患者已经被诊断患有慢性病毒性乙型肝炎(CH)并随后发展成了肝癌(HCC)。这组的患者为五男四女,年龄范围为34-65。第二组的10名患者已经被诊断为肝硬化(LC)。这些人也随后发展成了肝癌(HCC)。这一组中为8男2女,患者的年龄范围为37-62。随后,利用与上述实施例1a中相同的技术方案对每一个患者进行实验。
由U95芯片得到的数据分析显示,与肝硬化组织样品相比,肝癌样品中相应于SEQ ID NO5,7或9的标记物的表达被显著增量调节了(9.34倍,p值=1.44×10-4)。由U133芯片得到的数据显示,与肝硬化组织样品(2.60倍,p值=3.63×10-2)和发炎的肝组织样品(对于U95为5.69倍,p值=8.99×10-4)(从慢性肝炎患者的发炎区域取得的活组织切片)相比,肝癌样品中SEQ ID NO5或7的表达也被显著增量调节了。这些数据表明,SEQ ID NOS5,7和9的增量调节可以用来在人群中诊断肝癌,特别是在具有肝硬化或慢性肝炎的患者群中。
通过Affymetrix GeneChips上的芯片序列片段nos.46690_at(U95芯片)和219175_at和224931_at(U133芯片)测定了LBFL303克隆GE6,MB5或IE4(分别为SEQ ID NOS5,7or9)的表达水平。通过利用Affymetrix GeneChips进行的不同组织类型的实验可以收集到差异表达的数据,并使用GX Scan算法进行分析,该算法在相关申请60/331,182,60/388,745和60/390,608中进行了描述,题目都是“用于组织和发掘来自具有复合临床原因的生物样品的基因表达数据的自动化计算机算法”,以上文件都作为参考文献被完整的引入。与正常的对比组织相比的不同恶性肿瘤中的46690_at,219175_at和224931_at的表达水平列在了表1中,这里还指出了变化倍数和变化趋势(增量或者减量调节)。大于1.5的变化倍数被认为是显著的。
表1b

如上面实施例1a中所述的,由结合于芯片序列片段no.46690-at的样品确定的GeneChip表达结果通过使用Taqman检测(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到证实。
Q-RT-PCR数据证明,与LC或CH的活组织切片样品相比,在HCC中发现相应于LBFL303克隆GE6,MB5和IE4的基因被增量调节了。
实施例2相应于差异表达的mRNA种类的全长人类cDNA的克隆具有SEQ ID NOS1,3,5,7或9的全长cDNA是通过寡核苷酸钓取方法(oligo-pulling method)得到的。简要地说,在SEQ ID NOS1,3,5,7或9的序列基础上设计基因特异性的寡核苷酸。按照Sambrook等人的步骤,所述寡核苷酸使用生物素进行标记,并用于和2μg单链质粒DNA(cDNA重组体)进行杂交,所述质粒DNA来自完全分化的胃腺癌文库(NCI CGAP Gas 4)。所述杂交的cDNA利用链霉亲合素缀合的珠子进行分离并通过加热进行洗脱。洗脱后的cDNA转变成双链质粒DNA,并用来转化大肠杆菌细胞(DHl0B),筛选出最长的cDNA。在利用基因特异的引物以PCR方法证实了阳性选择后,将cDNA克隆进行DNA序列分析。
相应于差异调控的mRNA的上述检测的全长人类cDNA的核酸序列如SEQ ID NOS1,3,5,7和9所列。SEQ ID NO1的cDNA包括578个碱基对(531个碱基对和polyA尾巴),而SEQ ID NO3的cDNA包括531个碱基对(515个碱基对和polyA尾巴)。SEQ ID NO5的cDNA包括2067个碱基对(2040个碱基对和polyA尾巴),SEQ ID NO7的cDNA包括2178个碱基对(2162个碱基对和polyA尾巴),而SEQ ID NO9的cDNA包括1616个碱基对(1598个碱基对和polyA尾巴)。
SEQ ID NO1的cDNA核苷酸序列中的开放读码框位于155-418位核苷酸处(155-421位核苷酸中包括终止密码子),该开放读码框编码一个88个氨基酸的蛋白。相应于由SEQ ID NOS1编码的预测蛋白的氨基酸序列如SEQ ID NO2所列。
SEQ ID NO3的cDNA核苷酸序列中的开放读码框位于139-402位核苷酸处(139-405位核苷酸中包括终止密码子),该开放读码框也编码一个88个氨基酸的蛋白。相应于由SEQ ID NOS3编码的预测蛋白的氨基酸序列如SEQ ID NO4所列。尽管编码这些蛋白的核酸序列在编码区域上游不同,但是SEQ ID NO4的蛋白序列和SEQ ID NO2是一样的,除了第28位的氨基酸(SEQ ID NO2中为精氨酸,SEQ ID NO4中为亮氨酸,这是由于SEQ ID NO1中第237位和SEQ ID NO3中第221位的G->T的点突变造成的)。
SEQ ID NOS2和4与类组蛋白转录因子(CBF/NF-Y)和原始组蛋白基序(signature)有微弱的相似。另外,这些氨基酸序列还与细菌调控蛋白lysR家族螺旋-转角-螺旋基序有微弱的相似。所述基序含有三个结构域。SEQ ID NO2和SEQ ID NO4的氨基酸序列与C末端的两个结构域有22%的相同。
SEQ ID NO5(GE6)的cDNA核苷酸序列中的开放读码框位于32-1384位核苷酸处(32-1387位核苷酸中包括终止密码子),该开放读码框编码一个451个氨基酸的蛋白。相应于由SEQ ID NO5编码的蛋白的氨基酸序列如SEQ ID NO6所列。
SEQ ID NO7(MB5)的cDNA核苷酸序列中的开放读码框位于41-1504位核苷酸处(41-1504位核苷酸中包括终止密码子),该开放读码框编码一个487个氨基酸的蛋白。相应于由SEQ ID NO7编码的蛋白的氨基酸序列如SEQ ID NO8所列。除了在靠近氨基末端插入了36个氨基酸外,SEQ ID NO8的蛋白序列和SEQ ID NO6是一样的(参照下面的多序列比对)。
SEQ ID NO9(IE4)的cDNA核苷酸序列中的开放读码框位于31-1551位核苷酸处(31-1554位核苷酸中包括终止密码子),该开放读码框编码一个507个氨基酸的蛋白。相应于由SEQ ID NO9编码的蛋白的氨基酸序列如SEQ ID NO10所列。相应于SEQ ID NO10的蛋白与SEQ ID NO8在前456个氨基酸是完全相同的,尽管蛋白的剩余部分没有同源性(参照下面的多序列比对)。
GE6,MB5和IE4的多氨基酸序列比对1 50LBFL303_GE6.pep MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTPLBFL303_MB5.pep MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTPLBFL303_IE4.pep MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTP一致序列 MDGTETRQRR LDSCGKPGEL GLPHPLSTGG LPVASEDGAL RAPESQSVTP51 100LBFL303_GE6.pep KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF Q.........LBFL303_MB5.pep KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF QHWPVFVEVKLBFL303_IE4.pep KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF QHWPVFVEVK二致序列 KPLETEPSRE TAWSIGLQVT VPFMFAGLGL SWAGMLLDYF QHWPVFVEVK101150LBFL303_GE6.pep .......... .......... .......ANT GQIDDPQEQH RVISSNLALILBFL303_MB5.pep DLLTLVPPLV GLKGNLEMTL ASRLSTAANT GQIDDPQEQH RVISSNLALILBFL303_IE4.pep DLLTLVPPLV GLKGNLEMTL ASRLSTAANT GQIDDPQEQH RVISSNLALI一致序列 DLLTLVPPLV GLKGNLEMTL ASRLSTAANT GQIDDPQEQH RVISSNLALI151200LBFL303_GE6.pep QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALGLBFL303_MB5.pep QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALGLBFL303_IE4.pep QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALG二致序列 QVQATVVGLL AAVAALLLGV VSREEVDVAK VELLCASSVL TAFLAAFALG201250LBFL303_GE6.pep VLMVCIVIGA RKLGVNPDMI ATPIAASLGD LITLSILALV SSFFYRHKDSLBFL303_MB5.pep VLMVCIVIGA RKLGVNPDNI ATPIAASLGD LITLSILALV SSFFYRHKDSLBFL303_IE4.pep VLMVCIVIGA RKLGVNPDNI ATPIAASLGD LITLSILALV SSFFYRHKDS一致序列 VLMVCIVIGA RKLGVNPDNI ATPIAASLGD LITLSILALV SSFFYRHKDS251300LBFL303_GE6.pep RYLTPLVCLS FAALTPVWVL IAKQSPPIVK ILKFGWFPII LAMVISSFGGLBFL303_MB5.pep RYLTPLVCLS FAALTPVWVL IAKQSPPIVK ILKFGWFPII LAMVISSFGGLBFL303_IE4.pep RYLTPLVCLS FAALTPVWVL IAKQSPPIVK ILKFGWFPII LAMVISSFGG一致序列 RYLTPLVCLS FAALTPVWVL IAKQSpPIVK ILKFGWFPII LAMVISSFGG301350LBFL303_GE6.pep LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVLLBFL303_MBS.pep LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVLLBFL303_IE4.pep LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVL一致序列 LILSKTVSKQ QYKGMAIFTP VICGVGGNLV AIQTSRISTY LHMWSAPGVL351400LBFL303_GE6.pep PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQSLBFL303_MBS.pep PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQSLBFL303_IE4.pep PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQS一致序列 PLQMKKFWPN PCSTFCTSEI NSMSARVLLL LVVPGHLIFF YIIYLVEGQS401450LBFL303_GE6.pep VINSQTFVVL YLLAGLIQVT ILLYLAEVMV RLTWHQALDP DNHCIPYLTGLBFL303_MB5.pep VINSQTFVVL YLLAGLIQVT ILLYLAEVMV RLTWHQALDP DNHCIPYLTGLBFL303_IE4.pep VINSQTFVVL YLLAGLIQVT ILLYIAEVMV RLTWHQALDP DNHCIPYLTG二致序列 VINSQTFVVL YLLAGLIQVT ILLYLAEVMV RLTWHQALDP DNHCIPYLTG451500LBFL303_GE6.pep LGDLLGTGLL ALCFFTDWLL KSKAELGGIS ELASGPP*-- ----------LBFL303_MB5.pep LGDLLGTGLL ALCFFTDWLL KSKAELGGIS ELASGPP*-- ----------LBFL303_IE4.pep LGDLLGSSSV GHTAAVPRRC TASPGWGLIQ PFICTQHLIV SLLSFYFPFC一致序列 IGDLLGTGLL ALCFFTDWLL KSKAELGGIS ELASGPP--- ----------501LBFL303_GE6.pep --------LBFL303_MB5.pep --------LBFL303_IE4.pep LLAKTSI*一致序列 --------LBFL 303克隆还表现出与小鼠同系物(GenBank目录号No.XM_132686)的部分同源性。SEQ ID NO5在全部连续序列中表现出44%的同一性,在开放读码框中表现出68%的同一性,而SEQ ID NO7在全部连续序列中表现出46%的同一性,在开放读码框中表现出69%的同一性。SEQ ID NO9与小鼠的核酸序列在全部连续序列上表现出61%的同一性,在开放读码框中表现出64%的同一性。
SEQ ID NOS6,8和10包含二价阳离子转运基序,所述基序具有两个结构域。SEQ ID NOS6和8同时包含两个域(在SEQ ID NO6的85-205和282-428位氨基酸处,在SEQ ID NO8的105-241和318-464位氨基酸处),尽管SEQ ID NO10只包含N末端的结构域(氨基酸残基105-241)。另外,SEQ ID NOS6,8和10中包含过氧化物酶活性位点,即在SEQ ID NOS6的390-401氨基酸位置以及在SEQ ID NOS8和10的426-437氨基酸位置。
图1,2,3,4和5显示了SEQ ID NOS2,4,6,8和10的氨基酸序列的疏水分析结果。如上面所描述的,亲水区域可以用来产生抗原性肽。
进行Northern印迹分析以确定与SEQ ID NOS1,3,5,7和9相对应的mRNA转录本的大小。使用了含有来自多种人类组织的总RNA的Northern印迹物(ClonTech),将克隆BC7(SEQ ID NO3),克隆GE6(SEQ ID NO5),克隆MB5(SEQ ID NO7),克隆IE4(SEQ IDNO9)中的每一个用随机引物方法进行放射性标记,并用来探测所述印迹物。所述印迹物在65℃于Church和Gilbert缓冲液中进行杂交,并在室温下用含有0.1%SDS的0.1XSSC进行洗涤。Northern印迹物对于每个LBFL302和303基因显示出单个转录本,其大小接近于0.65kb和2.45kb。这分别对应于在克隆BC7和BC4(SEQ ID NOS3 and 1)中插入物的大小,分别为0.531kb和0.578kb,以及GE6中的2.2kb,MB5中的2.3kb,IE4中的1.8kb,SEQ ID NOS5,7和9。
为了检查SEQ ID NO1,3,5,7或9在不同正常组织中的表达,如下制备了电子Northern印迹物(e-Northern)。采用实施例1中的芯片和程序,将得自表3中列出的一组46个正常组织的mRNA与Affymetrix U95 human GeneChip进行杂交。这些试验的结果列于表3中。对于每一个组织类型,都标记出了所谓的存在和不存在的样品的数目,以及在这个样品组中总的样品数。另外,还列出了每一个组织类型的中间值和25%和75%点时的数值。有趣的是,尽管所述基因在肝癌中是增量调节的,在大多数正常的肝脏样品中没有检测到LBFL302和303的表达。如下面所讨论的,所述观察到的结果表明,可以将LBFL302和303用作一种诊断剂或标记物来检测肝癌或将肝细胞癌与肝硬化组织进行区分。LBFL302在胸腺中表现出的表达水平似乎是最高的,其次是生殖系统的器官(睾丸,子宫内膜,子宫肌层,子宫,子宫颈和乳房)和消化系统的器官(食道,直肠,结肠和阑尾)。LBFL303在脑部(小脑,额叶皮质,颞叶皮质和海马体)和生殖系统的器官(睾丸,子宫内膜,子宫肌层,子宫,子宫颈和乳房)中表现出的表达水平似乎是最高的,但是在大多数其它组织中检测到的表达水平是比较低的。肝脏的表达是最低的。
表3a 51263_at的e-Northern表正常组织中LBFL302基因的表达


表3b 46690_at的e-Northern表正常组织中LBFL303基因的表达


工业应用性实施例3检测LBFL302和303mRNA以筛选肝癌。
如实施例1中所描述的,在肝组织的活检样品中确定对应于SEQ IDNO1,3,5,7或9的mRNA表达水平,即,在GeneChip上筛选mRNA样品,或者按照实施例2中所描述的,即利用Northern印迹筛选mRNA样品。可以选择的,也可以采用恶性状态或非恶性状态的非肝增生组织的样品进行分析。来自肝癌患者或正常个体的肝组织样品可以用作阳性和阴性对照。使用分析基因表达的任意方法,高于普通对照的表达水平表示有肝癌或有发展成肝癌的可能性。
尽管本发明已经通过上面的实施例进行了详细地描述,但是应理解可以进行各种改变而不偏离本发明的精神。因此,本发明仅由下面的权利要求所限制。本发明中引用的所有专利,专利申请和出版物都以其整体引入作为参考。
序列表&lt;110&gt;LG Life Sciences Ltd.
&lt;120&gt;肝癌相关的基因家族&lt;150&gt;US 60/402,905&lt;151&gt;2002-08-14&lt;150&gt;US 60/403,651&lt;151&gt;2002-08-16&lt;160&gt;10&lt;170&gt;KopatentIn 1.71&lt;210&gt;1&lt;211&gt;578&lt;212&gt;DNA&lt;213&gt;智人&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(155)..(418)&lt;223&gt;基因LBFL302,克隆BC4&lt;400&gt;1cggacgcgtg ggttcgaacg ttcggactga ggtttttctg cctgaagaag cgtcatacgg 60accggattgt tttcgctggc ccagtgtccc cggagcttgt gtgcgataca gagagcacct 120cggaagctga ggcagctggt acttgacaga gagg atg gcg ctg tcg acc169Met Ala Leu Set Thr1 5ata gtc tcc cag agg aag cag ata aag cgg aag gct ccc cgt ggc ttt217Ile Val Ser Gln Arg Lys Gln Ile Lys Arg Lys Ala Pro Arg Gly Phe10 15 20cta aag cga gtc ttc aag cga aag aag cct caa ctt cgt ctg gag aaa265Leu Lys Arg Val Phe Lys Arg Lys Lys Pro Gln Leu Arg Leu Glu Lys25 30 35agt ggt gac tta ttg gtc cat ctg aac tgt tta ctg ttt gtt cat cga313Ser Gly Asp Leu Leu Val His Leu Asn Cys Leu Leu Phe Val His Arg40 45 50tta gca gaa gag tcc agg aca aac gct tgt gcg agt aaa tgt aga gtc361Leu Ala Glu Glu Ser Arg Thr Asn Ala Cys Ala Ser Lys Cys Arg Val
55 60 65att aac aag gag cat gta ctg gcc gca gca aag gta att cta aag aag 409Ile Asn Lys Glu His Val Leu Ala Ala Ala Lys Val Ile Leu Lys Lys70 75 80 85agc aga ggtta gaagtcaaag aacatattct tgaaagttat gatgcattct460Ser Arg Glytttgggtggt aacagatcat aaagacattt tttacacatc agttaatatg ggattattaa520atattggcta taaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 578&lt;210&gt;2&lt;211&gt;88&lt;212&gt;PRT&lt;213&gt;智人&lt;400&gt;2Met Ala Leu Ser Thr Ile Val Ser Gln Arg Lys Gln Ile Lys Arg Lys1 5 10 15Ala Pro Arg Gly Phe Leu Lys Arg Val Phe Lys Arg Lys Lys Pro Gln20 25 30Leu Arg Leu Glu Lys Ser Gly Asp Leu Leu Val His Leu Asn Cys Leu35 40 45Leu Phe Val His Arg Leu Ala Glu Glu Ser Arg Thr Asn Ala Cys Ala50 55 60Ser Lys Cys Arg Val Ile Asn Lys Glu His Val Leu Ala Ala Ala Lys65 70 75 80Val Ile Leu Lys Lys Ser Arg Gly85&lt;210&gt;3&lt;211&gt;531&lt;212&gt;DNA&lt;213&gt;智人&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(139)..(402)&lt;223&gt;基因LBFL302,克隆BC7
&lt;400&gt;3cccacgcgtc cggaggtttt tctgcctgaa gaagcgtcat acggaccgga ttgttttcgc 60tggcccagtg tccccggagc ttgtgtgcga tacagagagc acctcggaag ctgaggcagc 120tggtacttga cagagagg atg gcg ctg tcg acc ata gtc tcc cag agg aag 171Met Ala Leu Ser Thr Ile Val Ser Gln Arg Lys1 5 10cag ata aag cgg aag gct ccc cgt ggc ttt cta aag cga gtc ttc aag219Gln Ile Lys Arg Lys Ala Pro Arg Gly Phe Leu Lys Arg Val Phe Lys15 20 25cta aag aag cct caa ctt cgt ctg gag aaa agt ggt gac tta ttg gtc267Leu Lys Lys Pro Gln Leu Arg Leu Glu Lys Ser Gly Asp Leu Leu Val30 35 40cat ctg aac tgt tta ctg ttt gtt cat cga tta gca gaa gag tcc agg315His Leu Asn Cys Leu Leu Phe Val His Arg Leu Ala Glu Glu Ser Arg45 50 55aca aac gct tgt gcg agt aaa tgt aga gtc att aac aag gag cat gta363Thr Asn Ala Cys Ala Ser Lys Cys Arg Val Ile Asn Lys Glu His Val60 65 70 75ctg gcc gca gca aag gta att cta aag aag agc aga ggt tagaagtc 410Leu Ala Ala Ala Lys Val Ile Leu Lys Lys Ser Arg Gly80 85aaagaacata ttcttgaaag ttatgatgca ttcttttggg tggtaacaga tcataaagac 470attttttaca catcagttaa tatgggatta ttaaatattg gatataaaaa aaaaaaaaaa 530a 531&lt;210&gt;4&lt;211&gt;88&lt;212&gt;PRT&lt;213&gt;智人&lt;400&gt;4Met Ala Leu Ser Thr Ile Val Ser Gln Arg Lys Gln Ile Lys Arg Lys1 5 10 15Ala Pro Arg Gly Phe Leu Lys Arg Val Phe Lys Leu Lys Lys Pro Gln20 25 30Leu Arg Leu Glu Lys Ser Gly Asp Leu Leu Val His Leu Asn Cys Leu35 40 45
Leu Phe Val His Arg Leu Ala Glu Glu Ser Arg Thr Asn Ala Cys Ala50 55 60Ser Lys Cys Arg Val Ile Asn Lys Glu His Val Leu Ala Ala Ala Lys65 70 75 80Val Ile Leu Lys Lys Ser Arg Gly85&lt;210&gt;5&lt;211&gt;2067&lt;212&gt;DNA&lt;213&gt;智人&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(32)..(1384)&lt;223&gt;克隆GE6&lt;400&gt;5cccgggctgc caggcgccca gctgtgccca g atg gat ggg aca gag46Met Asp Gly Thr Glu1 5acc cgg cag cgg agg ctg gac agc tgt ggc aag cca ggg gag ctg ggg94Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys Pro Gly Glu Leu Gly10 15 20ctt cct cac ccc ctc agc aca gga gga ctc cct gta gcc tca gaa gat142Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro Val Ala Ser Glu Asp25 30 35gga gct ctc agg gcc cct gag agc caa agc gtg acc ccc aag cca ctg190Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val Thr Pro Lys Pro Leu40 45 50gag act gag cct agc agg gag acc gcc tgg tcc ata ggc ctt cag gtg238Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser Ile Gly Leu Gln Val55 60 65acc gtg ccc ttc atg ttt gca ggc ctg gga ctg tcc tgg gcc ggc atg286Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu Ser Trp Ala Gly Met70 75 80 85ctt ctg gac tat ttc cag gcc aac act gga caa att gat gac ccc cag334Leu Leu Asp Tyr Phe Gln Ala Asn Thr Gly Gln Ile Asp Asp Pro Gln90 95 100
gag cag cac aga gtc atc agc agc aac ctg gcc ctc atc cag gtg cag382Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala Leu Ile Gln Val Gln105 110 115gcc act gtc gtg ggg ctc ttg gct gct gtg gct gcg ctg ctg ttg ggc430Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala Ala Leu Leu Leu Gly120 125 130gtg gtg tct cga gag gaa gtg gat gtc gcc aag gtg gag ttg ctg tgt478Val Val Ser Arg Glu Glu Val Asp Val Ala Lys Val Glu Leu Leu Cys135 140 145gcc agc agt gtc ctc act gcc ttc ctt gca gcc ttt gcc ctg ggg gtg526Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala Phe Ala Leu Gly Val150 155 160 165ctg atg gtc tgt ata gtg att ggt gct cga aag ctc ggg gtc aac cca574Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys Leu Gly Val Asn Pro170 175 180gac aac att gcc acg ccc att gca gcc agc ctg gga gac ctc atc aca622Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu Gly Asp Leu Ile Thr185 190 195ctg tcc att ctg gct ttg gtt agc agc ttc ttc tac aga cac aaa gat670Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe Tyr Arg His Lys Asp200 205 210agt cgg tat ctg acg ccg ctg gtc tgc ctc agc ttt gcg gct ctg acc718Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser Phe Ala Ala Leu Thr215 220 225cca gtg tgg gtc ctc att gcc aag cag agc cca ccc atc gtg aag atc766Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro Pro Ile Val Lys Ile230 235 240 245ctg aag ttt ggc tgg ttc cca atc atc ctg gcc atg gtc atc agc agt814Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala Met Val Ile Ser Ser250 255 260ttc gga gga ctc atc ttg agc aaa acc gtt tct aaa cag cag tac aaa862Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser Lys Gln Gln Tyr Lys265 270 275ggc atg gcg ata ttt acc ccc gtc ata tgt ggt gtt ggt ggc aat ctg910Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly Val Gly Gly Asn Leu280 285 290gtg gcc att cag acc agc cga atc tca acc tac ctg cac atg tgg agt958
Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr Leu His Met Trp Ser295 300 305gca cct ggc gtc ctg ccc ctc cag atg aag aaa ttc tgg ccc aac ccg 1006Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys Phe Trp Pro Asn Pro310 315 320 325tgt tct act ttc tgc acg tca gaa atc aat tcc atg tca gct cga gtc 1054Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser Met Ser Ala Arg Val330 335 340ctg ctc ttg ctg gtg gtc cca ggc cat ctg att ttc ttc tac atc atc 1102Leu Leu Leu Leu Val Val Pro Gly His Leu Ile Phe Phe Tyr Ile Ile345 350 355tac ctg gtg gag ggt cag tca gtc ata aac agc cag acc ttt gtg gtg 1150Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser Gln Thr Phe Val Val360 365 370ctc tac ctg ctg gca ggc ctg atc cag gtg aca atc ctg ctg tac ctg 1198Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr Ile Leu Leu Tyr Leu375 380 385gca gaa gtg atg gtt cgg ctg act tgg cac cag gcc ctg gat cct gac 1246Ala Glu Val Met Val Arg Leu Thr Trp His Gln Ala Leu Asp Pro Asp390 395 400 405aac cac tgc atc ccc tac ctt aca ggg ctg ggg gac ctg ctc ggt act 1294Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly Asp Leu Leu Gly Thr410 415 420ggc ctc ctg gca ctc tgc ttt ttc act gac tgg cta ctg aag agc aag 1342Gly Leu Leu Ala Leu Cys Phe Phe Thr Asp Trp Leu Leu Lys Ser Lys425 430 435gca gag ctg ggt ggc atc tca gaa ctg gca tct gga cct ccc taactg 1390Ala Glu Leu Gly Gly Ile Ser Glu Leu Ala Ser Gly Pro Pro440 445 450ggccccgctg gtcccatttg ctcattagaa tttcctctca catcagtggg atacagaatt1450cagtttctcc cttgccaggt ccttgggatg gttgacccct gcctctgcag tagccttttg1510tgagtctgct aaggtagctc tcacacacct cggctctggg gttgatacct gagcctgcaa1570tagagccctg aaatcaagag catggcttga gtgtgtgaat atgatgtgtg cacatgctta1630atgagcgtgc aagtgtgcac acgtttgtgg agaggagggt gttctggcct gagaaggtaa1690agaagaggca tgtccagtat gctttgcagg gtgtgtttgc tcttttccat gcccatgcaa1750
cccagattgg ggtggagcag gaaggagctc ttttctgttc ccaagcctca gaactcttga1810gctgtggctt acttgctgtc ttcaccaggt tcaagctccg tgggccacac tgctgctgtg1870ccaagaaggt gtacagcctc cccaggatgg ggcctcatac aacccttcat ctgcactcaa1930catttaatcg tgtccttgct gtctttttat tttccttttt gtttgttagc aaaaacctct1990atttagattt caataatcag agaagtgtaa aataaaacag attatattgt aaaaaaaaaa2050aaaaaaaaaa aaaaaaa 2067&lt;210&gt;6&lt;211&gt;45l&lt;212&gt;PRT&lt;213&gt;智人&lt;400&gt;6Met Asp Gly Thr Glu Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys1 5 10 15Pro Gly Glu Leu Gly Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro20 25 30Val Ala Ser Glu Asp Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val35 40 45Thr Pro Lys Pro Leu Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser50 55 60Ile Gly Leu Gln Val Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu65 70 75 80Ser Trp Ala Gly Met Leu Leu Asp Tyr Phe Gln Ala Asn Thr Gly Gln85 90 95Ile Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala100 105 110Leu Ile Gln Val Gln Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala115 120 125Ala Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val Asp Val Ala Lys130 135 140Val Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala145 150 155 160
Phe Ala Leu Gly Val Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys165 170 175Leu Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu180 185 190Gly Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe195 200 205Tyr Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser210 215 220Phe Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro225 230 235 240Pro Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala245 250 255Met Val Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser260 265 270Lys Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly275 280 285Val Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr290 295 300Leu His Met Trp Ser Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys305 310 315 320Phe Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser325 330 335Met Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro Gly His Leu Ile340 345 350Phe Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser355 360 365Gln Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr370 375 380Ile Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu Thr Trp His Gln385 390 395 400Ala Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly405 410 415Asp Leu Leu Gly Thr Gly Leu Leu Ala Leu Cys Phe Phe Thr Asp Trp420 425 430
Leu Leu Lys Ser Lys Ala Glu Leu Gly Gly Ile Ser Glu Leu Ala Ser435 440 445Gly Pro Pro450&lt;210&gt;7&lt;211&gt;2178&lt;212&gt;DNA&lt;213&gt;智人&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(41)..(1501)&lt;223&gt;克隆MB5&lt;400&gt;7gggaggggac ccgggctgcc aggcgcccag ctgtgcccag atg gat ggg aca gag55Met Asp Gly Thr Glu1 5acc cgg cag cgg agg ctg gac agc tgt ggc aag cca ggg gag ctg ggg103Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys Pro Gly Glu Leu Gly10 15 20ctt cct cac ccc ctc agc aca gga gga ctc cct gta gcc tca gaa gat151Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro Val Ala Ser Glu Asp25 30 35gga gct ctc agg gcc cct gag agc caa agc gtg acc ccc aag cca ctg199Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val Thr Pro Lys Pro Leu40 45 50gag act gag cct agc agg gag acc gcc tgg tcc ata ggc ctt cag gtg247Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser Ile Gly Leu Gln Val55 60 65acc gtg ccc ttc atg ttt gca ggc ctg gga ctg tcc tgg gcc ggc atg295Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu Ser Trp Ala Gly Met70 75 80 85ctt ctg gac tat ttc cag cac tgg cct gtg ttt gtg gag gtg aaa gac343Leu Leu Asp Tyr Phe Gln His Trp Pro Val Phe Val Glu Val Lys Asp90 95 100ctt ttg aca ttg gtg ccg ccc ctg gtg ggc ctg aag ggg aac ctg gag391Leu Leu Thr Leu Val Pro Pro Leu Val Gly Leu Lys Gly Asn Leu Glu
105 110 115atg aca ctg gca tcc aga ctc tcc aca gct gcc aac act gga caa att439Met Thr Leu Ala Ser Arg Leu Ser Thr Ala Ala Asn Thr Gly Gln Ile120 125 130gat gac ccc cag gag cag cac aga gtc atc agc agc aac ctg gcc ctc487Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala Leu135 140 145atc cag gtg cag gcc act gtc gtg ggg ctc ttg gct gct gtg gct gcg535Ile Gln Val Gln Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala Ala150 155 160 165ctg ctg ttg ggc gtg gtg tct cga gag gaa gtg gat gtc gcc aag gtg583Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val Asp Val Ala Lys Val170 175 180gag ttg ctg tgt gcc agc agt gtc ctc act gcc ttc ctt gca gcc ttt631Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala Phe185 190 195gcc ctg ggg gtg ctg atg gtc tgt ata gtg att ggt gct cga aag ctc679Ala Leu Gly Val Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys Leu200 205 210ggg gtc aac cca gac aac att gcc acg ccc att gca gcc agc ctg gga727Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu Gly215 220 225gac ctc atc aca ctg tcc att ctg gct ttg gtt agc agc ttc ttc tac775Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe Tyr230 235 240 245aga cac aaa gat agt cgg tat ctg acg ccg ctg gtc tgc ctc agc ttt823Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser Phe250 255 260gcg gct ctg acc cca gtg tgg gtc ctc att gcc aag cag agc cca ccc871Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro Pro265 270 275atc gtg aag atc ctg aag ttt ggc tgg ttc cca atc atc ctg gcc atg919Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala Met280 285 290gtc atc agc agt ttc gga gga ctc atc ttg agc aaa acc gtt tct aaa967Val Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser Lys295 300 305
cag cag tac aaa ggc atg gcg ata ttt acc ccc gtc ata tgt ggt gtt 1015Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly Val310 315 320 325ggt ggc aat ctg gtg gcc att cag acc agc cga atc tca acc tac ctg 1063Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr Leu330 335 340cac atg tgg agt gca cct ggc gtc ctg ccc ctc cag atg aag aaa ttc 111lHis Met Trp Ser Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys Phe345 350 355tgg ccc aac ccg tgt tct act ttc tgc acg tca gaa atc aat tcc atg 1159Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser Met360 365 370tca gct cga gtc ctg ctc ttg ctg gtg gtc cca ggc cat ctg att ttc 1207Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro Gly His Leu Ile Phe375 380 385ttc tac atc atc tac ctg gtg gag ggt cag tca gtc ata aac agc cag 1255Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser Gln390 395 400 405acc ttt gtg gtg ctc tac ctg ctg gca ggc ctg atc cag gtg aca atc 1303Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr Ile410 415 420ctg ctg tac ctg gca gaa gtg atg gtt cgg ctg act tgg cac cag gcc 1351Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu Thr Trp His Gln Ala425 430 435ctg gat cct gac aac cac tgc atc ccc tac ctt aca ggg ctg ggg gac 1399Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly Asp440 445 450ctg ctc ggt act ggc ctc ctg gca ctc tgc ttt ttc act gac tgg cta 1447Leu Leu Gly Thr Gly Leu Leu Ala Leu Cys Phe Phe Thr Asp Trp Leu455 460 465ctg aag agc aag gca gag ctg ggt ggc atc tca gaa ctg gca tct gga 1495Leu Lys Ser Lys Ala Glu Leu Gly Gly Ile Ser Glu Leu Ala Ser Gly470 475 480 485cct ccc taactgggc cccgctggtc ccatttgctc attagaattt cctctcacat1550Pro Procagtgggata cagaattcag tttctccctt gccaggtcct tgggatggtt gacccctgcc1610tctgcagtag ccttttgtga gtctgctaag gtagctctca cacacctcgg ctctggggtt1670
gatacctgag cctgcaatag agccctgaaa tcaagagcat ggcttgagtg tgtgaatatg1730atgtgtgcac atgcttaatg agcgtgcaag tgtgcacacg tttgtggaga ggagggtgtt1790ctggcctgag aaggtaaaga agaggcatgt ccagtatgct ttgcagggtg tgtttgctct1850tttccatgcc catgcaaccc agattggggt ggagcaggaa ggagctcttt tctgttccca1910agcctcagaa ctcttgagct gtggcttact tgctgtcttc accaggttca agctccgtgg1970gccacactgc tgctgtgcca agaaggtgta cagcctcccc aggatggggc ctcatacaac2030ccttcatctg cactcaacat ttaatcgtgt ccttgctgtc tttttatttt cctttttgtt2090tgttagcaaa aacctctatt tagatttcaa taatcagaga agtgtaaaat aaaacagatt2150atattgtact tgaaaaaaaa aaaaaaaa 2178&lt;210&gt;8&lt;211&gt;487&lt;212&gt;PRT&lt;213&gt;智人&lt;400&gt;8Met Asp Gly Thr Glu Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys1 5 10 15Pro Gly Glu Leu Gly Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro20 25 30Val Ala Ser Glu Asp Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val35 40 45Thr Pro Lys Pro Leu Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser50 55 60Ile Gly Leu Gln Val Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu65 70 75 80Ser Trp Ala Gly Met Leu Leu Asp Tyr Phe Gln His Trp Pro Val Phe85 90 95Val Glu Val Lys Asp Leu Leu Thr Leu Val Pro Pro Leu Val Gly Leu100 105 110Lys Gly Asn Leu Glu Met Thr Leu Ala Ser Arg Leu Ser Thr Ala Ala115 120 125
Asn Thr Gly Gln Ile Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser130 135 140Ser Asn Leu Ala Leu Ile Gln Val GIn Ala Thr Val Val Gly Leu Leu145 150 155 160Ala Ala Val Ala Ala Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val165 170 175Asp Val Ala Lys Val Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala180 185 190Phe Leu Ala Ala Phe Ala Leu Gly Val Leu Met Val Cys Ile Val Ile195 200 205Gly Ala Arg Lys Leu Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile210 215 220Ala Ala Ser Leu Gly Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val225 230 235 240Ser Ser Phe Phe Tyr Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu245 250 255Val Cys Leu Ser Phe Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala260 265 270Lys Gln Ser Pro Pro Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro275 280 285Ile Ile Leu Ala Met Val Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser290 295 300Lys Thr Val Ser Lys Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro305 310 315 320Val Ile Cys Gly Val Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg325 330 335Ile Ser Thr Tyr Leu His Met Trp Ser Ala Pro Gly Val Leu Pro Leu340 345 350Gln Met Lys Lys Phe Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser355 360 365Glu Ile Asn Ser Met Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro370 375 380Gly His Leu Ile Phe Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser385 390 395 400
Val Ile Asn Ser Gln Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu405 410 415Ile Gln Val Thr Ile Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu420 425 430Thr Trp His Gln Ala Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu435 440 445Thr Gly Leu Gly Asp Leu Leu Gly Thr Gly Leu Leu Ala Leu Cys Phe450 455 460Phe Thr Asp Trp Leu Leu Lys Ser Lys Ala Glu Leu Gly Gly Ile Ser465 470 475 480Glu Leu Ala Ser Gly Pro Pro485&lt;210&gt;9&lt;211&gt;1616&lt;212&gt;DNA&lt;213&gt;智人&lt;220&gt;
&lt;221&gt;CDS&lt;222&gt;(31)..(1551)&lt;223&gt;克隆IE4&lt;400&gt;9ccgggctgcc aggcgcccag ctgtgcccag atg gat ggg aca gag acc cgg cag54Met Asp Gly Thr Glu Thr Arg Gln1 5cgg agg ctg gac agc tgt ggc aag cca ggg gag ctg ggg ctt cct cac102Arg Arg Leu Asp Ser Cys Gly Lys Pro Gly Glu Leu Gly Leu Pro His10 15 20ccc ctc agc aca gga gga ctc cct gta gcc tca gaa gat gga gct ctc150Pro Leu Ser Thr Gly Gly Leu Pro Val Ala Set Glu Asp Gly Ala Leu25 30 35 40agg gcc cct gag agc caa agc gtg acc ccc aag cca ctg gag act gag198Arg Ala Pro Glu Ser Gln Ser Val Thr Pro Lys Pro Leu Glu Thr Glu45 50 55cct agc agg gag acc gcc tgg tcc ata ggc ctt cag gtg acc gtg ccc246Pro Ser Arg Glu Thr Ala Trp Ser Ile Gly Leu Gln Val Thr Val Pro
60 65 70ttc atg ttt gca ggc ctg gga ctg tcc tgg gcc ggc atg ctt ctg gac294Phe Met Phe Ala Gly Leu Gly Leu Ser Trp Ala Gly Met Leu Leu Asp75 80 85tat ttc cag cac tgg cct gtg ttt gtg gag gtg aaa gac ctt ttg aca342Tyr Phe Gln His Trp Pro Val Phe Val Glu Val Lys Asp Leu Leu Thr90 95 100ttg gtg ccg ccc ctg gtg ggc ctg aag ggg aac ctg gag atg aca ctg390Leu Val Pro Pro Leu Val Gly Leu Lys Gly Asn Leu Glu Met Thr Leu105 110 115 120gca tcc aga ctc tcc aca gct gcc aac act gga caa att gat gac ccc438Ala Ser Arg Leu Ser Thr Ala Ala Asn Thr Gly Gln Ile Asp Asp Pro125 130 135cag gag cag cac aga gtc atc agc agc aac ctg gcc ctc atc cag gtg486Gln Glu Gln His Arg Val Ile Ser Ser Asn Leu Ala Leu Ile Gln Val140 145 150cag gcc act gtc gtg ggg ctc ttg gct gct gtg gct gcg ctg ctg ttg534Gln Ala Thr Val Val Gly Leu Leu Ala Ala Val Ala Ala Leu Leu Leu155 160 165ggc gtg gtg tct cga gag gaa gtg gat gtc gcc aag gtg gag ttg ctg582Gly Val Val Ser Arg Glu Glu Val Asp Val Ala Lys Val Glu Leu Leu170 175 180tgt gcc agc agt gtc ctc act gcc ttc ctt gca gcc ttt gcc ctg ggg630Cys Ala Ser Ser Val Leu Thr Ala Phe Leu Ala Ala Phe Ala Leu Gly185 190 195 200gtg ctg atg gtc tgt ata gtg att ggt gct cga aag ctc ggg gtc aac678Val Leu Met Val Cys Ile Val Ile Gly Ala Arg Lys Leu Gly Val Asn205 210 215cca gac aac att gcc acg ccc att gca gcc agc ctg gga gac ctc atc726Pro Asp Asn Ile Ala Thr Pro Ile Ala Ala Ser Leu Gly Asp Leu Ile220 225 230aca ctg tcc att ctg gct ttg gtt agc agc ttc ttc tac aga cac aaa774Thr Leu Ser Ile Leu Ala Leu Val Ser Ser Phe Phe Tyr Arg His Lys235 240 245gat agt cgg tat ctg acg ccg ctg gtc tgc ctc agc ttt gcg gct ctg822Asp Ser Arg Tyr Leu Thr Pro Leu Val Cys Leu Ser Phe Ala Ala Leu250 255 260
acc cca gtg tgg gtc ctc att gcc aag cag agc cca ccc atc gtg aag870Thr Pro Val Trp Val Leu Ile Ala Lys Gln Ser Pro Pro Ile Val Lys265 270 275 280atc ctg aag ttt ggc tgg ttc cca atc atc ctg gcc atg gtc atc agc918Ile Leu Lys Phe Gly Trp Phe Pro Ile Ile Leu Ala Met Val Ile Ser285 290 295agt ttc gga gga ctc atc ttg agc aaa acc gtt tct aaa cag cag tac966Ser Phe Gly Gly Leu Ile Leu Ser Lys Thr Val Ser Lys Gln Gln Tyr300 305 310aaa ggc atg gcg ata ttt acc ccc gtc ata tgt ggt gtt ggt ggc aat1014Lys Gly Met Ala Ile Phe Thr Pro Val Ile Cys Gly Val Gly Gly Asn315 320 325ctg gtg gcc att cag acc agc cga atc tca acc tac ctg cac atg tgg1062Leu Val Ala Ile Gln Thr Ser Arg Ile Ser Thr Tyr Leu His Met Trp330 335 340agt gca cct ggc gtc ctg ccc ctc cag atg aag aaa ttc tgg ccc aac1110Ser Ala Pro Gly Val Leu Pro Leu Gln Met Lys Lys Phe Trp Pro Asn345 350 355 360ccg tgt tct act ttc tgc acg tca gaa atc aat tcc atg tca gct cga1158Pro Cys Ser Thr Phe Cys Thr Ser Glu Ile Asn Ser Met Ser Ala Arg365 370 375gtc ctg ctc ttg ctg gtg gtc cca ggc cat ctg att ttc ttc tac atc1206Val Leu Leu Leu Leu Val Val Pro Gly His Leu Ile Phe Phe Tyr Ile380 385 390atc tac ctg gtg gag ggt cag tca gtc ata aac agc cag acc ttt gtg1254Ile Tyr Leu Val Glu Gly Gln Ser Val Ile Asn Ser Gln Thr Phe Val395 400 405gtg ctc tac ctg ctg gca ggc ctg atc cag gtg aca atc ctg ctg tac1302Val Leu Tyr Leu Leu Ala Gly Leu Ile Gln Val Thr Ile Leu Leu Tyr410 415 420ctg gca gaa gtg atg gtt cgg ctg act tgg cac cag gcc ctg gat cct1350Leu Ala Glu Val Met Val Arg Leu Thr Trp His Gln Ala Leu Asp Pro425 430 435 440gac aac cac tgc atc ccc tac ctt aca ggg ctg ggg gac ctg ctc ggt1398Asp Asn His Cys Ile Pro Tyr Leu Thr Gly Leu Gly Asp Leu Leu Gly445 450 455tca agc tcc gtg ggc cac act gct gct gtg cca aga agg tgt aca gcc1446Ser Ser Ser Val Gly His Thr Ala Ala Val Pro Arg Arg Cys Thr Ala
460 465 470tcc cca gga tgg ggc ctc ata caa ccc ttc atc tgc act caa cat tta 1494Ser Pro Gly Trp Gly Leu Ile Gln Pro Phe Ile Cys Thr Gln His Leu475 480 485atc gtg tcc ttg ctg tct ttt tat ttt cct ttt tgt ttg tta gca aaa 1542Ile Val Ser Leu Leu Ser Phe Tyr Phe Pro Phe Cys Leu Leu Ala Lys490 495 500acc tct att tagatttca ataatcagag aagtgtaaaa taaaacagat tatattgtaa1600Thr Ser Ile505aaaaaaaaaa aaaaaa1616&lt;210&gt;10&lt;211&gt;507&lt;212&gt;PRT&lt;213&gt;智人&lt;400&gt;10Met Asp Gly Thr Glu Thr Arg Gln Arg Arg Leu Asp Ser Cys Gly Lys1 5 10 15Pro Gly Glu Leu Gly Leu Pro His Pro Leu Ser Thr Gly Gly Leu Pro20 25 30Val Ala Ser Glu Asp Gly Ala Leu Arg Ala Pro Glu Ser Gln Ser Val35 40 45Thr Pro Lys Pro Leu Glu Thr Glu Pro Ser Arg Glu Thr Ala Trp Ser50 55 60Ile Gly Leu Gln Val Thr Val Pro Phe Met Phe Ala Gly Leu Gly Leu65 70 75 80Ser Trp Ala Gly Met Leu Leu Asp Tyr Phe Gln His Trp Pro Val Phe85 90 95Val Glu Val Lys Asp Leu Leu Thr Leu Val Pro Pro Leu Val Gly Leu100 105 110Lys Gly Asn Leu Glu Met Thr Leu Ala Ser Arg Leu Ser Thr Ala Ala115 120 125Asn Thr Gly Gln Ile Asp Asp Pro Gln Glu Gln His Arg Val Ile Ser130 135 140
Ser Asn Leu Ala Leu Ile Gln Val Gln Ala Thr Val Val Gly Leu Leu145 150 155 160Ala Ala Val Ala Ala Leu Leu Leu Gly Val Val Ser Arg Glu Glu Val165 170 175Asp Val Ala Lys Val Glu Leu Leu Cys Ala Ser Ser Val Leu Thr Ala180 185 190Phe Leu Ala Ala Phe Ala Leu Gly Val Leu Met Val Cys Ile Val Ile195 200 205Gly Ala Arg Lys Leu Gly Val Asn Pro Asp Asn Ile Ala Thr Pro Ile210 215 220Ala Ala Ser Leu Gly Asp Leu Ile Thr Leu Ser Ile Leu Ala Leu Val225 230 235 240Ser Ser Phe Phe Tyr Arg His Lys Asp Ser Arg Tyr Leu Thr Pro Leu245 250 255Val Cys Leu Ser Phe Ala Ala Leu Thr Pro Val Trp Val Leu Ile Ala260 265 270Lys Gln Ser Pro Pro Ile Val Lys Ile Leu Lys Phe Gly Trp Phe Pro275 280 285Ile Ile Leu Ala Met yal Ile Ser Ser Phe Gly Gly Leu Ile Leu Ser290 295 300Lys Thr Val Ser Lys Gln Gln Tyr Lys Gly Met Ala Ile Phe Thr Pro305 310 315 320Val Ile Cys Gly Val Gly Gly Asn Leu Val Ala Ile Gln Thr Ser Arg325 330 335Ile Ser Thr Tyr Leu His Met Trp Ser Ala Pro Gly Val Leu Pro Leu340 345 350Gln Met Lys Lys Phe Trp Pro Asn Pro Cys Ser Thr Phe Cys Thr Ser355 360 365Glu Ile Asn Ser Met Ser Ala Arg Val Leu Leu Leu Leu Val Val Pro370 375 380Gly His Leu Ile Phe Phe Tyr Ile Ile Tyr Leu Val Glu Gly Gln Ser385 390 395 400Val Ile Asn Ser Gln Thr Phe Val Val Leu Tyr Leu Leu Ala Gly Leu405 410 415
Ile Gln Val Thr Ile Leu Leu Tyr Leu Ala Glu Val Met Val Arg Leu420 425 430Thr Trp His Gln Ala Leu Asp Pro Asp Asn His Cys Ile Pro Tyr Leu435 440 445Thr Gly Leu Gly Asp Leu Leu Gly Ser Ser Ser Val Gly His Thr Ala450 455 460Ala Val Pro Arg Arg Cys Thr Ala Ser Pro Gly Trp Gly Leu Ile Gln465 470 475 480Pro Phe Ile Cys Thr Gln His Leu Ile Val Ser Leu Leu Ser Phe Tyr485 490 495Phe Pro Phe Cys Leu Leu Ala Lys Thr Ser Ile500 50权利要求
1.一种分离的核酸分子,其选自下列(a)包含SEQ ID NO1,3,5或7的分离的核酸分子,(b)编码SEQ ID NO6或8的分离的核酸分子,(c)编码肝癌中表达的蛋白的分离的核酸分子,该核酸分子与SEQ ID NO5的全长连续序列表现出至少大约95%的核苷酸序列同一性,(d)编码肝癌中表达的蛋白的分离的核酸分子,该核酸分子与SEQ ID NO7的全长连续序列表现出至少大约75%的核苷酸序列同一性,和(e)包含(a)、(b)、(c)或(d)的核酸分子的互补链的分离的核酸分子。
2.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO1的155-418位核苷酸组成。
3.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO3的139-402位核苷酸组成。
4.权利要求1中的分离的核酸分子,其中该核酸分子包含SEQ IDNO5的32-1384位核苷酸。
5.权利要求1中的分离的核酸分子,其中该核酸分子包含SEQ IDNO5的32-1387位核苷酸。
6.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO5的32-1384位核苷酸组成。
7.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO7的41-1501位核苷酸组成。
8.权利要求1中的分离的核酸分子,其中该核酸分子包含SEQ IDNO7的41-1504位核苷酸。
9.权利要求1中的分离的核酸分子,其中该核酸分子由SEQ ID NO7的41-1501位核苷酸组成。
10.权利要求1-9中任一权利要求的分离的核酸分子,其中所述核酸分子可操作的连接于一种或多种表达控制元件。
11.包含权利要求1-9中任一权利要求的分离的核酸分子的载体。
12.经转化而含有权利要求1-9中任一权利要求的核酸分子的宿主细胞。
13.含有权利要求11中的载体的宿主细胞。
14.权利要求13的宿主细胞,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
15.一种生产多肽的方法,包括在一定条件下培养被权利要求1-9中任一权利要求的核酸分子转化的宿主细胞,所述条件使得所述核酸分子编码的蛋白可以表达。
16.权利要求15的方法,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
17.由权利要求15的方法生产的分离的多肽。
18.一种分离的多肽或蛋白,其选自下列含有SEQ ID NO2,4,6或8的氨基酸序列的分离多肽;含有SEQ ID NO2或4中至少10个氨基酸的片段的分离多肽;含有SEQ ID NO2或4的保守氨基酸替代的分离多肽;含有SEQ ID NO2或4的天然存在的氨基酸序列变体的分离多肽;与SEQ ID NO2或4表现出至少大约75%氨基酸序列同一性的分离多肽;以及与SEQ ID NO6或8具有至少大约95%氨基酸序列同一性的蛋白。
19.一种分离的抗体或抗原结合型抗体片段,其与权利要求18的多肽结合。
20.权利要求19的抗体,其中所述抗体是单克隆或多克隆抗体。
21.一种鉴定物质的方法,所述物质调控编码权利要求18的蛋白的核酸的表达,该方法包括将表达所述核酸的细胞暴露于所述物质;和确定所述物质是否调控所述核酸的表达,从而鉴定可以调控编码所述蛋白的核酸的表达的物质。
22.一种鉴定物质的方法,该物质调控权利要求18的蛋白或者含有SEQ ID NO10的蛋白的水平或至少一种活性,该方法包括将表达所述蛋白的细胞暴露于所述物质;确定所述物质是否调控所述蛋白的水平或至少一种活性,从而鉴定可以调控所述蛋白的水平或至少一种活性的物质。
23.权利要求22的方法,其中所述物质调控所述蛋白的一种活性。
24.一种鉴定权利要求18的蛋白或者含有SEQ ID NO10的蛋白的结合配偶体的方法,包括将所述蛋白暴露给潜在的结合配偶体;和确定所述潜在的结合配偶体是否结合到所述蛋白,从而鉴定所述蛋白的结合配偶体。
25.一种调控编码权利要求18的蛋白或包含SEQ ID NO10的蛋白的核酸表达的方法,包括施用有效量的物质,该物质调控编码所述蛋白的核酸的表达。
26.一种调控权利要求18的蛋白或者包含SEQ ID NO10的蛋白的至少一种活性的方法,包括施用有效量的物质,该物质调控所述蛋白的至少一种活性。
27.经修饰而含有权利要求1-9中任一权利要求的核酸分子或SEQID NO10的非人类转基因动物。
28.权利要求27的转基因动物,其中该核酸分子含有阻止所编码的蛋白表达的突变。
29.在受试者中诊断疾病状态的方法,包括确定权利要求1-9或18中任一项的核酸分子或蛋白的表达水平、含有SEQ ID NO9的核酸的表达水平或含有SEQ ID NO10的蛋白分子的表达水平。
30.权利要求29的方法,其中所述疾病状态是肝癌。
31.权利要求30的方法,其中所述疾病状态是肝细胞癌。
32.权利要求29的方法,其中所述疾病状态是恶性肿瘤。
33.权利要求32的方法,其中所述恶性肿瘤发生在膀胱,乳房,子宫颈,结肠,肾脏,肺部,子宫肌层,卵巢,胰腺,前列腺,直肠,皮肤,小肠,软组织,脾,胃,睾丸或甲状腺。
34.一种包含稀释剂和多肽或蛋白的组合物,其中所述多肽或蛋白选自下列含有SEQ ID NO2,4,6,8或10的氨基酸序列的分离多肽;含有SEQ ID NO2,4,6,8或10中至少10个氨基酸的片段的分离多肽;含有SEQ ID NO2或4的保守氨基酸替代的分离多肽;含有SEQ ID NO2或4的天然存在的氨基酸序列变体的分离多肽;与SEQID NO2或4表现出至少大约75%氨基酸序列同一性的分离多肽;以及与SEQ ID NO6,8或10表现出至少大约95%氨基酸序列同一性的多肽。
全文摘要
本发明总体上涉及肝细胞癌中基因表达的改变。本发明特别涉及与相应于mRNA种类的人类基因,其中与非癌变的肝组织相比,所述mRNA种类与在癌变的肝组织和癌变的肿瘤中差异表达。
文档编号C07H21/00GK1681834SQ03821780
公开日2005年10月12日 申请日期2003年8月14日 优先权日2002年8月14日
发明者高祥锡, Q·刘, 郑贤镐, W·曾, 李福万, 宋始英 申请人:株式会社Lg生命科学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1