人类肝癌相关抑癌基因llc1及其编码蛋白的应用的制作方法

文档序号:1080277阅读:212来源:国知局
专利名称:人类肝癌相关抑癌基因llc1及其编码蛋白的应用的制作方法
技术领域
本发明涉及分子生物学和基因工程领域,具体地,本发明涉及一种人类肝癌相关的抑癌基因LLC1(Low expression in Liver Cancer 1)及其编码序列。本发明还提供了该基因及其编码蛋白的制备方法和应用。
背景技术
目前我国有慢性肝炎患者约1200万例,每年死于肝病约30万,其50%为原发性肝癌,约占全世界肝癌死亡人数的45%左右。绝大多数与HBV、HCV感染有关。肝癌发病率在我国居2-3位,主要在青壮年男性发病,在华东地区的发病率明显高于其他地区,近年来,有持续上升趋势。在上海,肝癌的发病率居第三位,仅次于肺癌和胃癌。最新资料显示这个比例还有继续上升的趋势。现在,肝癌,特别是肝炎病毒引起的肝癌已经严重危害了我国人民生命安全。因此,非常有必要对肝癌发生的分子机制作深入的研究。
随着人类基因组测序的完成,基因组学的研究重点已经转移到以解析基因功能为主的功能基因组学研究。功能基因组学的重点是以疾病为中心,全力解决人类疾病相关基因研究中的重大科学问题。肝癌在我国素有“国病”之称,经过半个世纪的探索,对于肝癌的早期诊断和治疗虽然有了一定的认识,但肝癌预后仍然很差,特别是对其发病机制的了解及治疗药物的新靶点方面,更是知之甚少。因此,寻找与肿瘤相关的基因,特别是寻找新的抑癌基因是近年来肿瘤研究的热点。
本发明人利用比较基因组学的方法筛选到的LLC1基因定位于8p23,8p23染色体属于杂合子缺失区(loss of heterozygosity,LOH)易发区段。而LOH在肿瘤发生发展过程中起到非常重要的作用,肿瘤通过LOH现象经常发生某一个等位基因的丢失,同时另一等位基因则很容易发生突变。突变的发生会造成基因功能丢失或获得,特别是那些对细胞的生长、增殖、凋亡具有重要调控作用的基因,由于其结构的变异,很容易造成肿瘤的发生。另外,抑癌基因的特点是在机体多种组织均有表达,在细胞生长发育过程中起到控制细胞周期运行的“刹车”的作用。抑癌基因一旦因变异而失去作用,则会引起细胞的无控制生长,进而形成肿瘤。LLC1基因在肝癌中表达丰度明显降低,在机体组织中广泛表达。这些均说明LLC1基因是一个新的抑癌基因。LLC1基因在不同肝癌株中的差异表达,为深入研究工作提供了可用的细胞模型。
LLC1基因所编码的蛋白质内含有BTB和POZ功能域,均属于高度保守的功能结构域,BTB结构域最初是在锌指蛋白中被发现的,在果蝇里,它是属于进化上高度保守的家族,包含一些生长发育调控基因。POZ结构域由120个氨基酸组成,是进化上保守的蛋白质-蛋白质相互作用结构域。在含有C2H2锌指的蛋白质的氨基端,5%~10%含有该结构域,拥有POZ结构域的蛋白质分子多数为转录因子,这些转录因子可通过POZ结构域形成高度紧密扭曲结合的同源二聚体,形成一个较大的疏水表面,每个单体有1/4的表面用于二聚体的分子间作用,这种构象特别适合于同源二聚体的形成,二聚体的表面是由保守氨基酸残基构成的沟,用于和其他蛋白质分子作用。由此可以看出LLC1基因在肝癌的形成过程中很有可能是由于自身的变化(包括表达量的下降和核酸序列的突变等)而引起下游受其调控基因的变化,特别是那些影响细胞周期的基因转录表达改变而致肿瘤的发生。

发明内容
本发明的目的在于提供一种新的肝癌相关的抑癌基因LLC1、其编码的蛋白以及该基因和该蛋白的应用。
本发明的上述目的是通过如下技术方案来实现的本发明提供了一种蛋白多肽在制备治疗原发性肝癌的药物中的应用,所述蛋白多肽具有与SEQ ID NO.2所示氨基酸序列至少70%同源性的序列。优选的,所述的蛋白多肽是含有SEQ ID NO.2序列的多肽。
本发明还提供了一种多核苷酸序列在制备治疗原发性肝癌的药物中的应用,所述的多核苷酸是具有SEQ ID NO1所示的编码序列;或者与SEQ ID NO1中850-2835位核苷酸序列具有至少70%同源性的序列;或者在中度严紧条件下与SEQ ID NO1所示序列杂交的序列。
优选的,所述的多核苷酸编码具有SEQ ID NO2所示氨基酸序列的多肽。
本发明还提供了一种用于诊断和治疗肝癌的试剂盒,所述试剂盒含有下列(I)-(V)中任一所示的序列或者它们的连续片段,(I)SEQ ID NO1所示的编码序列;(II)与SEQ ID NO1中850-2835位核苷酸序列具有至少70%同源性的序列;(III)在中度严紧条件下与SEQ ID NO1所示序列杂交的序列;(IV)具有与SEQ ID NO.2所示氨基酸序列至少70%同源性的序列;(V)含有SEQ ID NO.2序列的多肽。
在本发明的再一方面,还提供了一种用于诊断和治疗肝癌的生物芯片,所述生物芯片的载体上含有下列(i)-(v)的序列或者它们的连续片段,(i)SEQ ID NO1所示的编码序列;(ii)与SEQ ID NO1中850-2835位核苷酸序列具有至少70%同源性的序列;
(iii)在中度严紧条件下与SEQ ID NO1所示序列杂交的序列;(iv)具有与SEQ ID NO.2所示氨基酸序列至少70%同源性的序列;(v)含有SEQ ID NO.2序列的多肽。
根据本发明公开的人类肝癌相关的抑癌基因LLC1及其编码蛋白,对其进行深入的研究有可能发现肝癌发病的新机制,同时,它们也可能作为肝癌治疗的新的靶点,并且可为进一步开发针对肝癌的药物提供重要的参考价值。


图1是LLC1基因表达产物在人、小鼠、大鼠和果蝇中的同源比对结果图,结果显示LLC1基因在物种之间具有保守性;图2是通过RT-PCR验证LLC1基因在肝癌/癌旁组织中的表达差异的电泳结果图,N为癌旁组织,C为癌组织;图3是图2的电泳结果图的灰度扫描的统计结果,由该图可以清晰地看出,有6对标本中为有和无的关系;图4为PCR分析LLC1基因在人的各组织中的分布的RT-PCR电泳结果图;图5为图4电泳结果图的灰度扫描的统计结果;图6为5种肝癌细胞株中LLC1基因表达丰度图。
具体实施例方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New YorkCold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1
肝组织RNA的抽提抽提RNA试剂采用TRIzol reagent(GIBCO/BRL),该试剂是基于酸性酚一步抽提法生产的。用于抽提RNA所用的器皿和水均要进行无RNA酶处理,以保证实验中无RNA酶的环境。
将碾杵和匀浆器等器皿在200℃干烤4h,去除RNA酶,冷却;加入液氮中预冷,将组织从液氮中迅速取出,碾成粉末;用刮匙将组织放入预先加入TRIzol试剂的匀浆器中,匀浆数分钟;将匀浆后的液体转入无RNA酶的离心管中,加入氯仿后,4℃离心分层;将上层水相转入一无RNA酶的离心管中,加异丙醇,4℃离心沉淀RNA;用75%乙醇洗涤沉淀2次;用无RNA酶的去离子水溶解沉淀。抽提的RNA质量鉴定紫外分光光度计测定260/280比值(比值均在1.7~2.0);并在MOPS甲醛变性胶中观察有无降解。
超低温保存。
实施例2cDNA的合成反转录(RT)总RNA1μgoligo dT(10pmol/l) 1μlH2O 补至12μl70℃变性3分钟,置于冰上冷却;再加入 5×Buffer4μlDTT 2μldNTP 1μlSuperScriptII1μl
42℃反应1小时,70℃变性15分钟,置于冰上冷却。
实施例3PCR扩增以β-actin作内对照,反应混合物中各成分为β-actin(F)、β-actin(R)、LLC1(F)、LLC1(R)、10×Buffer、MgCl2、dNTP、Taq DNA聚合酶、cDNA模板分别为0.2、0.2、0.4、0.4、1.0、1.0、0.2、0.1和5μLcDNA模板,最后补充ddH2O使反应体系为10μL。PCR的反应条件是94℃变性5min;然后每个循环94℃30s、53℃30s、72℃30s,共30个循环;最后72℃延伸7min。
其中,β-actin(F)和β-actin(R)分别为引物5’-TCACCCACACTGTGCCCATCTACGA-3’(SEQ ID NO.3),和引物5’-CAGCGGAACCGCTCATTGCCAATGG-3’(SEQ ID NO.4)。
LLC1(F)和LLC1(R)分别为引物5’-TGTCTGAAAAGGCAGTGGTG-3’(SEQ IDNO.5),和引物5’-TACGAAACCAAATCCCGAAG-3’(SEQ ID NO.6)Beta-actin扩增片断长度为400bp,LLC基因的扩增片断长度为245bp。
实施例4LLC1基因的扩增利用PCR技术,以Forward5’-cagcgcagcacagcccggcc-3’(SEQ ID NO.7)和Reverse5’-cgtaggccggcg ggtcggc-3’(SEQ ID NO.8)为引物,可从正常人肝组织中中扩增此基因的全长阅读框(ORF),测定序列,详细序列见SEQ IDNO.1。
实施例5生物信息学分析LLC1基因生物信息学分析其全长为含有6706个碱基,定位于染色体的杂合子缺失易发区段8p23上,含有2个外显子,1个内含子,其开放阅读框长为1985bp,编码一个含有661个氨基酸的蛋白。氨基酸序列详见SEQ ID NO.2。蛋白质等电点在酸性范围内(pI=5.58),其相对分子质量约为65719道尔顿(Dalton)。
生物信息学核酸序列同源比对分析,显示其与鼠类及果蝇均有同源区域。如图1所示。蛋白质同源分析还发现在这个基因编码的蛋白质内含有BTB和POZ结构域,属于高度保守的功能结构域。蛋白质二级结构分析,发现LLC1蛋白中没有信号肽标志,也非跨膜蛋白质。LLC1蛋白定位于细胞浆中。
序列分析发现其含有多种与细胞生长、增殖密切相关的特征性氨基酸位点PKC磷酸化位点(Protein kinase C phosphorylation site,PKC_PHOSPHO_SITE)SgR(147-149aa,193-195aa)、SsR(487-489aa)、TwR(570-572aa);酪蛋白激酶II磷酸化位点(Casein kinase II phosphorylation site,CK2_PHOSPHO_SITE)SesE(22-25aa)、SsgE(44-47aa)、SgeE(45-48aa)、SaaE(56-59aa)、SpeE(87-90aa)、SpeE(93-96aa)、SpeE(119-122aa)、SgaE(277-280aa)、SsrE(487-490aa)、SrgE(510-513aa)、SlpE(610-613aa);肉豆蔻基位点(N-myristoylation site,MYRISTYL)GTepGA(13-18aa)、GAslCF(38-43aa)、GSagAA(81-86aa)、GAvyGE(134-139aa)、GVslTA(178-183aa)、GCglCV(351-356aa)、GVapAG(366-371aa)、GVsvSR(521-526aa)、GGptGL(545-550aa)、GAiyCV(560-565aa)、GGdaGQ(582-587aa)、GQggGF(586-591aa)、GGfeAL(589-594aa);Amidation位点(AMIDATION site)sGRR(147-150aa);Cell attachment sequenceRGD(322-324aa);BTB domain140-196aa;脯氨酸富含区(Proline-rich region,PRO_RICH)100-131aa。
实施例6LLC1基因在肝癌及其癌旁组织中的表达利用RT-PCR技术检测LLC1基因在24对肝癌/癌旁组织中的表达。24例肝癌及癌旁组织均为HBV阳性的原发性肝癌的手术病人。手术切除的肝脏一经离体,迅速切取病灶及周围正常组织,放入液氮中(-80℃)保存。发现肝癌组织LLC1的表达明显低于癌旁组织,其中有16对下调,所占比率高达63%(p<0.01)。其中有6对接近有和无的关系。结果见图2和图3。
实施例7LLC1基因在人体正常组织中的表达为了解LLC1基因在人体各组织中的表达。分别提取人的各组织的总RNA,包括脾、心,脑,小肠,胰脏,肌肉,肺,睾丸,肾,肝组织。以上述引物,RT-PCR检测LLC1基因在人各组织中的表达。由图可以看出在各组织中呈广泛表达的趋势,但肝与脑的表达量最高。结果见图4和图5。
实施例8不同肝癌细胞株中LLC1基因的表达以5种肝癌细胞株(PLC,QGY-7703,Bel-7402,HepG2和Hep3B)的RNA为模板,用同样的引物进行RT-PCR分析发现Hep3B中LLC1基因表达丰度最高、Bel-7402,PLC和HepG2次之、QGY-Q7703最弱。结果见图6。
序列表<110>上海人类基因组研究中心<120>人类肝癌相关抑癌基因LLC1及其编码蛋白的应用<130>NP-1302<160>8<170>PatentIn version 3.2<210>1<211>6706<212>DNA<213>Homo sapiens<220>
<221>CDS<222>(850)..(2835)<400>1agcccacccg cctggctgcg cgtcccgggc ccggcggctg aagaggagcc gcggcgagga60acaagagtgt ggtgagagga cgcggaaaca cctgatatcc cagcaaagga agctgcagag120gaagggtcct gccccgtgag cgaggacagc ctccaggagc acagcggctt ctcctaacat180ccccctggca gtgaattacg gatgaccccg tatatgagga ggtgtggatg ccgacacacg240gggagagctc ctgagaccag cacacaggac cagtgtcctc cccgtgacct tgcagttgtg300tagccacaag tgggagccac agagaaggag agcccataag gggactcttt tcaagacacg360gtgttaaatc aaggctctga agttggggcc acagccggtc tcagctttct gtgttctggg420ggcgcggtga tatgacagca tgtgaagtga gtgggtgagc acggactcct gagagcgagg480gcgcacccaa tacctagtta tccggtactg cagagagaca cctggtcagc cagcgttgca540aagagggata gctagtcact caggctgcag agagagacac ctggtcaccc aggctgcaga600aacaaccgca gtcaactgca gctccagtca ttgctggatg ttggctgacg cggtcctggc660gccagctgga gatccattca ccaagacttt ctgggcagat ttaaagtggc tggggttcag720
aagttcagca agttggacac acccctcctc gctggagagg agagggcaaa ggcgaggcgg780gggagcagcg tgtgagattc cccccttcac acacacaaca aagcgtggac acacagaagt840gaaatctga tcg cgt gcc agg aaa agc tgt gag gct gga aac ccc gga gta891Ser Arg Ala Arg Lys Ser Cys Glu Ala Gly Asn Pro Gly Val1 5 10agg ctc gac ctt ggc cag acc tgc agg ctg cgg aac cgg ggg cgc gcg 939Arg Leu Asp Leu Gly Gln Thr Cys Arg Leu Arg Asn Arg Gly Arg Ala15 20 25 30ggc gca gcg cag cac agc ccg gcc atg gag cac gcg gtg gcc ccc tgc 987Gly Ala Ala Gln His Ser Pro Ala Met Glu His Ala Val Ala Pro Cys35 40 45gtc ctc tac cca ggg act gag ccc ggg gct gcc ggg gag agc gag agc 1035Val Leu Tyr Pro Gly Thr Glu Pro Gly Ala Ala Gly Glu Ser Glu Ser50 55 60gag ggc gcc gcg tcc ccg gcg cag aca ccc tgc agt ctc ggc gcg tcc 1083Glu Gly Ala Ala Ser Pro Ala Gln Thr Pro Cys Ser Leu Gly Ala Ser65 70 75ctg tgc ttc agc tcc ggg gaa gag tcc ccg ccg cag tcc ctc gcc tca 1131Leu Cys Phe Ser Ser Gly Glu Glu Ser Pro Pro Gln Ser Leu Ala Ser80 85 90gcg gcg gaa ggc gcg gcc acc tcc ccg ccc tcc agc ggt ggc ccg cgg 1179Ala Ala Glu Gly Ala Ala Thr Ser Pro Pro Ser Ser Gly Gly Pro Arg95 100 105 110gtg gtg gag cgg cag tgg gag gcc ggc agc gcg ggc gcc gcg tcc ccg 1227Val Val Glu Arg Gln Trp Glu Ala Gly Ser Ala Gly Ala Ala Ser Pro115 120 125gag gag ctc gcg tcc cct gag gag cgc gcg tgc ccg gaa gag ccc gcg 1275Glu Glu Leu Ala Ser Pro Glu Glu Arg Ala Cys Pro Glu Glu Pro Ala130 135 140gcg ccg tcc ccc gaa ccg cgc gtt tgg ctt gag gac ccc gcg tcc ccc 1323Ala Pro Ser Pro Glu Pro Arg Val Trp Leu Glu Asp Pro Ala Ser Pro145 150 155
gag gag ccc ggg gag ccc gcg ccc gta ccc ccg ggg ttc ggg gcg gtg1371Glu Glu Pro Gly Glu Pro Ala Pro Val Pro Pro Gly Phe Gly Ala Val160 165 170tac ggg gag ccg gac ctg gtg ctg gag gtg tcg ggg cgc cgg ctg cgc1419Tyr Gly Glu Pro Asp Leu Val Leu Glu Val Ser Gly Arg Arg Leu Arg175 180 185 190gcg cac aag gcg gtg ctg gcg gcg cgc agc gac tac ttc cgc gcg cgc1467Ala His Lys Ala Val Leu Ala Ala Arg Ser Asp Tyr Phe Arg Ala Arg195 200 205gcg tcg cgg gac gtg ctg cgg gtg cag gga gtg agc ctg acg gcg ctg1515Ala Ser Arg Asp Val Leu Arg Val Gln Gly Val Ser Leu Thr Ala Leu210 215 220cgg ctg ctc ctc gcc gac gcc tac agc ggg cgc atg gcg ggc gtg cgg1563Arg Leu Leu Leu Ala Asp Ala Tyr Ser Gly Arg Met Ala Gly Val Arg225 230 235ccc gac aac gtg gcc gag gtg gtg gcc ggc gcg cgc cgc ctg cag ctg1611Pro Asp Asn Val Ala Glu Val Val Ala Gly Ala Arg Arg Leu Gln Leu240 245 250ccc ggc gcc gcg cag cgc gcc acc gac gcc gtg ggg ccg cag ctg agc1659Pro Gly Ala Ala Gln Arg Ala Thr Asp Ala Val Gly Pro Gln Leu Ser255 260 265 270ctg gcc aac tgc tac gag gtc ctg agc gcg gcc aag cgg cag cgg ctg1707Leu Ala Asn Cys Tyr Glu Val Leu Ser Ala Ala Lys Arg Gln Arg Leu275 280 285aac gag ctg cgc gac gcc gcc tac tgc ttc atg agc gac cac tat ctg1755Asn Glu Leu Arg Asp Ala Ala Tyr Cys Phe Met Ser Asp His Tyr Leu290 295 300gag gtg ctg cgc gag ccc gcc gtg ttc ggc cgc ctg tcg ggc gca gag1803Glu Val Leu Arg Glu Pro Ala Val Phe Gly Arg Leu Ser Gly Ala Glu305 310 315cgg gac ctg ctg ctg cgc cgc cgc ctg cgc gcc ggc cgc gcc cac ctc1851Arg Asp Leu Leu Leu Arg Arg Arg Leu Arg Ala Gly Arg Ala His Leu320 325 330
ttg gcc gcg gcg ctc ggg ccg gcg ggg gag cgc gcg ggc agc cgg cct1899Leu Ala Ala Ala Leu Gly Pro Ala Gly Glu Arg Ala Gly Ser Arg Pro335 340 345 350cag agc ccc tcg ggg gac gcg gac gcg cgc ggg gac gcg gcc gtc tac1947Gln Ser Pro Ser Gly Asp Ala Asp Ala Arg Gly Asp Ala Ala Val Tyr355 360 365tgc ttc cac gcg gcg gcc gga gag tgg cgc gag ctg acg cgg ctg ccc1995Cys Phe His Ala Ala Ala Gly Glu Trp Arg Glu Leu Thr Arg Leu Pro370 375 380gag ggc gcg ccg gcg cgg ggc tgc ggc ctg tgc gtc ctc tac aac tac2043Glu Gly Ala Pro Ala Arg Gly Cys Gly Leu Cys Val Leu Tyr Asn Tyr385 390 395ctc ttc gtg gcg ggc ggc gtg gcg ccc gcg ggc ccc gac ggc cgc gcg2091Leu Phe Val Ala Gly Gly Val Ala Pro Ala Gly Pro Asp Gly Arg Ala400 405 410cgc ccg tcc gac cag gtc ttc tgc tac aac ccg gcc acg gac agc tgg2139Arg Pro Ser Asp Gln Val Phe Cys Tyr Asn Pro Ala Thr Asp Ser Trp415 420 425 430agc gcc gtg agg ccc ctg cgc cag gcg cgc tcg cag ctg cgg ctg ctg2187Ser Ala Val Arg Pro Leu Arg Gln Ala Arg Ser Gln Leu Arg Leu Leu435 440 445gcc ctg gac ggt cac ctc tac gcc gtg ggc ggc gag tgc ctg ctc agc2235Ala Leu Asp Gly His Leu Tyr Ala Val Gly Gly Glu Cys Leu Leu Ser450 455 460gtg gag cgc tac gac ccg cgc gcc gac cgc tgg gcc ccc gtg gcg ccg2283Val Glu Arg Tyr Asp Pro Arg Ala Asp Arg Trp Ala Pro Val Ala Pro465 470 475ctg ccc cgg ggc gcc ttc gcc gtg gcg cat gag gcc acc acc tgc cac2331Leu Pro Arg Gly Ala Phe Ala Val Ala His Glu Ala Thr Thr Cys His480 485 490ggc gag atc tac gtg tcc ggg ggc tcc ctc ttc tat cgc ctg ctc aag2379Gly Glu Ile Tyr Val Ser Gly Gly Ser Leu Phe Tyr Arg Leu Leu Lys495 500 505 510tat gac ccg cgg cgc gac gag tgg cag gag tgc ccg tgc agc agc agc2427
Tyr Asp Pro Arg Arg Asp Glu Trp Gln Glu Cys Pro Cys Ser Ser Ser515 520 525cgc gag cgc tcg gcc gac atg gtg gct ctc gac ggc ttc atc tac cgc2475Arg Glu Arg Ser Ala Asp Met Val Ala Leu Asp Gly Phe Ile Tyr Arg530 535 540ttc gat ctg agc ggc agc cgc ggc gag gcg cag gcg gcg ggg ccg agc2523Phe Asp Leu Ser Gly Ser Arg Gly Glu Ala Gln Ala Ala Gly Pro Ser545 550 555ggg gtc agc gtg tcc cga tac cac tgc ctg gcc aag cag tgg agc ccg2571Gly Val Ser Val Ser Arg Tyr His Cys Leu Ala Lys Gln Trp Ser Pro560 565 570tgc gtc gcg ccc ctg cgc ctc ccc ggc ggc ccc acg ggc ctg cag ccc2619Cys Val Ala Pro Leu Arg Leu Pro Gly Gly Pro Thr Gly Leu Gln Pro575 580 585 590ttc cgc tgc gcc gcc ctg gac ggc gcc atc tac tgc gtg agc cgc gcg2667Phe Arg Cys Ala Ala Leu Asp Gly Ala Ile Tyr Cys Val Ser Arg Ala595 600 605ggc acc tgg cgc ttc cag cct gcc cgg gaa ggc gag gcc ggc ggc gac2715Gly Thr Trp Arg Phe Gln Pro Ala Arg Glu Gly Glu Ala Gly Gly Asp610 615 620gca ggc cag ggc ggc ggc ttc gag gcg ctg ggc gcc ccc ttg gac gtc2763Ala Gly Gln Gly Gly Gly Phe Glu Ala Leu Gly Ala Pro Leu Asp Val625 630 635cgg ggt gtg ctc atc ccg ttc gct ctc agc ctg cct gag aag ccg ccc2811Arg Gly Val Leu Ile Pro Phe Ala Leu Ser Leu Pro Glu Lys Pro Pro640 645 650cga ggg gag cag ggc gcc ccg tag gccggcgggg tcggcgggcg tctccctcgg 2865Arg Gly Glu Gln Gly Ala Pro655 660caggggtttg cggggcccag gtccctttgg gcccgcggag gaggacgtgg tggggagtcg 2925gggccgctgg ccacgctggt ggtttggaca cttcgaagga gccccgagga cgctctcagg 2985gccgctttcg ctttgctttc cttttgcttg tctttgcttc tgggggtgga tgccttgaga 3045
cccaggaggt gtgcggatgg gtcccttgac agacaggaca cagagaaggc tgtgggatcc3105aaagggtcag cctcagggta cagtgggggt tcctgaggca gcctgcagcc ggccccgggg3165tgtcccgaac cccgcagagc accgaggctg tgcgcaggag cctgggaccc tcaagtaggt3225cgccgcgaac tatcggggga agcacgcaga gaggggtcac gccttttatt tttggcttga3285gatttaaaat tataactgat aagtaaagct ctttctgatt tagttgaaaa tttcgtacca3345tgtgctcgct ttggttggct caactccaaa aagagtaatt taataagcat taaaggtaaa3405atctttgatt accagtaagg tttcttgttc aatatgcatt ggaagtattt ccttccccac3465accattgcta ctcaaactca catgcctaga gcagctccgt ctcactgttg gaccgagggg3525gctttcatat tttcagttga aaggatgtta actgatgtag cgatgattta ccattattta3585aattttaagt cttcagtggc taaatgtgac caaacagcac atcataagta ggaaaaactt3645accagggtgc ttgtctatct aaaaagcaat ttttgatagt ccactctgta tgcccagccg3705ctttcataat ctggaacgag ataaaatatt cctaaaaagc ggggaaaatc attttgcttt3765gacagttcta taaaaaaaag tgtaggcaca ttttaaaccc actgtatatg atgttttcaa3825tgtggatcgt gtagttctga tgagggagat taatttttac aatcagtatt ctaagtgtgg3885ccgagtgaca gtgggcatag atttataaca aggaagtgac gtgcttatca ccatagattt3945gcaagtaaac tgcatgtatt taattgtatt gaattgagtt ccaaaatacc ctaatagaat4005taacacgagg ctcactgcat tgacagggta tgaggattaa aaacaaatca gttgggtcgt4065ttctcattta acattttact tttcaagtgt gtatacagag gacttactat tatgactttg4125aggatgagat ccatgctcac aaatagaggc gaacatttga actccgaatc caacccattt4185tcttactgta agaggaaaag ttactggaac gtaactagtt gaaatcctgc ctactttaat4245attatttgtt tgttaatcca gtaatgggaa ctgccatctc tgtagaaatc agtgggtaat4305tgaaaaatag gttatgcttt ttaaagagtc tgtggttatg agaggtctca gttaagtgtg4365tttagaagtg atcagcttga accttatgca tgactcgggg gctggaattt atgatctggg4425
ttacggtatg ttctggggac gtgtctgctt gcccatggtt actcatgaac tgaggggata4485gcttggcaac ttggttaatc atcttgggaa agaaaaacag acttcatatc gcctgacttg4545attggccttt tataggagta tactggagaa atggttgtag aaacagtatt tacagcaaaa4605ggaaacaaat aatgttcatt ttaagcaatg taccattcac actgtcctgc cttttcctct4665agaattttat taatggtaga aatttttata tgaaatggga ccaggaccag gctaatattt4725tcagtcctta aatatcaaac tcatatgctg ttatcactgt gattttactt gtgaaatcat4785tcctgtaatg tttagtgttt gaaaatgaaa tattgaaatt aggtttccag agtaacactg4845tccccggaaa aggatatgag aagtggtgga tgttggatgg gggtggttgc acagtcctgt4905gcggttccca tggctttcca gcgtttcatt tagtgaagga atgctcacac tagatgtagc4965acagcttcct gtggggcccg gcagcaaagc cccaggtgct ccctgtcacc tcacaacaaa5025atgcactaag aaacgtaaag aataagagga attaataccc accattaaag gatgtccggc5085caacctattg tggaaattta tagaatagta tacaccacag ttctgaatag tgatatcaca5145taaaaataca tactagagga cctgccaagc catgagcagt gtttttgctt tttgggggcc5205agtccctggg gtgtggagcc gctagggttt gcacccatga aacagaaaag ccacaccctc5265caaggtgtgg ctttcatttt gggactgctg cagggagggc agaggcattg ctgagactgc5325ctggcaacgg ctgatgcccc aggtaggacc ttttccattt caaagtggtg ttctaagtct5385gcgtccaaca ctgtgtagga aaaaggttgg tgcaaaaata ttcctggtca tccacccatt5445aaaatagtta gatgaggcta ttgccttgat gacagctgtc cacactcctc atgaaattaa5505cccgtatgcc ggggcatttc caaatgtctg actcgtgaaa ttaacccata cgcaggggcc5565tttccaaatg tctgaaaagg cagtggtgtc ttttggggaa aatgttatgc atggaagcct5625gaccttttgc ttagttgaca gcaatccctt ctgtattgcc aatcaaggtt catttgagat5685gcagaggaat gagcttgagc cttcctcctt ttccttccgg ttttattctt cctcttggga5745acatccctcc actccgcact gcttcctgca gctttgtaga gctggatttg gaacttcggg5805
atttggtttc tgagtctgtg gaggcaccga cttctcctgt aagaaaatga atgttgtgga5865aattctttgg ctacttaact aaaactcgtg actgtataag tttggctaca aataagtaag5925aaattaatca tctgctctgt ttctgctaat ttctggtgtc acttcagtaa ttctggtagc5985agccgttgaa tctgtcagtc tcttaggtaa cttcctgtaa acgatttgga aataggatgt6045tttcaacgtt cttttgtctt ttgctgaagt caggatagat tcaagacata atctcttgta6105agatctaaat agagcaaatg taaacaaaag tgcatttttg tattcttgtt aattttagat6165gctttcctag cttacaaaaa gttctatttt tgggttaaaa atcaatcaac tttctgatat6225ttccccttct gcaatgttat tgttcataag aaaacacgag ctgaaaatgg aaatctgcag6285ttgtttcagt tgtcttgaat ttctttcagt ggccacatca tttccacgtt ttccacatcc6345gggaggaagc ctggactgtg cagccttcgg gcacccggca cagacactgt gctggcagga6405gcttcagaca cgccaagtgg atggatttgg attgaacgca tatgaaacag gagacgggtt6465ctcatgtgag atcaaagctc ctccaaagcc tgttcaagct ctaagcgatt ctcaaatgtt6525accatttatt aaaggtaaac tacacctgtt gaaggccaag ttcagggcag ctgttgtgat6585ctgtgtagtt aatgtattta ttaatgcttg acttttaaaa tcctgggcat aaatagtgca6645gagcctcgta tgtttgtcag ttcatgccga gatgaaataa atcacgcaga aagtgccagt6705c6706<210>2<211>661<212>PRT<213>Homo sapiens<400>2Ser Arg Ala Arg Lys Ser Cys Glu Ala Gly Asn Pro Gly Val Arg Leu1 5 10 15
Asp Leu Gly Gln Thr Cys Arg Leu Arg Asn Arg Gly Arg Ala Gly Ala20 25 30Ala Gln His Ser Pro Ala Met Glu His Ala Val Ala Pro Cys Val Leu35 40 45Tyr Pro Gly Thr Glu Pro Gly Ala Ala Gly Glu Ser Glu Ser Glu Gly50 55 60Ala Ala Ser Pro Ala Gln Thr Pro Cys Ser Leu Gly Ala Ser Leu Cys65 70 75 80Phe Ser Ser Gly Glu Glu Ser Pro Pro Gln Ser Leu Ala Ser Ala Ala85 90 95Glu Gly Ala Ala Thr Ser Pro Pro Ser Ser Gly Gly Pro Arg Val Val100 105 110Glu Arg Gln Trp Glu Ala Gly Ser Ala Gly Ala Ala Ser Pro Glu Glu115 120 125Leu Ala Ser Pro Glu Glu Arg Ala Cys Pro Glu Glu Pro Ala Ala Pro130 135 140Ser Pro Glu Pro Arg Val Trp Leu Glu Asp Pro Ala Ser Pro Glu Glu145 150 155 160Pro Gly Glu Pro Ala Pro Val Pro Pro Gly Phe Gly Ala Val Tyr Gly165 170 175Glu Pro Asp Leu Val Leu Glu Val Ser Gly Arg Arg Leu Arg Ala His180 185 190Lys Ala Val Leu Ala Ala Arg Ser Asp Tyr Phe Arg Ala Arg Ala Ser195 200 205
Arg Asp Val Leu Arg Val Gln Gly Val Ser Leu Thr Ala Leu Arg Leu210 215 220Leu Leu Ala Asp Ala Tyr Ser Gly Arg Met Ala Gly Val Arg Pro Asp225 230 235 240Asn Val Ala Glu Val Val Ala Gly Ala Arg Arg Leu Gln Leu Pro Gly245250 255Ala Ala Gln Arg Ala Thr Asp Ala Val Gly Pro Gln Leu Ser Leu Ala260 265270Asn Cys Tyr Glu Val Leu Ser Ala Ala Lys Arg Gln Arg Leu Asn Glu275 280 285Leu Arg Asp Ala Ala Tyr Cys Phe Met Ser Asp His Tyr Leu Glu Val290 295 300Leu Arg Glu Pro Ala Val Phe Gly Arg Leu Ser Gly Ala Glu Arg Asp305 310315 320Leu Leu Leu Arg Arg Arg Leu Arg Ala Gly Arg Ala His Leu Leu Ala325 330 335Ala Ala Leu Gly Pro Ala Gly Glu Arg Ala Gly Ser Arg Pro Gln Ser340 345 350Pro Ser Gly Asp Ala Asp Ala Arg Gly Asp Ala Ala Val Tyr Cys Phe355 360 365His Ala Ala Ala Gly Glu Trp Arg Glu Leu Thr Arg Leu Pro Glu Gly370 375 380
Ala Pro Ala Arg Gly Cys Gly Leu Cys Val Leu Tyr Asn Tyr Leu Phe385 390 395 400Val Ala Gly Gly Val Ala Pro Ala Gly Pro Asp Gly Arg Ala Arg Pro405 410 415Ser Asp Gln Val Phe Cys Tyr Asn Pro Ala Thr Asp Ser Trp Ser Ala420 425 430Val Arg Pro Leu Arg Gln Ala Arg Ser Gln Leu Arg Leu Leu Ala Leu435 440 445Asp Gly His Leu Tyr Ala Val Gly Gly Glu Cys Leu Leu Ser Val Glu450 455 460Arg Tyr Asp Pro Arg Ala Asp Arg Trp Ala Pro Val Ala Pro Leu Pro465 470 475 480Arg Gly Ala Phe Ala Val Ala His Glu Ala Thr Thr Cys His Gly Glu485 490 495Ile Tyr Val Ser Gly Gly Ser Leu Phe Tyr Arg Leu Leu Lys Tyr Asp500 505 510Pro Arg Arg Asp Glu Trp Gln Glu Cys Pro Cys Ser Ser Ser Arg Glu515 520 525Arg Ser Ala Asp Met Val Ala Leu Asp Gly Phe Ile Tyr Arg Phe Asp530 535 540Leu Ser Gly Ser Arg Gly Glu Ala Gln Ala Ala Gly Pro Ser Gly Val545 550 555 560Ser Val Ser Arg Tyr His Cys Leu Ala Lys Gln Trp Ser Pro Cys Val565 570 575
Ala Pro Leu Arg Leu Pro Gly Gly Pro Thr Gly Leu Gln Pro Phe Arg580 585 590Cys Ala Ala Leu Asp Gly Ala Ile Tyr Cys Val Ser Arg Ala Gly Thr595 600 605Trp Arg Phe Gln Pro Ala Arg Glu Gly Glu Ala Gly Gly Asp Ala Gly610 615 620Gln Gly Gly Gly Phe Glu Ala Leu Gly Ala Pro Leu Asp Val Arg Gly625 630 635 640Val Leu Ile Pro Phe Ala Leu Ser Leu Pro Glu Lys Pro Pro Arg Gly645 650 655Glu Gln Gly Ala Pro660<210>3<211>25<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>3tcacccacac tgtgcccatc tacga 25<210>4<211>25<212>DNA<213>人工序列
<220>
<221>misc_feature<223>引物<400>4cagcggaacc gctcattgcc aatgg 25<210>5<211>20<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>5tgtctgaaaa ggcagtggtg 20<210>6<211>20<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>6tacgaaacca aatcccgaag 20<210>7<211>20<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物
<400>7cagcgcagca cagcccggcc 20<210>8<211>19<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>8cgtaggccgg cgggtcggc 19
权利要求
1.一种蛋白多肽在制备治疗原发性肝癌的药物中的应用,其特征在于,所述蛋白多肽具有与SEQ ID NO.2所示氨基酸序列至少70%同源性的序列。
2.如权利要求1所述的一种蛋白多肽在制备治疗原发性肝癌的药物中的应用,其特征在于,所述的蛋白多肽是含有SEQ ID NO.2序列的多肽。
3.一种多核苷酸序列在制备治疗原发性肝癌的药物中的应用,其特征在于,所述的多核苷酸是具有SEQ ID NO1所示的编码序列,或者与SEQ ID NO1中的850-2835位核苷酸序列至少有70%同源性的序列,或者在中度严紧条件下与SEQ ID NO1所示序列杂交的序列。
4.如权利要求3所述的一种多核苷酸序列在制备治疗原发性肝癌的药物中的应用,其特征在于,所述的多核苷酸编码具有SEQ ID NO2所示氨基酸序列的多肽。
5.一种用于诊断和治疗肝癌的试剂盒,其特征在于所述试剂盒含有下列(I)-(V)的序列或者它们的连续片段,(I)SEQ ID NO1所示的编码序列;(II)与SEQ ID NO1中的850-2835位核苷酸序列至少有70%同源性的序列;(III)在中度严紧条件下与SEQ ID NO1所示序列杂交的序列;(IV)具有与SEQ ID NO.2所示氨基酸序列至少70%同源性的序列;(V)含有SEQ ID NO.2序列的多肽。
6.一种用于诊断和治疗肝癌的生物芯片,其特征在于所述生物芯片的载体上含有下列(I)-(V)的序列或者它们的连续片段,(i)SEQ ID NO1所示的编码序列;(ii)与SEQ ID NO1中的850-2835位核苷酸序列至少有70%同源性的序列;(iii)在中度严紧条件下与SEQ ID NO1所示序列杂交的序列;(iv)具有与SEQ ID NO.2所示氨基酸序列至少70%同源性的序列;(v)含有SEQ ID NO.2序列的多肽。
全文摘要
本发明公开了一种人类肝癌相关基因LLC1及其编码蛋白应用。人类LLC1基因定位于染色体8p23.3区段,全长为6706 bp,含有2个外显子,1个内含子,其开放阅读框长为1985 bp,编码一个含有661个氨基酸的蛋白。该基因在67% (16/24)肝癌组织中呈现下调趋势。同时其在人体内多种组织均有表达。根据本发明公开的人类肝癌相关基因LLC1是一个新的抑癌基因,对其进行深入的研究有可能发现肝癌发病的新机制,同时,它们也可能作为肝癌治疗的新的靶点,并且可为进一步开发针对肝癌的药物提供重要的参考价值。
文档编号A61K38/16GK1706492SQ200410025019
公开日2005年12月14日 申请日期2004年6月9日 优先权日2004年6月9日
发明者黄健, 於莉, 韩泽广 申请人:上海人类基因组研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1