肝癌高表达基因peg10、其编码蛋白及其应用的制作方法

文档序号:3575299阅读:342来源:国知局
专利名称:肝癌高表达基因peg10、其编码蛋白及其应用的制作方法
技术领域
本发明涉及生物技术领域,具体地,本发明涉及一种主要在人类肝癌组织中高表达的印迹基因PEG10及其编码蛋白;此外,本发明还涉及PEG10基因的应用。
背景技术
1986年著名生物学家诺贝尔奖获得者RenatoDulbecco在Science杂志上率先提出“人类基因组计划”(Human Genomic Pr山ect,简称HGP),该建议的提出引发了科学界长达三年的激烈争论。1990年10月美国政府决定出资30亿美元正式启动“人类基因组计划”,预期到2005年拿到人体的全部基因序列(共约30亿个核苷酸全序列);随后研究其相互作用和基因功能,从而揭开人类全部遗传信息之谜,使人类对自身的认识达到一个新的高度。
人类基因组计划可以说是人类有史以来最为伟大的认识自身的世纪工程之一。1997年底,有人提出HGP的最终目标应该是提供生物学周期表,这个周期表的“元素”就是决定人类一切性状的10-14万个基因。完成30亿个碱基的测序只不过为这个目标打下了结构上的基础(即结构基因组学),而比较基因组学(包括其编码的蛋白质)和整个基因组的功能研究(功能基因组学)在基因组的价值发现上才能直接发挥其重要作用。随着基因组学的发展,人们设计和创造了许多重要的生物分子,广泛用于制药、农业、食品、化工、化妆品、环境、能源等各领域,不仅会推动科学的进步,还将产生惊人的经济效益,从而引发产业革命,以基因组学为基础的生命科学工业已经形成。人类有限的基因资源正在做着一次性分配,获取基因效率最高和数量最多的企业,有望利用其基因专利来垄断未来生物和制药工业市场。比尔.盖茨曾说下一个创造出更大财富的人将出现在基因领域。
随着基因组计划的迅猛发展,攻克包括肝癌在内的恶性肿瘤在不久的将来将成为现实。我国是原发性肝细胞肝癌(primaryhepatocellularcarcinoma,HCC)的高发地区,其死亡率已占我国部分农村和城市的第一、二位,是严重影响我国人民健康的重大疾病,每年世界上有38.6万人死于肝癌,而其中的45%是在中国。目前认为,肝癌的发生、发展,亦和其它恶性肿瘤一样,是多基因、多因素参与的复杂过程,包括体细胞基因突变、抑癌基因的丢失、癌基因的激活和过表达等等,许多癌基因、抑癌基因,及相关基因的异常激活或失活是肝癌发生的分子基础。从理论上讲,应该有更多的基因参与其中,但目前已发现的许多基因,其详尽功能仍不十分清楚。目前已证明与人类肝癌相关的癌基因或异常表达基因包括;pTEN、p21、p27、p73、p15、p53、RBl、APC、nm23、P16、MXR7、IGF-I、TGFO、HGF-R(C-met)/HGF、c-fins(CSF-IR)、c-erbB-1(EGF-R)/c-erbB-2(neu)、Ras、Raf、c-myc、c-ets-2等等,但没有一个为肝癌特异性表达基因,因此,寻找新的肝癌异常表达或缺失基因,从基因水平认识肝细胞的生长、分化、再生和癌变的分子机理,并阐明其信号传递过程与途径,不仅有重要的生物学意义,而且对于肝癌的早期基因诊断和信息治疗,均具有重大的临床应用意义和经济开发价值,在人类基因组的研究中也能占领新的制高点。
随着分子生物学技术的迅猛发展,寻找、分离基因的新方法不断出现,主要有以下四种1、从eDNA或mRNA出发的方法利用细胞基因表达的差异宋分离致病基因是一类重要方法,目前进展较快。包括cDNA消减杂交法、mRNA差异显示技术、EST(Expressed sequence tags)差异杂交筛选等;2、从分析蛋白质入手;根据蛋白的位置、结合特点或部分功能出发,先分离所需蛋白,再得到相应的基因。包括免疫沉淀法、双向电泳法、酵母双杂交系统法等;3、从寻找基因组DNA片段出发寻找到与目标基因座位紧密连锁的遗传标记或部分功能信息,从而确定某性状相关的基因在基因组中某区段的位置,然后再利用不同方法找到该区段染色体内的表达序列,最终克隆到目的基因。包括复杂探针筛库法、Northern杂交法、剪接位点筛选法、CpG岛筛选法、种间同源序列杂交法、PCR直选法、外显子捕获、一致序列克隆法等;4、从全基因组出发根据有关基因的效应直接分离该基因的克隆,而不必事先探知其生化功能或图谱定位,也不需要假设基因的数目或其相互作用方式,包括基因组错配扫描及代表性差别分析等。上述寻找新基因的方法各有利弊,使用哪一种方法,应根据各自实验室的条件与优势,扬长避短,采取切实可行的方法。
1992年美国学者LiangPeng等首次应用mRNA差别显示技术分离和鉴定不同组织和细胞间的基因表达,使用该方法,人们已经发现了大量的未知基因,如Liang等,用该方法比较正常乳腺和乳腺癌的mRNA,发现了全长600bp的S1基因Chen等(ChenSL,MaroulakouIG,GreenJE,et al.Isolation and characterizationofnovelgene expressed inmultiple cancers,Oncogene,199612(4)741-751)用该方法发现了一个新基因N8,全长2.4kb,定位于8q13染色体上,在肺癌组织中过表达;日本学者Shibabara等(ShibaharaK;AsanoM;IshidaY;Aoki T;KoikeT;Ho山OT,IsolationofanovelmousegeneMA-3thatiSinduceduponprogrammed celldeath,Gene,1995Dec,166(2)297-301)用该方法分离到一个引起细胞程序性死亡的新基因MA-3,等等。但是DDPCR技术目前尚存在一些不足,近年来虽然一些学者已在这方面做了许多改进,如引物设计的合理性、如何减少假阳性等,但仍需不断完善,相信DDPCR技术的不断完善,将会在生命科学领域中成为十分有用的工具。
因此,为治疗和诊断目的研究和开发在肝癌中高表达的基因和/或蛋白具有重要意义。本领域迫切需要新的在肝癌中高表达的基因和/或蛋白。
印迹基因PEG10,定位于人类染色体7q21上,PEG10位于SGCE基因附近,其小鼠同族体最近显示被印迹。因此在人类染色体7q21中很可能存在一类新的印迹基因群。两种预知的公开阅读框架(ORF1 and ORF2)的分析显示ORF1和ORF2相对于一些脊椎动物的蛋白质是同源的。有胎盘的PEG10在早期缺氧阶段是低调节的,在怀孕的11-12周内是高活性的。PEG10的外因表达对致瘤活性有作用。PEG10蛋白质与媒介SIAH1相关联,PEG10的过量表达降低了媒介SIAH1的细胞死亡。结构显示,印迹基因PEG10在人类肝细胞的肝脏再生及抑癌中会起到重要的作用。
鉴于印迹基因PEG10的重要功能,研究和开发印迹基因PEG10具有重要意义。

发明内容
本发明要解决的技术问题之一是提供一种在肝癌中高表达的印迹基因PEG10(Paternally Expressed 10)。
本发明要解决的技术问题之二是提供一种人蛋白PEG10。
本发明要解决的技术问题之三是提供PEG10基因作为肝癌诊断标志物的应用。
本发明从肝癌组织中获得一基因片段,进而通过基因克隆技术克隆了一个与PEG10正相关新基因全长cDNA序列,该基因序列与原发性肝细胞肝癌高度相关。令人感兴趣的是该基因在肝癌中的表达高达66%,而癌旁肝组织不表达或表达极低。该基因编码一568个氨基酸的蛋白质,定位于细胞浆。
为了解决上述技术问题,本发明通过如下技术方案实现在本发明的一个方面,提供了一种分离出的DNA分子,该分子包括编码具有人PEG10蛋白质活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.1中从核苷酸第1-1707位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列杂交。较佳地,所述的序列编码具有SEQ ID NO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列。
在本发明的另一方面,提供了一种分离出的人PEG10蛋白质多肽,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.2序列的多肽。
在本发明的另一方面,还提供了一种载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。
在本发明的另一方面,还提供了一种具有人PEG10蛋白质活性的多肽的制备方法,该方法包括(1)将编码具有人PEG10蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人PEG10蛋白表达载体,所述的核苷酸序列与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人PEG10蛋白的重组细胞;(3)在适合表达人PEG10蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人PEG10蛋白活性的多肽。
较佳地,在该方法中使用的核酸序列具有SEQ ID NO.1中第1-1707位的序列。
本发明还提供了与PEG10蛋白多肽特异性结合的抗体。
在本发明中,“分离的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“人PEG10蛋白(或多肽)编码序列”指编码具有人PEG10蛋白活性的多肽的核苷酸序列,如SEQ ID NO.1中第1-1707位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.1序列的编码框第1-1707位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.1中第1-1707位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列杂交的核苷酸序列。其中,“严紧条件”是指核苷酸序列在膜上杂交后的洗膜条件。例如,在本领域中,低严紧度洗膜可以在杂交管中倒入150ml左右洗液,放入杂交膜,室温持续摇动20分钟左右,而高严紧度洗膜可以是在杂交管中倒入200ml左右洗液,放入杂交膜,50℃摇床中持续摇动20分钟左右。该术语还包括与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与人PEG10相同功能的蛋白的、SEQ ID NO.1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,术语“人PEG10蛋白或多肽”指具有PEG10蛋白活性的SEQ ID NO.2序列的多肽。该术语还包括具有与天然的人PEG10相同功能的SEQ ID NO.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括PEG10蛋白的活性片段和活性衍生物。
本发明人PEG10多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与人PEG10 DNA杂交的DNA所编码的蛋白、以及利用抗人PEG10多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含人PEG10多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括人PEG10多肽的可溶性片段。通常,该片段具有人PEG10多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
在本发明中,“人PEG10保守性变异多肽”指与SEQ ID NO.2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1

发明还包括人PEG10蛋白或多肽的类似物。这些类似物与天然的人PEG10多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的人PEG10多肽时,可以将PEG10编码序列可操作地连于表达调控序列,从而形成人PEG10蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
本发明还提供了对人PEG10特异的抗体,包括多克隆抗体和单克隆抗体。
在本发明中,可以使用一系列本领域已知的方法来制备针对PEG10特异的抗体。例如,将提纯的人PEG10基因产物或它的抗原片段注射入动物体内以产生多克隆抗体。同样,表达人PEG10或它的抗原片段的细胞也可以用来对动物致免疫而产生抗体。根据本发明制备的抗体也可以是单克隆抗体,这些单克隆抗体可以用杂交瘤技术制各(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本发明的抗体包括可以阻抑人PEG10功能的抗体,也可以是不影响人PEG10功能的抗体。每一类抗体都可以通过对人PEG10基因产物的片段或功能域致免疫而产生,而人PEG10基因产物及其片段可以用重组方法产生或用多肽合成仪进行合成。与非修饰形式的PEG10基因产物结合的抗体,可以通过用在原核细胞例如E.coli中产生的基因产物来免疫动物而得到。与翻译后修饰形式如糖基化或磷酸化蛋白或多肽结合的抗体,可以通过用在真核细胞如酵母或昆虫细胞中产生的基因产物的来免疫动物而得到。
本发明的人PE610抗体可以用来鉴定表达人PEG10蛋白或多肽的细胞,如JurkatT细胞。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记PEG10特异抗体,然后让人PEG10特异抗体与细胞样品接触,再用荧光显微镜或流式细胞仪检测出与PEG10特异抗体结合的细胞。
除了在细胞表面检测人PEG10外,还可以用Western印迹技术分析该蛋白质。细胞裂解液可以从培养细胞或取自病人的组织标本如肾上腺中提取,并溶解在含有去污剂的裂解缓冲液中。然后用SDS聚丙烯酰胺凝胶电泳分离细胞提取物(同时将提纯的人PEG10多肽作为阳性对照),接着通过电泳杂交将其转移到硝酸纤维素上。为了用Western印迹免疫探测PEG10多肽,可以使用典型的抗体结合检测方法,例如放射自显影或碱性磷酸酶检测方法。并可使用免疫接种血清或不相关的单克隆抗体作为非特异反应的对照。
还可用Nothern印迹法技术分析PEG10基因产物的表达,即分析人PEG10的RNA转录物在细胞中的存在与否和数量。
人PEG10 DNA的Nothern印迹分析和人PEG10特异抗体的Western印迹分析可以联合使用,以证实人PEG10在生物样本中的表达。人PEG10 DNA还可以用于Southern印迹分析或原位杂交分析,以将该基因定位于染色体上,并可进行遗传连锁分析以找出其它可能的疾病相关基因。
本发明的人PEG10核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工化学合成的方法来合成有关序列。在本申请之前,现有技术已完全可以通过先合成多个多核苷酸小片段,然后再进行连接而获得编码本发明人PEG10蛋白的的核酸序列。然后,可将该核酸序列引入本领域中各种现有的DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
利用本发明的人PEG10蛋白,通过各种常规筛选方法,可筛选出与人PEG10发生相互作用的物质或,如受体、抑制剂或拮抗剂等。
本发明人PEG10蛋白及其抗体、抑制剂、拮抗剂或受体等,当在治疗上进行施用(给药)时,可提供不同的效果。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体介质中,其中pH通常约为5-8,较佳地pH约为6-8,尽管pH值可随被配制物质的性质以及待治疗的病症而有所变化。配制好的药物组合物可以通过常规途径进行给药,其中包括(但并不限于)肌内、腹膜内、皮下、皮内、或局部给药。
本发明还提供了PEG10基因作为肝癌诊断标志物的应用。本发明PEG10基因是一种肝癌高表达基因,PEG10在肝癌中的表达率高达66%,而在癌旁肝组织的表达率和表达水平极低。因此,PEG10基因可作为肝癌诊断标志物,使得对其进行深入地研究有可能定量化肝癌的检测指标,为进一步的临床推广做贡献。此外,PEG10多核苷酸、PEG10蛋白及其抗体,以及PEG10蛋白相关的拮抗剂、激动剂等可为治疗包括肝癌等多种疾病提供新的治疗途径,因而具有巨大的应用前景。


图1是通过RT-PCR验证本发明印迹基因PEG10在肝癌/癌旁组织中的表达图,N为癌旁组织,C为癌组织,β-actin作为内对照。
具体实施例方式
下面结合附图和实施例对本发明作进一步详细的说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(New YorkColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例11.组织分离(Tissue isolation)来源于HBV阳性并表达甲胎蛋白的原发性肝癌的手术病人(RT-PCR证实AFP在肝癌均为阳性而癌旁为阴性)。手术切除的肝脏一经离体,迅速切取病灶及周围5公分外癌旁组织,放入液氮中(-80℃)保存。癌和癌旁的诊断均以病理诊断为最终依据。
2.总RNA的抽提试剂盒抽提RNA试剂采用TRIzol reagent(GIBCO/BRL),该试剂是基于酸性酚一步抽提法生产的。用于抽提RNA所用的器皿和水均要进行无RNA酶处理,以保证实验中无RNA酶的环境。
3.RNA的抽提步骤将碾杵和匀浆器等器皿在200℃干烤4h,去除RNA酶,冷却;加入液氮中预冷,将组织从液氮中迅速取出,碾成粉末;用刮匙将组织放入预先加入TRIzol试剂的匀浆器中,匀浆数分钟;将匀浆后的液体转入无RNA酶的离心管中,加入氯仿后,4℃离心分层;将上层水相转入一无RNA酶的离心管中,加异丙醇,4℃离心沉淀RNA;用75%乙醇洗涤沉淀2次;用无RNA酶的去离子水溶解沉淀。抽提的RNA质量鉴定紫外分光光度计测定260/280比值(比值均在1.7~2.0);并在MOPS甲醛变性胶中观察有无降解。
4.cDNA的合成取总RNA2μg,OligodT161μL,70℃保温3min,立即冰上变性5min。加入5×buffer,DTT和50mg/L的dNTP各2μL及1μL的逆转录酶,充分混匀后,42℃2h。模板使用终浓度通常为1μg/100μL。
5.RT-PCR扩增设计引物,PEG10前向引物为5’-TGCTTCTGGCAACTTCATTG-3’,后向引物为5’-TCAAATGACAGCACCTCTCG-3’;Beta-actin前向引物为5’-TCACCCACACTGTGCCCATCTACGA-3’,后向引物为5’-CAGCGGAACCGCTCATTGCCAATGG-3’。以β-actin作内对照,反应混合物中各成分为β-actin(F)、β-actin(R)、PEG10(F)、PEG10(R)、10×Buffer、MgCl2、dNTP、Taq DNA聚合酶、cDNA模板分别为0.2、0.2、0.4、0.4、1.0、1.0、0.2、0.1和5μLcDNA模板,最后补充ddH2O使反应体系为10μL。PCR的反应条件是94℃变性5min;然后每个循环94℃30s、53℃30s、72℃30s,共30个循环;最后72℃延伸7min。
6.结果结果如图1所示利用RT-PCR技术在32对肝癌及癌旁组织中检测PEG10基因的表达差异,发现在32例中有24例PEG10基因明显升高,即PEG10基因在肝癌组织中的表达率高达66%。
实施例2人PEG10多肽的制备和提纯在该实施例中,将全长的PEG10编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
将人PEG10多肽以GST融合蛋白的形式在大肠杆菌中进行原核表达。
1.原核表达载体的构建,以及转化大肠杆菌根据人PEG10的全长编码序列(SEQ ID NO.1),设计扩增出完整编码阅读框的引物(分别对应于编码序列5’和3’端的约20个以上核苷酸),并在正反引物上分别引入限制性内切酶位点(这根据选用的pGEX-2T载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人PEG10基因在保证阅读框正确的前提下克隆至pGEX-2T载体(Pharmacia,Piscataway,NJ)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌DH5α,筛选鉴定得到含有pGEX-2T-PEG10表达载体的工程菌DH5α-pGEX-2T-PEG10。
2.表达GST-PEG10重组蛋白的工程菌的分离鉴定挑取单菌落的DH5α-pGEX-2T-PEG10工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的LB培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度1mmol/L继续于37℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入12%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达GST-PEG10融合蛋白的工程菌。
3.GST-PEG10融合蛋白的提取纯化按上述方法诱导表达GST-PEG10融合表达蛋白的工程菌DH5α-pGEX-2T-PEG10。诱导后的细菌离心沉淀,按每400ml菌加入20ml PBS重悬细菌,超声破碎细菌。破菌完全的超声液按每毫升加入20微升的量加入PBS饱和的50%谷胱苷肽Sepharose4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了GST-PEG10的谷胱苷肽Sepharose 4B,弃上清。按每毫升超声液所得沉淀加入100μl PBS的量清洗两次,而后按每毫升超声液所得沉淀加入10μl还原型谷胱苷肽洗脱液,室温置10分钟,10000rpm离心10分钟,上清即为洗脱的融合蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在31kDa处的蛋白质条带即为人PEG10蛋白。
序列表<110> 上海人类基因组研究中心<120> 肝癌高表达基因PEG10、其编码蛋白及其应用<130> NP-10015<160> 2<210> 1<211> 6861<212> DNA<213> 智人(Homo sapiens)<220>
<221> CDS<222> (1)..(1707)<400> 11 ATGTGCCACA AACTGACGGA TGGGCGCTTC AGTGGCGCTA CAATCCAGAA CGAGGAGCAG61 CGATATAGGA GCTGCAGACA GAAAACTGAA TTGCGCTTTA CATGCGCTGC AAAATCTGAG121 CTGCAGAAGA GTAGCACTAC AAAAAACGCT ACAAAAACGA TGCGATTAGC CAGCCCGACA181 ACAGCGCTTC ATTGCGCTGC GAGGCACATG AACTGCAGAG CGCCTCCTCC TACAGCGCCT241 CCTCAGAGCC GCCTCCCCTG CAGCGCCGTG ACCCAGAGTC CTTGTGCTAC CATGCGGCCT301 TCGCAGGCCC GTGCGCCCAG CTCGAGAGCA CGTGACTTCT GGATCCAGGA CCATCGGTCT361 GAGGCCCCGC ATGAGTTAGT AGGGAGGGGT AGTGCCCTGC TAGTGTCGGG GCGCCATGGT421 GATGTTCGGA GGGCGCAGCA CGCAGACCAG GGTTCGGATG GGACGCTGTG GTGTCTTTTT481 GGGTCGGTCG GGTGGTATAG GGCGATAAAT AAGCGGGTTT TGAAAACAAA AAAAAGAAGG541 AGTGGAAGAG GGGGCCAGGA TCCAGGCCTC CATCCCCACA GAAGTGAAGC TACAGCTGGG601 AGGTCTCCTC CCACCCCAAC CGTCACCCTG GGTCCCGACT GCCCACCTCC TCCTCCTCCC661 CCTCCCCCCA ACAACAACAA CAACAACAAC TCCAAGCACA CCGGCCATAA GAGTGCGTGT721 GTCCCCAACA TGACCGAACG AAGAAGGGAC GAGCTCTCTG AAGAGATCAA CAACTTAAGA781 GAGAAGGTCA TGAAGCAGTC GGAGGAGAAC AACAACCTGC AGAGCCAGGT GCAGAAGCTC841 ACAGAGGAGA ACACCACCCT TCGAGAGCAA GTGGAACCCA CCCCTGAGGA TGAGGATGAT901 GACATCGAGC TCCGCGGTGC TGCAGCAGCT GCTGCCCCAC CCCCTCCAAT AGAGGAAGAG961 TGCCCAGAAG ACCTCCCAGA GAAGTTCGAT GGCAACCCAG ACATGCTGGC TCCTTTCATG1021 GCCCAGTGCC AGATCTTCAT GGAAAAGAGC ACCAGGGATT TCTCAGTTGA TCGTGTCCGT1081 GTCTGCTTCG TGACAAGCAT GATGACCGGC CGTGCTGCCC GTTGGGCCTC AGCAAAGCTG1141 GAGCGCTCCC ACTACCTGAT GCACAACTAC CCAGCTTTCA TGATGGAAAT GAAGCATGTC
1201 TTTGAAGACC CTCAGAGGCG AGAGGTTGCC AAACGCAAGA TCAGACGCCT GCGCCAAGGC1261 ATGGGGTCTG TCATCGACTA CTCCAATGCT TTCCAGATGA TTGCCCAGGA CCTGGATTGG1321 AACGAGCCTG CGCTGATTGA CCAGTACCAC GAGGGCCTCA GCGACCACAT TCAGGAGGAG1381 CTCTCCCACC TCGAGGTCGC CAAGTCGCTG TCTGCTCTGA TTGGGCAGTG CATTCACATT1441 GAGAGAAGGC TGGCCAGGGC TGCTGCAGCT CGCAAGCCAC GCTCGCCACC CCGGGCGCTG1501 GTGTTGCCTC ACATTGCAAG CCACCACCAG GTAGATCCAA CCGAGCCGGT GGGAGGTGCC1561 CGCATGCGCC TGACGCAGGA AGAAAAAGAA AGACGCAGAA AGCTGAACCT GTGCCTCTAC1621 TGTGGAACAG GAGGTCACTA CGCTGACAAT TGTCCTGCCA AGGCCTCAAA GTCTTCGCCG1681 GCGGGAAACT CCCCGGCCCC GCTGTAGAGG GACCTTCAGC GACCGGGCCA GAAATAATAA1741 GGTCCCCACA AGATGATGCC TCATCTCCAC ACTTGCAAGT GATGCTCCAG ATTCATCTTC1801 CGGGCAGACA CACCCTGTTC GTCCGAGCCA TGATCGATTC TGGTGCTTCT GGCAACTTCA1861 TTGATCACGA ATATGTTGCT CAAAATGGAA TTCCTCTAAG AATCAAGGAC TGGCCAATAC1921 TTGTGGAAGC AATTGATGGG CGCCCCATAG CATCGGGCCC AGTTGTCCAC GAAACTCACG1981 ACCTGATAGT TGACCTGGGA GATCACCGAG AGGTGCTGTC ATTTGATGTG ACTCAGTCTC2041 CATTCTTCCC TGTCGTCCTA GGGGTTCGCT GGCTGAGCAC ACATGATCCC AATATCACAT2101 GGAGCACTCG ATCTATCGTC TTTGATTCTG AATACTGCCG CTACCACTGC CGGATGTATT2161 CTCCAATACC ACCATCGCTC CCACCACCAG CACCACAACC GCCACTCTAT TATCCAGTAG2221 ATGGATACAG AGTTTACCAA CCAGTGAGGT ATTACTATGT CCAGAATGTG TACACTCCAG2281 TAGATGAGCA CGTCTACCCA GATCACCGCC TGGTTGACCC TCACATAGAA ATGATACCTG2341 GAGCACACAG TATTCCCAGT GGACATGTGT ATTCACTGTC CGAACCTGAA ATGGCAGCTC2401 TTCGAGATTT TGTGGCAAGA AATGTAAAAG ATGGGCTAAT TACTCCAACG ATTGCACCTA2461 ATGGAGCCCA AGTTCTCCAG GTGAAGAGGG GGTGGAAACT GCAAGTTTCT TATGATTGCC2521 GAGCTCCAAA CAATTTTACT ATCCAGAATC AGTATCCTCG CCTATCTATT CCAAATTTAG2581 AAGACCAAGC ACACCTGGCA ACGTACACTG AATTCGTACC TCAAATACCT GGATACCAAA2641 CATACCCCAC ATATGCCGCG TACCCGACCT ACCCAGTAGG ATTCGCCTGG TACCCAGTGG2701 GACGAGACGG ACAAGGAAGA TCACTATATG TACCTGTGAT GATCACTTGG AATCCACACT2761 GGTACCGCCA GCCTCCGGTA CCACAGTACC CGCCGCCACA GCCGCCGCCT CCACCACCAC2821 CACCGCCGCC GCCTCCATCT TACAGTACCC TGTAAATACC TGTCATGTCC TTCAGGATCT2881 CTGCCCTCAA AATTTATTCC TGTTCAGCTT CTCAATCAGT GACTGTGTGC TAAATTTTAG2941 GCTACTGTAT CTTCAGGCCA CCTGAGGCAC ATCCTCTCTG AAACGGCTAT GGAAGGTTAG3001 GGCCACTCTG GACTGGCACA CATCCTAAAG CACCAAAAGA CCTTCAACAT TTTCTGAGAG3061 CAACAGAGTA TTTGCCAATA AATGATCTCT CATTTTTCCA CCTTGACTGC CAATCTAACT3121 AAAATAATTA ATAAGTTTAC TTTCCAGCCA GTCCTGGAAG TCTGGGTTTT ACCTGCCAAA3181 ACCTCCATCA CCATCTAAAT TATAGGCTGC CAAATTTGCT GTTTAACATT TACAGAGAAG3241 CTGATACAAA CGCAGGAAAT GCTGATTTCT TTATGGAGGG GGAGACGAGG AGGAGGAGGA3301 CATGACTTTT CTTGCGGTTT CGGTACCCTC TTTTTAAATC ACTGGAGGAC TGAGGCCTTA3361 TTAAGGAAGC CAAAATTATC GGTGCAGTGT GGAAAGGCTT CCGTGATCCT CTCGCTGCAC3421 CCTTAGAAAC TTCACCGTCT TCAAACTCCA TTTCCATGGT TCTGTTAATT CTCAAGGAGC3481 AGCAACTCGA CTGGTTCTCC CAGGAGCAGG AAAAACCCTT GTGACATGAA ACATCTCAGG3541 CCTGAAAAGA AAGTGCTCTC TCAGATGGAC TCTTGCATGT TAAGACTATG TCTTCACATC3601 ATGGTGCAAA TCACATGTAC CCAATGACTC CGGCTTTGAC ACAACACCTT ACCATCATCA3661 TGCCATGATG GCTTCCACAA AGCATTAAAC CTGGTAACCA GAGATTACTG GTGGCTCCAG3721 CGTTGTTAGA TGTTCATGAA ATGTGACCAC CTCTCAATCA CCTTTGAGGG CTAAAGAGTA3781 GCACATCAAA AGGACTCCAA AATCCCATAC CCAACTCTTA AGAGATTTGT CCTGGTACTT
3841 CAGAAAGAAT TTTCATGAGT GTTCTTAATT GGCTGGAAAA GCACCAGCTG ACGTTTTGGA3901 AGAATCTATC CATGTGTCTG CCTCCATATG CATCTGGGCA TTTCATCTTC AGTCCCCTCA3961 TTAGACTGTA GCATTAGGAT GTGTGGAGAG AGGAGAAATG ATTTAGCACC CAGATTCACA4021 CTCCTATGCC TGGAAGGGGG ACATCTTTGA AGAAGAGGAA TTAGGGCTGT GGACACTGTC4081 TTGAGGATGT GGACTTCCTT AGTGAGCTCC ACATTACTTG ATGGTAACCA CTTCAAAAGG4141 ATCAGAATCC ACGTAATGAA AAAGGTCCCT CTAGAGGATG GAGCTGATGT GAAGCTGCCA4201 ATGGATGAAA AGCCTCAGAA AGCAACTCAA AGGACTCAAA GCAACGGACA ACACAAGAGT4261 TGTCTTCAGC CCAGTGACAC CTCTGATGTC CCCTGGAAGC TTTGTGCTAA CCTGGGACTG4321 CCTGACTTCC TTTAGCCTGG TCCCTTGCTA CTACCTTGAA CTGTTTTATC TAACCTCTCT4381 TTTTCTGTTT AATTCTTTGC TACTGCCATT GACCCTGCTG CAGGATTTGT GTCATTTTCC4441 TGCCTGGTTG CTGAGACTCC ATTTTGCTGC CACACACAGA GATGTAAGAG GCAGGCTTTA4501 ATTGCCAAAG CACAGTTTGA GCAGTAGAAA ACAACATGGT GTATATCTCA AATTGCCTGA4561 CATGAAGAGG AGTCTAACGG TGAAGTTTCA CTTTTCATCA GCATCATCTT TCACATGTTC4621 ATTATCATCT GCTCTTATTC TTGCATGTTT AAACACTTAA AATTTTTAGT ATAATTTTTA4681 GTGTGTTTTG AAGTGGTGAC TAGGCTTTCA AAAACTTCCA TTGAATTACA AAGCACTATC4741 CAGTTCTTAT TGTTAAACTA AGTAAAAATG ATAAGTAACA TAGTGTAAAA TATTCCTTTA4801 CTGTGAACTT CTTACAATGC TGTGAATGAG AGGCTCCTCA GAACTGGAGC ATTTGTATAA4861 TAATTCATCC TGTTCATCTT CAATTTTAAC ATCATATATA ATTTCAATTC TATCAATTGG4921 GCCTTTAAAA ATCATATAAA AGGATATAAA ATTTGAAAAG AGAAACCTAA TTGGCTATTT4981 AATCCAAAAC AACTTTTTTT TTCCTTCAAT GGAATCAGAA AGCTTGTCAA TCACTCATGT5041 GTTTTAGAGT AATTACTTTT AAAATGGTGC ATTTGTGCTT CTGAACTATT TTGAAGAGTC5101 ACTTCTGTTT ACCTCAAGTA TCAATTCATC CTCCATACAT TTGAATTCAA GTTGTTTTTT5161 TGTCAAATTT ACAGTTGTCA ATTGATCTTC AAGCTGCAGG GTGCCTAGAA ATGGGCCGTT5221 GTCTGTAGCC CTGGCATGTG CACACGGACA TTTGCCACCA CTGCAAGCAA AAGTCTGGAG5281 AAGTTCACCA ACGACAAGAA CGATTAGGGA AAATATGCTG CTGTGGGTTA ACAACTCAGA5341 AAGTCCCTGA TCCACATTTG GCTGTTTACT AAAGCTTGTG ATTAACTTTT TGGCAGTGTG5401 TACTATGCTC TATTGCTATA TATGCTATCT ATAAATGTAG ATGTTAAGGA TAAGTAATTC5461 TAAATTTATT ATTCTATAGT TTTGAAGTTT GGTTAAGTTT CCTTTCACTC AATTGATTTA5521 TTTTGTTGTT AATCAAATTT ATGTTAATTG GATCCTTTAA ATTTTTTTTG GCATTTTCCA5581 ACAAAAATGG CTTTATTCAT AAGAAAGGAA AAAAATCAAT GGAATTTGAT ATCTAAAGAA5641 GTTAGAAAGG GAGCAAAATA AAAAACATAA AGGAGATAGA TGAATTAGTA AGCAAATCAG5701 TAGTCGAGTT TTTCAAACTG GCAAAATTAA TTAATTGACT TTTAGCCCAA ATTTACATTG5761 TTAATTAAAT CAAGAAGGAA GAAGATCTAA GAGCTCCCAT TGATAGGCAA GCCTAGAGAG5821 AACTAGCTAA ATTTATCATG CTAGGATATT GAAACACAGA AAGTTTACAT ACATTTATGA5881 AGGGTCAATT TAGTTTGGAC AGTGAGGTAT TTGTCTTAGT GGAAAAAAGG AGAATTAGTC5941 TGATCAAATC GTGAAGTAAT ACAGTGAACT TGCAGGTGCA CAAAATAAGA GGGCCACATC6001 TATATGGTGC AGTCTGGAAT TCTGTTTAAG TTTGTAGGTA CCTCTTGGAC TTCTGAATTG6061 ATCCAGTTGT CATCCACCAC AGACATCTCA CATCAGATAC AGTTCCAAGA TTGACAACAG6121 AGAACAACCT GCTGGAAAGA CCTGGGCAGA AATGGAGAGC CCTGCGGGAA CCATGCTACA6181 TTTTCATCTA AAGAGAGAAT GCACATCTGA TGAGACTGAA AGTTCTTTGT TGTTTTAGAT6241 TGTAGAATGG TATTGAATTG GTCTGTGGAA AATTGCATTG CTTTTATTTC TTTGTGTAAT6301 CAAGTTTAAG TAATAGGGGA TATATAATCA TAAGCATTTT AGGGTGGGAG GGACTATTAA6361 GTAATTTTAA GTGGGTGGGG TTATTTAGAA TGTTAGAATA ATATTATGTA TTAGATATCG6421 CTATAAGTGG ACATGCGTAC TTACTTGTAA CCCTTTACCC TATAATTGCT ATCCTTAAAG
6481 ATTTCAAATA AACTCGGAGG GAACTGCAGG GAGACCAACT TATTTAGAGC GAATTGGACA6541 TGGATAAAAA CCCCAGTGGG AGAAAGTTCA AAGGTGATTA GATTAATAAT TTAATAGAGG6601 ATGAGTGACC TCTGATAAAT TACTGCTAGA ATGAACTTGT CAATGATGGA TGGTAAATTT6661 TCATGGAAGT TATAAAAGTG ATAAATAAAA ACCCTTGCTT TTACCCCTGT CAGTAGCCCT6721 CCTCCTACCA CTGAACCCCA TTGCCCCTAC CCCTCCTTCT AACTTTATTG CTGTATTCTC6781 TTCACTCTAT ATTTCTCTCT ATTTGCTAAT ATTGCATTGC TGTTACAATA AAAATTCAAT6841 AAAGATTTAG TGGTTAAGTG C<210> 2<211> 568<212> PRT<213> 智人(Homo sapiens)<400> 21 MCHKLTDGRF SGATIQNEEQ RYRSCRQKTE LRFTCAAKSE LQKSSTTKNA51 TKTMRLASPT TALHCAARHM NCRAPPPTAP PQSRLPCSAV TQSPCATMRP101 SQARAPSSRA RDFWIQDHRS EAPHELVGRG SALLVSGRHG DVRRAQHADQ151 GSDGTLWCLF GSVGWYRAIN KRVLKTKKRR SGRGGQDPGL HPHRSEATAG201 RSPPTPTVTL GPDCPPPPPP PPPNNNNNNN SKHTGHKSAC VPNMTERRRD251 ELSEEINNLR EKVMKQSEEN NNLQSQVQKL TEENTTLREQ VEPTPEDEDD301 DIELRGAAAA AAPPPPIEEE CPEDLPEKFD GNPDMLAPFM AQCQIFMEKS351 TRDFSVDRVR VCFVTSMMTG RAARWASAKL ERSHYLMHNY PAFMMEMKHV401 FEDPQRREVA KRKIRRLRQG MGSVIDYSNA FQMIAQDLDW NEPALIDQYH451 EGLSDHIQEE LSHLEVAKSL SALIGQCIHI ERRLARAAAA RKPRSPPRAL501 VLPHIASHHQ VDPTEPVGGA RMRLTQEEKE RRRKLNLCLY CGTGGHYADN551 CPAKASKSSP AGNSPAPL
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人PEG10蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码具有SEQ ID NO.2所示的氨基酸序列的多肽。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列。
4.一种分离出的人PEG10蛋白多肽,其特征在于,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.2序列的多肽。
6.一种载体,其特征在于,它包含权利要求1所述的DNA。
7.一种由权利要求6所述载体转化的宿主细胞,其特征在于,包括原核细胞和真核细胞。
8.一种具有人PEG10蛋白质活性的多肽的制备方法,其特征在于,包括如下步骤(1)将编码具有人PEG10蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人PEG10蛋白表达载体,所述的核苷酸序列与SEQ ID NO.1中从核苷酸第1-1707位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人PEG10蛋白的重组细胞;(3)在适合表达人PEG10蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人PEG10蛋白活性的多肽。
9.一种能与权利要求4所述的人PEG10蛋白多肽特异性结合的抗体,其特征在于,包括多克隆抗体和单克隆抗体。
10.PEG10基因作为肝癌诊断标志物的应用。
全文摘要
本发明公开了一种肝癌高表达基因PEG10,本发明还公开了PEG10基因的 编码蛋白,此外,本发明还公开了PEG10基因作为肝癌诊断标志物的应用。本发明PEG10基因是一种肝癌高表达基因,PEG10在肝癌中的表达率高达66%,而在癌旁肝组织的表达率和表达水平极低。因此PEG10多核苷酸、PEG10蛋白及其抗体,以及PEG10蛋白相关的拮抗剂、激动剂等可为治疗包括肝癌等多种疾病提供新的治疗途径,因而具有巨大的应用前景。
文档编号C07K14/435GK1952130SQ20051003068
公开日2007年4月25日 申请日期2005年10月20日 优先权日2005年10月20日
发明者黄健, 韩泽广, 林昀 申请人:上海人类基因组研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1