新的人蛋白质磷酸酯酶亚基、其编码序列及制备方法

文档序号:452065阅读:401来源:国知局
专利名称:新的人蛋白质磷酸酯酶亚基、其编码序列及制备方法
技术领域
本发明涉及基因工程领域,具体地,本发明涉及一种新的人基因核苷酸序列。更具体地说,本发明涉及人IMYPNO1的cDNA序列,该蛋白是兔蛋白质磷酸酯酶2A1(protein phosphatase 2A1,简称“PP2A1”)的B-gama亚基蛋白的同系物。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
生物中广泛存在着复杂的信号传递途径。每个细胞通过表面的受体从外界接收信号,然后经过一系列复杂的生物化学途径,将信号从质膜传递到胞内。同时这一系列生物化学途径也被用来帮助协调细胞各部分执行各种特殊而复杂的功能(Physiol Rev.1993 Oct;73(4)673-699.Review.)。而蛋白质的磷酸化和去磷酸化就是其中最重要的生物化学途径之一(Bioorg Med Chem.1997 Sep;5(9)1751-1773.Review.)。
蛋白质的磷酸化和去磷酸化是分别由蛋白激酶和蛋白磷酸酯酶所催化的,其中蛋白激酶是一个十分庞大的家族,总体上包括蛋白质的丝氨酸/苏氨酸激酶,和蛋白质的酪氨酸激酶两大类,数量十分惊人,仅在真核生物中就发现了不下1000种之多。蛋白磷酸酯酶的分类与蛋白激酶十分相似,也相应分为蛋白质的丝氨酸/苏氨酸磷酸酯酶和蛋白质的酪氨酸磷酸酯酶,但是数量比蛋白激酶要少得多,真核和原核生物中总计只有15种(Physiol Rev.1993 Oct;73(4)673-699.Review.)。尽管数量如此悬殊,然而它们两者却可以协调的工作,共同维持蛋白质的磷酸化平衡。
蛋白质的丝氨酸/苏氨酸磷酸酯酶家族是一个重要的蛋白磷酸酯酶家族,它负责催化己磷酸化的蛋白质丝氨酸和苏氨酸的去磷酸化作用。传统上,该家族的成员可以根据其对底物和抑制剂的专一性,以及受调控和对金属离子需要的不同而分为PP1、PP2A、PP2B三个结构相似的亚家族(Eur J Biochem.1995 Jun 1;230(2)766-772.)。也曾有关于PP2C的报道,但由于其结构上较为特殊,常被单独讨论(Physiol Rev.1993 Oct;73(4)673-699.Review.)。
蛋白质磷酸酯酶2A(protein phosphatase 2A,简称“PP2A”)是一类典型的蛋白质丝氨酸/苏氨酸磷酸酯酶,它广泛存在于各种生物中;在人体内,它广泛存在于各种器官和组织,是一类无处不在的蛋白质。PP2A的结构大致由三个亚基构成C2亚基为催化亚基,A亚基为保守的调控亚基,B亚基是不太保守的调控亚基。A-C2常被称为核心亚基,它在各种PP2A中是变化很小的,而作为调控亚基的B亚基则较为多样,至少可分为三类,B、B′、和B″。习惯上将A-C2-B称为PP2A1,将A-C2-B′称为PP2A0。近年来的研究表明,作为组成PP2A1的B类亚基又可进一步细分为B-alpha、B-beta和B-gama三种类型(J Biol Chem.1996 Feb 2;271(5)2578-2588.)。
1991年,瑞士的科学家Mayer RE等人已克隆并鉴定了两种人类PP2A1的B-alpha和B-beta亚基的基因(GENEBANK ACCESSION No.gb|M64929 &gb|M64930)(Biochemistry 1991 Apr 16;30(15)3589-3597)。1994年,Zolnierowicz S等人克隆并鉴定了一种兔PP2A1的B-gama亚基的基因(GENEBANK ACCESSION No.gb|U09355)(Biochemistry.1994 Oct 4;33(39)11858-11867.)。进一步的研究表明,它们之间还存在着较高的同源性。
然而,到目前为止,还没有有关本发明中人类PP2A1的B-gama亚基基因的报道。
本发明的一个目的是提供一种新的多核苷酸序列,该多核苷酸序列编码人类的、与兔PP2A1的B-gama亚基同源的蛋白,本发明的与兔PP2A1的B-gama亚基同源的基因被命名为IMYPNO1。
本发明的另一个目的是提供一种新的蛋白,该蛋白被命名为IMYPNO1蛋白。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人IMYPNO1蛋白的方法。
本发明还提供了这种人IMYPNO1编码序列和蛋白的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,它包括编码具有人IMYPNO1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.4所示的序列。更佳地,该序列具有SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列。
在本发明的另一方面,提供了一种分离的IMYPNO1蛋白多肽,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.4序列的多肽。
在本发明的另一方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的另一方面,提供了一种所述载体转化的宿主细胞。
在本发明的另一方面,提供了一种产生具有IMYPNO1蛋白活性的多肽的方法,该方法包括(a)将编码具有IMYPNO1蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成IMYPNO1蛋白表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成IMYPNO1蛋白的重组细胞;(c)在适合表达IMYPNO1蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有IMYPNO1蛋白活性的多肽。
在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为1492个核苷酸,其详细序列见SEQ ID NO.3,其中开放读框位于91-1377位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“IMYPNO1蛋白(或多肽)编码序列”指编码具有IMYPNO1蛋白活性的多肽的核苷酸序列,如SEQ ID NO.3中91-1377位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.3序列的编码框91-1377位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.3中91-1377位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.4所述的序列。该术语还包括能在中度严紧条件下,更佳地在高度严紧条件下与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%的核苷酸序列。
该术语还包括能编码具有与人IMYPNO1相同功能的蛋白的、SEQ ID NO.3中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“IMYPNO1蛋白多肽”指具有IMYPNO1蛋白活性的SEQ IDNO.4序列的多肽。该术语还包括具有与IMYPNO1相同功能的、SEQ ID NO.4序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括IMYPNO1蛋白的活性片段和活性衍生物。
该多肽的变异形式包括同源序列、等位变异体、天然突变体、诱导突变体、在高或低的严谨度条件下能与IMYPNO1 DNA杂交的DNA所编码的蛋白、以及利用抗IMYPNO1多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含IMYPNO1多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括IMYPNO1多肽的可溶性片段。通常,该片段具有IMYPNO1多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
发明还提供IMYPNO1蛋白或多肽的类似物。这些类似物与天然IMYPNO1多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明还包括IMYPNO1多肽编码序列的反义序列。这种反义序列可用于抑制细胞内IMYPNO1的表达。
本发明还包括一种可用作探针的核酸分子,该分子通常具有IMYPNO1多肽编码序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码IMYPNO1的核酸分子。
本发明还包括检测IMYPNO1核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于IMYPNO1多肽的编码序列,并可位于该编码序列的两侧或中间。引物长度一般为20-50个核苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞,昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对IMYPNO1 DNA或是其片段编码的多肽具有特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于IMYPNO1基因产物或片段。较佳地,指那些能与IMYPNO1基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制IMYPNO1蛋白的分子,也包括那些并不影响IMYPNO1蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的IMYPNO1基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的IMYPNO1基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达IMYPNO1或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6511,1976;Kohler等人,Eur.J.Immunol.6292,1976;Hammerling等人,In Monoclonal Antibodies and T Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断IMYPNO1功能的抗体以及不影响IMYPNO1功能的抗体。本发明的各类抗体可以利用IMYPNO1基因产物的片段或功能区,通过常规免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与IMYPNO1基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.Coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明的人IMYPNO1核苷酸序列全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按已知方法制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。当然,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
在本发明的一个实例中,人IMYPNO1的cDNA核苷酸序列是如此获得的,以人脑λgt11cDNA文库(购自Clontech公司)为模板,合成正向引物A5′-CTGCGGGACCACAGCTATGTGAC-3′和反向引物B5′-CAGCTGTCCTCATCAGTGCTGTG-3’,进行PCR,获得1492bp的目的片段。测序后得到SEQ ID NO.3的全长cDNA序列。
PP2A被认为与细胞生长,细胞分裂周期和细胞信息传递有关,B-gama作为PP2A的重要调控亚基,它一定对生物细胞的正常生长有重要作用。在本发明中,IMYPNO1基因与兔的PP2A1的B-gama基因高度同源,同时与鼠B-gama基因的同源性也很高,因而这表明它是B-gama在人中的一个同源基因,并且与兔B-gama,鼠B-gama有着相似的生物学功能,这些功能包括参与RNA的转录加工、信息受体与离子通道作用、胞内信息传递、调控细胞生长、细胞周期以及细胞分裂等方面。
在附图中,

图1为本发明的人IMYPNO1与兔PP2A1的B-gama亚基基因的核酸序列同源比较图。其中,相同的核苷酸用“|”标出。
图2为本发明的人IMYPNO1与大鼠PP2A1的B-gama亚基基因的核酸序列同源比较图。其中,相同的核苷酸用“|”标出。
图3为本发明的人IMYPNO1与兔PP2A1的B-gama亚基的氨基酸序列的同源比较图。其中,相同的氨基酸在两个序列之间用单字符标出。
图4为本发明的人IMYPNO1与大鼠PP2A1的B-gama亚基的氨基酸序列的同源比较图。其中,相同的氨基酸在两个序列之间用单字符标出。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(New YorkColdSpring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1IMYPNO1的cDNA序列的克隆和测定1.引物扩增以人脑λgt11cDNA文库(购自Clontech公司)为模板,用一对寡核苷酸为引物——A5′-CTGCGGGACCACAGCTATGTGAC-3′(SEQ ID NO.1)为正向引物,寡核苷酸B5′-CAGCTGTCCTCATCAGTGCTGT-3’(SEQ ID NO.2)为反向引物,进行PCR。A、B引物对的PCR条件为93℃4分钟,随之以93℃1分钟、66℃1分钟和72℃1分钟进行35个循环,最后72℃延伸5分钟。电泳检测得到的PCR片段,以A、B为引物对扩增出的目的片段长1492bp。
2.PCR产物的测序将这段PCR扩增产物与pGEM-T载体(Promega)连接,转化大肠杆菌JM103,用QIAprep Plasmid试剂盒(QIAGEN)提取质粒,用双链嵌套式缺失试剂盒(Pharmacia)对插入片段进行定向系列缺失,然后用PCR对缺失子进行快速鉴定及排序。用SequiTherm EXCELTMDNA测序试剂盒(Epicentre Technologies)对依次截短的缺失子进行测序,最后用电脑软件拼接顺序,获得全长cDNA序列,共1492bp,详细序列见SEQ ID NO.3,其中开放读框位于91-1377位核苷酸。
根据得到的全长cDNA序列推导出IMYPNO1的氨基酸序列,共428个氨基酸残基,其氨基酸序列详见SEQ ID NO.4。
实施例2同源比较和结构研究用IMYPNO1的全长cDNA序列及其编码蛋白在Non-redundantGenBank+EMBL+DDBJ+PDB数据库及Non-redundant GenBank CDStranslations+PDB+SwissProt+Spupdate+PIR数据库中用BLAST软件进行核酸和蛋白同源检索。结果发现,它与已被发表并确认为PP2A1的B-gama亚基的基因间存在高度同源的序列,并且本发明涉及的蛋白具有PP2A1的B-gama亚基家族高度保守的氨基酸序列。进一步的检索表明,其在核酸和蛋白水平上与已被公布的兔(Oryctolagus cuniculus)PP2A1的B-gama亚基基因(核酸和蛋白检索号分别为gb|U09355和sp|P50410)存在高度同源性,其中它们的核酸序列间有约92%同一性(identity)(图1),而其蛋白序列间更有93%同一性,94%相似性(图3)。另外,本发明在核酸和蛋白水平上与已被公布的鼠PP2A1的B-gama亚基基因(核酸和蛋白检索号分别为dbj|D38261和pir‖S65686)也存在高度同源性,其中它们的核酸序列间平均有约90%同一性(图2),而其蛋白序列间也有93%同一性,94%相似(图4)。因此该基因被确认为兔和鼠PP2A1的B-gama亚基基因的同源基因。
又由于兔和鼠PP2A1的B-gama亚基基因已被鉴定为B-gama家族成员,且IMYPNO1的蛋白质序列中具有B-gama家族的严格保守的标志性序列,特别是在IMYPNO1的氨基酸序列中存在两组各15个氨基酸组成的PP2A1的B-gama亚基基因家族共有的特征性序列——EFDYLKSLEIEEKIN;和N(A/G)H(T/A)YHINSIS(L/I/V/M)NSD.。
在本发明的蛋白中符合上述模式的序列片段是EFDYLKSLEIEEKIN(SEQID NO.4中103-117位)、NGHTYHINSISVNSD(SEQ ID NO.4中194-208位)。因此这进一步证实了本发明的IMYPNO1是一种新的人类PP2A1的B-gama亚基基因。根据结构决定功能,结构相似功能相似的原理,可以从这些相似基因或蛋白的功能来推测IMYPNO1的功能。
研究发现,蛋白质的丝氨酸/苏氨酸磷酸酯酶家族的功能惊人的广泛,它几乎涵盖了代谢调节、参与信息受体和离子通道的作用、RNA的转录和加工,以及细胞的生长、分裂和分化(Biochemistry.1994 Oct 4;33(39)11858-11867.)。
之所以蛋白质的丝氨酸/苏氨酸磷酸酯酶有如此多的功能,是因为它参与了生物体中最重要的信号途径,也就是蛋白质的可逆磷酸化途径。在细胞中存在着大量可以通过磷酸化和去磷酸化来改变其功能状态的酶和信号分子,这样就提供了相当数量的,如反馈抑制这样的正向和反向的调控位点,而这就是它参与各种细胞功能的化学基础。事实上,越来越多的资料表明,PP2A参与了钾离子流通平衡的调控(Adv Exp Med Biol.1996;396209-215.Review.);参与了由肿瘤病毒及其病毒蛋白引起的细胞形变(Semin Cancer Biol.1995 Aug;6(4)229-237.Review.);PP2A还与Bloom Syndrom(BS)、Alzheimer’s desease(AD)等临床病症有关(Indian JExp Biol.1996 Apr;34(4)298-301.Review.、FASEB J.1995 Dec;9(15)1570-1576.Review.)。
此外,尤为重要的是PP2A参与了对细胞生长和细胞周期的控制(Physiol Rev.1993 Oct;73(4)673-699.Review.)。例如曾发现PP2A可以调控真核的非洲爪蟾细胞从G2期到M期的转变过程(Semin Cancer Biol.1995 Aug;6(4)203-209.Review.);又发现在酵母中过量表达的PP2A会导致细胞无法进入细胞分裂期,或是推迟分裂期的到来(Ciba Found Symp.1992;170130-140.Review)。较为明显的例子是在蛙卵中发现的一种促成熟因子(maturation-promoting factor,MPF),它实际上是一种蛋白激酶(Physiol Rev.1993 Oct;73(4)673-699.Review.),而由蛋白的磷酸酯酶与蛋白激酶相拮抗的性质,可以推断存在一种所谓“延缓成熟因子”,其实质为蛋白质的磷酸酯酶,并具有延缓分裂的作用。由此可见,蛋白质的磷酸酯酶确实直接或间接的决定了细胞的生长和分裂状况。而B-gama作为PP2A的调控亚基之一,起着引导整个磷酸酯酶完成所需功能的作用(Adv Enzyme Regul.1994;34199-224.Review.),也就应具有与相应的蛋白磷酸酯酶同等重要的功能。
如前所述,IMYPNO1具有与B-gama家族成员相同或相近的功能,即也能引导所属的PP2A参与各种细胞信号途径,影响离子的流通,并可能与“Bloom综合症”、“Alzheimer’s病”等疾病的治疗有关。另外,IMYPNO1也可能参与细胞生长和细胞周期的调控,并成为具有重要功能的细胞生长因子和细胞分裂因子之一。
除此之外,本发明还具有更为重要的意义。因为在自然界,蛋白激酶的种类要远远大于蛋白酯酶的种类,而之所以它们能够相互协调的工作,很大程度上因为象PP2A的B亚基这样存在着B-alpha,B-beta,B-gama的多种调控亚基形式,而这三种亚基的差异表达可以调控PP2A产生不同的底物专一性,使同一个PP2A产生不同的活性,因此这三种亚基实际上是密切相关的(Physiol Rev.1993 Oct;73(4)673-699.Review.)。人类PP2A1的B-alpha和B-beta亚基早在1991年就已克隆并鉴定了,但由于B-gama的空缺,使得这方面的研究无法开展。而本发明的IMYPNO1正好填补了这一空缺,为人类PP2A1的研究工作打开一个崭新的局面。如果考虑到PP2A与细胞生长和分裂的关系,我们更可以通过基因的或是药物的疗法,调节PP2A三种B亚基的浓度比例来控制PP2A的酶活,进而控制细胞的生长和分裂,使人们有可能控制肿瘤和癌症的发展,以达到最终治疗癌症的目标。
本发明的人IMYPNO1除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人IMYPNO1还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人IMYPNO1的N端与兔的PP2A1 B-game亚基或者人的B-alpha亚基的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人IMYPNO1的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
实施例3IMYPNO1在大肠杆菌中的表达在该实施例中,用对应于编码IMYPNO1的cDNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得IMYPNO1 cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为5′-TAGGGGATCCATGCCCTCCGAAGCTGACA-3′(SEQ ID NO.5),该引物含有BamHI限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的IMYPNO1编码序列的19个核苷酸;3′端引物序列为5’-GTGAAAGCTTCTAGTGCATGTCAGAGTTT-3’(SEQ ID NO.6),该引物含有HindIII限制性内切酶的酶切位点、翻译终止子和IMYPNO1的部分编码序列。
引物上的限制性内切酶的酶切位点对应于细菌表达载体pQE-9(Qiagen Inc.,Chatsworth,CA)上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr)、一个细菌复制起点(ori)、一个IPTG-可调启动子/操纵子(P/O)、一个核糖体结合位点(RBS)、一个6-组氨酸标记物(6-His)以及限制性内切酶克隆位点。
用BamHI和HindIII消化pQE-9载体以及插入片段,随后将插入片段连接到pQE-9载体并保持开放读框在细菌RBS起始。随后用连接混合物转化购自Qiagen,商品名为M15/rep4的E.coli菌株,M15/rep4含有多拷贝的质粒pREP4,其表达lacI阻遏物并携带卡那霉素抗性(Kanr)。在含有Amp和Kan的LB培养皿上筛选转化子,抽提质粒,测序验证IMYPNO1的cDNA片段已正确插入了载体。
在补加Amp(100μg/ml)和Kan(25μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的阳性转化子克隆。过夜(O/N)培养物以1∶100-1∶250的稀释率稀释,然后接种到大体积培养基中,培养细胞至600光密度(OD600)为0.4-0.6,随后加入IPTG(“异丙基硫代-β-D-半乳糖苷”)至终浓度为1mM。通过使lacI阻遏物失活,IPTG诱导启动P/O导致基因表达水平提高。继续培养细胞3-4小时,随后离心(6000×g,20分钟)。超声裂解包涵体,收集细胞并将细胞沉淀溶于6M的盐酸胍中。澄清后,通过在能使含6-His标记物蛋白紧密结合的条件下,用镍-螯合柱层析从溶液中纯化溶解的IMYPNO1。用6M盐酸胍(pH5.0)从柱中洗脱IMYPNO1。可用几种方法从盐酸胍中变性沉淀蛋白。或者,使用透析步骤除去盐酸胍,或者从镍-螯合柱中分离出纯化蛋白。纯化后的蛋白质被结合到第二个柱中,该柱中具有递减的线性盐酸胍梯度。在结合到该柱时蛋白质变性,随后用盐酸胍(pH5.0)洗脱。最后,将可溶的蛋白质用PBS进行透析,然后将蛋白质保存在终浓度为10%(w/v)甘油的贮存液中。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为约49kDa。
此外,用常规方法对达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.4的序列一致。
实施例4IMYPNO1在真核细胞(CHO细胞株)中的表达在该实施例中,用对应于编码IMYPNO1的cDNA序列的5′和3′端的PCR寡核苷酸引物进行扩增,获得IMYPNO1 cDNA作为插入片段。
PCR反应中使用的5′寡核苷酸引物序列为5′-TAGGGGATCCATGCCCTCCGAAGCTGACA-3′(SEQ ID NO.5)该引物含有BamHI限制性内切酶的酶切位点,在该酶切位点之后是由起始密码子开始的IMYPNO1编码序列的19个核苷酸;3′端引物序列为5’-GTGAGAATTCCTAGTGCATGTCAGAGTTT-3’(SEQ ID NO.7)该引物含有EcoRI限制性内切酶的酶切位点、一个翻译终止子和IMYPNO1的部分编码序列。
引物上的限制性内切酶的酶切位点对应于CHO细胞表达载体pcDNA3上的限制性内切酶酶切位点,该质粒载体编码抗生素抗性(Ampr和Neor)、一个噬菌体复制起点(f1 ori)、一个病毒复制起点(SV40 ori)、一个T7启动子、一个病毒启动子(P-CMV)、一个Sp6启动子、一个SV40启动子、一个SV40加尾信号和相应的polyA顺序、一个BGH加尾信号和相应的polyA顺序。
用BamHI消化pcDNA3载体以及插入片段,随后将插入片段连接到pcDNA3载体。随后用连接混合物转化E.coli DH5α菌株。在含有Amp的LB培养皿上筛选转化子,在补加Amp(100μg/ml)的LB液体培养基中过夜培养(O/N)含所需构建物的克隆。抽提质粒,测序验证IMYPNO1的cDNA片段已正确插入了载体。
质粒转染CHO细胞是采用脂转染法,用Lipofectin试剂盒(GiBco Life)进行的。转染48小时后,经2-3周的持续G418加压筛选,收集细胞及细胞上清测定表达蛋白酶活力。去G418,连续传代培养;对混合克隆细胞极限稀释,选择具有较高蛋白活性的细胞亚克隆。按常规方法大量培养上述阳性亚克隆。48小时后,开始收集细胞及上清,用超声裂解方法破碎细胞。以含0.05%Triton的50mMTris·HCl(pH7.6)溶液为平衡液及洗脱液,用经预平衡的Superdex G-75柱收集上述蛋白的活性峰。再用50mM Tris·HCl(pH8.0)平衡的DEAE-Sepharose柱,以含0-1M NaCl的50mM Tris·HCl(pH8.0)溶液为洗脱液进行梯度洗脱,收集上述蛋白的活性峰。然后以PBS(pH7.4)为透析液对表达蛋白溶液进行透析。最后冻干保存。
用12%的SDS-PAGE胶进行电泳,鉴定表达蛋白的分子量大小为49kDa。
此外,用常规方法对达蛋白的N端和C端各10个氨基酸长度的氨基酸进行测序,发现与SEQ ID NO.4的序列一致。
实施例5制备抗体将实施例3和4中获得的重组蛋白用来免疫动物以产生抗体,具体如下。重组蛋白用层析法进行分离后备用。也可用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中切下,并用等体积的完全Freund’s佐剂乳化。用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原,对小鼠以50-100μg/0.2ml的剂量进行腹膜内注射以加强免疫。每隔14天进行一次加强免疫,至少进行三次。获得的抗血清的特异反应活性用它在体外沉淀IMYPNO1基因翻译产物的能力加以评估。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表(1)一般信息(i)申请人上海新黄浦复旦基因工程有限公司(ii)发明名称新的人蛋白质磷酸酯酶亚基、其编码序列及制备方法(iii)序列数目7(2)SEQ ID NO.1的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.1CTGCGGGACC ACAGCTATGT GAC23(2)SEQ ID NO.2的信息(i)序列特征(A)长度23碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.2CAGCTGTCCT CATCAGTGCT GTG23(2)SEQ ID NO.3的信息(i)序列特征(A)长度1492bp(B)类型核酸
(C)链性单链(D)拓扑结构线性(ii)分子类型cDNA(xi)序列描述SEQ ID NO.31 CTGCGGGACC ACAGCTATGT GACTGAAGGT AACGTACGTG TTGTCTGAGA CCCCTCCGGC61 CGGCCGCGGC GTGGGGATGC CTCGCACCGA ATGCCCTCCG AAGCTGACAT CATCTCTACC121 GTTGAGTTCA ACCACACGGG AGAGCTGCTG GCCACAGGTG ACAAGGGCGG CCGGGTCGTC181 ATCTTCCAGC GGGAACCAGA GAGTAAAAAT GCGCCCCACA GCCAGGGCGA CTACGACGTG241 TACAGCACTT TCCAGAGCCA CGAGCCGGAG TTTGACTATC TCAAGAGCCT GGAGATAGAG301 GAGAAGATCA ACAAGATCAA GTGGCTCCCA CAGCAGAACG CCGCCCACTC ACTCCTGTCC361 ACCAACGATA AAACTATCAA ATTATGGAAG ATTACCGAAC GAGATAAAAG GCCCGAAGGA421 TACAACCTGA AGGATGAAGA GGGGAAACTT AAGGACCTGT CCACGGTGAC GTCACTGCAG481 GTGCCAGTGC TGAAGCCCAT GGATCTGATG GTGGAGGTGA GCCCTCGGAG GATCTTTGCC541 AATGGCCACA CCTACCACAT CAACTCCATC TCCGTCAACA GTGACTGCGA GACCTACATG601 TCGGCGGATG ACCTGCGCAT CAACCTCTGG CACCTGGCCA TCACCGACAG GAGCTTCAAC661 ATCGTGGACA TCAAGCCGGC CAACATGGAG GACCTTACGG AGGTGATCAC AGCATCTGAG721 TTCCATCCGC ACCACTGCAA CCTCTTCGTC TACAGCAGCA GCAAGGGCTC CCTGCGGCTC781 TGCGACATGC CGGCAGCTGC CCTGTGTGAC AAGCATTCCA AGCTCTTTGA AGAGCCTGAG841 GACCCCAGTA ACCGCTCATT CTTCTCGGAA ATCATCTCCT CCGTGTCCGA CGTGAAGTTC901 AGCCACAGCG ACCGCTACAT GCTCACCCGG GACTACCTTA CAGTCAAGGT CTGGGACCTG961 AACATGGAGG CAAGACCCAT AGAGACCTAC CAGGTCCATG ACTACCTTCG GAGCAAGCTC1021 TGTTCCCTGT ACGAGAACGA CTGCATTTTC GACAAGTTTG AATGTGCCTG GAACGGGAGC1081 GACAGTTCAA TCATGACCGG GGCCTACAAC AACTTCTTCC GCATGTTCGA TCGGAACACC1141 AAGCGGGACG TGACCCTGGA GGCCTCGAGG GAAAGCAGCA AGCCCCGGGC TGTGCTCAAG1201 CCACGGCGCG TGTGCGTGGG GGGCAAGCGC CGGCGTGATG ACATCAGTGT GGACAGCTTG1261 GACTTCACCA AGAAGATCCT GCACACGGCC TGGCACCCGG CTGAGAACAT CATTGCCATC1321 GCCGCCACCA ACAACCTGTA CATCTTCCAG GACAAGGTAA ACTCTGACAT GCACTAGGTA1381 TGTGCAGTTC CCGGCCCCTG CCACCCAGCC TCATGCAAGT CATCCCCGAC ATGACCTTCA1441 CGACCGCAAT GCAAGGAGGG GAAGAAAGTC ACAGCACTGA TGAGGACAGC TG(2)SEQ ID NO.4的信息(i)序列特征
(A)长度428个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型多肽(xi)序列描述SEQ ID NO.41 Met Pro Ser Glu Ala Asp Ile Ile Ser Thr Val Glu Phe Asn His16 Thr Gly Glu Leu Leu Ala Thr Gly Asp Lys Gly Gly Arg Val Val31 Ile Phe Gln Arg Glu Pro Glu Ser Lys Asn Ala Pro His Ser Gln46 Gly Asp Tyr Asp Val Tyr Ser Thr Phe Gln Ser His Glu Pro Glu61 Phe Asp Tyr Leu Lys Ser Leu Glu Ile Glu Glu Lys Ile Asn Lys76 Ile Lys Trp Leu Pro Gln Gln Asn Ala Ala His Ser Leu Leu Ser91 Thr Asn Asp Lys Thr Ile Lys Leu Trp Lys Ile Thr Glu Arg Asp106 Lys Arg Pro Glu Gly Tyr Asn Leu Lys Asp Glu Glu Gly Lys Leu121 Lys Asp Leu Ser Thr Val Thr Ser Leu Gln Val Pro Val Leu Lys136 Pro Met Asp Leu Met Val Glu Val Ser Pro Arg Arg Ile Phe Ala151 Asn Gly His Thr Tyr His Ile Asn Ser Ile Ser Val Asn Ser Asp166 Cys Glu Thr Tyr Met Ser Ala Asp Asp Leu Arg Ile Asn Leu Trp181 His Leu Ala Ile Thr Asp Arg Ser Phe Asn Ile Val Asp Ile Lys196 Pro Ala Asn Met Glu Asp Leu Thr Glu Val Ile Thr Ala Ser Glu211 Phe His Pro His His Cys Asn Leu Phe Val Tyr Ser Ser Ser Lys226 Gly Ser Leu Arg Leu Cys Asp Met Pro Ala Ala Ala Leu Cys Asp241 Lys His Ser Lys Leu Phe Glu Glu Pro Glu Asp Pro Ser Asn Arg256 Ser Phe Phe Ser Glu Ile Ile Ser Ser Val Ser Asp Val Lys Phe271 Ser His Ser Asp Arg Tyr Met Leu Thr Arg Asp Tyr Leu Thr Val286 Lys Val Trp Asp Leu Asn Met Glu Ala Arg Pro Ile Glu Thr Tyr301 Gln Val His Asp Tyr Leu Arg Ser Lys Leu Cys Ser Leu Tyr Glu316 Asn Asp Cys Ile Phe Asp Lys Phe Glu Cys Ala Trp Asn Gly Ser331 Asp Ser Ser Ile Met Thr Gly Ala Tyr Asn Asn Phe Phe Arg Met346 Phe Asp Arg Asn Thr Lys Arg Asp Val Thr Leu Glu Ala Ser Arg361 Glu Ser Ser Lys Pro Arg Ala Val Leu Lys Pro Arg Arg Val Cys376 Val Gly Gly Lys Arg Arg Arg Asp Asp Ile Ser Val Asp Ser Leu391 Asp Phe Thr Lys Lys Ile Leu His Thr Ala Trp His Pro Ala Glu406 Asn Ile Ile Ala Ile Ala Ala Thr Asn Asn Leu Tyr Ile Phe Gln421 Asp Lys Val ASn Ser Asp Met His(2)SEQ ID NO.5的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.5TAGGGGATCC ATGCCCTCCG AAGCTGACA 29(2)SEQ ID NO.6的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.6GTGAAAGCTT CTAGTGCATG TCAGAGTTT 29(2)SEQ ID NO.7的信息(i)序列特征(A)长度29碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ii)分子类型寡核苷酸(xi)序列描述SEQ ID NO.7GTGAGAATTC CTAGTGCATG TCAGAGTTT 29
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人IMYPNO1蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.4所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列。
4.一种分离的IMYPNO1蛋白多肽,其特征在于,它包括具有SEQ ID NO.4氨基酸序列的多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.4序列的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.如权利要求7所述的宿主细胞,其特征在于,该细胞是大肠杆菌。
9.如权利要求7所述的宿主细胞,其特征在于,该细胞是真核细胞。
10.一种产生具有IMYPNO1蛋白活性的多肽的方法,其特征在于,该方法包括(a)将编码具有IMYPNO1蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成IMYPNO1蛋白表达载体,所述的核苷酸序列与SEQ ID NO.3中从核苷酸91-1377位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成IMYPNO1蛋白的重组细胞;(c)在适合表达IMYPNO1蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有IMYPNO1蛋白活性的多肽。
11.如权利要求10所述的方法,其特征在于,该序列为SEQ ID NO.3中从核苷酸91-1377位。
12.一种能与权利要求4所述的IMYPNO1蛋白多肽特异性结合的抗体。
13.一种核苷酸分子,其特征在于,它是权利要求1所述DNA分子的反义序列。
14.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中约8-100个连续核苷酸。
全文摘要
本发明提供了一种新的人基因核苷酸序列。更具体地,本发明提供人IMYPNO1的cDNA序列,该蛋白是兔蛋白质磷酸酯酶2A1(protein phosphatase 2A1,简称“PP2A1”)的B-gama亚基蛋白的同系物。本发明还提供由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
文档编号C12N15/11GK1250096SQ9812092
公开日2000年4月12日 申请日期1998年10月5日 优先权日1998年10月5日
发明者余龙, 屠强, 毕安定, 赵勇, 赵寿元 申请人:上海新黄浦复旦基因工程有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1