新的成视网膜细胞瘤蛋白结合蛋白及其制法和用途的制作方法

文档序号:439755阅读:313来源:国知局
专利名称:新的成视网膜细胞瘤蛋白结合蛋白及其制法和用途的制作方法
技术领域
本发明涉及基因工程领域,具体地,本发明涉及一种新的人基因核苷酸序列。更具体地说,本发明涉及编码人Creaml的cDNA序列,该基因编码产物是一种新的转录调控因子,也是成视网膜细胞瘤蛋白(Rb蛋白)的结合蛋白。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
成视网膜细胞瘤基因也被简称为Rb基因,它是第一个发现的肿瘤抑制基因(Goodrich和Lee,1993,Biochim.Biophy.Acta 1155:43-61)。Rb基因编码Rb蛋白(成视网膜细胞瘤蛋白)。在细胞周期中,Rb蛋白是细胞周期G1期关卡的重要组成成分。Rb蛋白功能的丧失会导致肿瘤发生和发育缺陷(Weinberg,Cell 81,323-330(1995);Lin等人,Cancer Biol.7,279-89(1996);Tan和Wang,Trends.Cell Biol.8,116-20(1998))。
数种DNA肿瘤病毒的转化蛋白,包括SV40的大T抗原、腺病毒的E1a和16型乳头瘤病毒的E7蛋白,会在病毒感染时直接与Rb的T抗原结合域作用。这一步骤对于随后转化宿主细胞而言是至关重要的。这一作用导致一些对细胞周期进展关键的Rb结合蛋白(如E2F1)发生解离,从而绕过正常细胞的作用机理(在正常机理中,在G1后期只有Rb被“细胞周期蛋白依赖性激酶”磷酸化时,这些因子才被释放)。因此,细胞周期失去了正常的调控机制,这是肿瘤细胞的特点。天然发生的肿瘤细胞则采用使Rb因突变而失活的策略。结果,发现Rb功能的各种不同突变存在于100%视网膜细胞瘤、以及其他一些肿瘤(如骨肉瘤、肺癌、和膀胱癌)中(Goodrich和Lee,1993,Biochim.Biophy.Acta1155:43-61)。
此外,最近的研究还发现Rb蛋白在早期的胚胎发育和组织分化方面也有非常重要的作用。Rb缺陷型小鼠会在胚胎第14和15天死亡,并且有神经生成和造血方面的异常(Lin等人,同上)。
Rb在小鼠的脂肪形成过程中也是需要的。与Rb在细胞周期中常见的抑制作用不同,Rb似乎通过直接作用而激活C/EBP,从而调节脂肪细胞的分化(Chen,P.L.等人,Genes.Dev.10,2794-2804(1996))。
此外,在没有功能性的Rb蛋白时,鼠骨骼肌细胞不能充分分化,因为分化的肌细胞会再进入细胞周期(Gu,W.等人,Cell 72,309-324(1993);Zacksenhaus等人,Genes.Dev.10,3051-3064(1996))。Rb可能是通过激活MyoD而发挥其在肌形成过程中的作用。此外,Rb和转录抑制因子HBP1的化学计量比对于成肌细胞的分化也有作用(Shih,H.H.等人,Mol.Cell.Biol.18,4732-4743(1998))。
研究已表明,Rb蛋白是脊椎动物细胞周期和发育中重要的调控蛋白。它是通过直接与细胞周期进行和分化中所涉及的蛋白因子发生作用而发挥其功能的。
转录因子TFⅡ-Ⅰ是一种多功能的转录调节物。它最初被鉴定为起始子的结合因子,通过结合无TATA(TATA-less)启动子中的起始子位点而参与转录调控(Roy,A.L.Nature365,355-359(1993))。TFⅡ-Ⅰ有6个保守的重复序列(Roy,A.L.,等人,EMBO.J.16:7091-7104(1997);Grueneberg,D.A.等人,Genes Dev.11:2482-2493(1997))。尽管重复序列的生理作用尚不清楚,但是螺旋-环-螺旋样结合域的存在暗示它们可能参与DNA结合(Roy,A.L.等人,同上)。已表明,TFⅡ-Ⅰ可结合于不同的DNA序列。另一方面,TFⅡ-Ⅰ还与其他各种转录因子直接作用,例如c-myc(Roy A.L.,Nature 365,359-361(1993))、USFl(Roy,A.L.,等人,EMBO.J.16:7091-7104(1997))、SRF和PhoX1(Grueneberg,D.A.等人,Genes Dev.11:2482-2493(1997))、以及STAT1和STAT2(Kim D.W.Mol.Cell.Biol.18,3310-3320(1998))。此外,TFⅡ-Ⅰ(也称为“BAP-135”)可结合于Bruton氏酪氨酸激酶(btk)[btk是正常的B细胞发育所需的一种细胞质酪氨酸激酶],并且根据btk的活化而使酪氨酸被磷酸化(Yang,W.等人,Proc.Natl.Acad.Sci.USA.94:604-609(1997))。TFⅡ-Ⅰ的酪氨酸磷酸化,对于TFⅡ-Ⅰ的起始子依赖性的转录活性而言是至关重要的(Novian,C.D.等人,J.Biol.Chem.273,33443-33448(1998))。这些特性暗示,TFⅡ-Ⅰ的作用可能是协调基本的转录机制以及一组响应某些信号途径的上游调控因子。最后,半合子状态(hemizygosity)的TFⅡ-Ⅰ与Williams综合症有关(Perez-Jurado,L.A.等人,Hum.Mol.Genet.7,325-334(1998))。
Williams综合症是一种先天的神经性紊乱综合症。Williams综合症的症状包括多种系统的缺陷,例如智力发育迟缓等,尤其表现为认知的障碍。该疾病在世界人口中发病率约1∶20,000。为了减少该疾病的发病率,人们迫切需要开发新的有效的产前诊断方法。
由于,Rb蛋白和/或“Rb蛋白结合蛋白”的异常与一些疾病相关,因此,为治疗目的研究和开发Rb蛋白的结合蛋白,即与Rb蛋白发生相互作用的蛋白具有重要意义。
本发明旨在解决已有技术的这些和其它的问题,提供了一种Rb蛋白结合蛋白以及该蛋白在诊断Williams综合症等方面的应用。
本发明的一个目的是提供一种新的多核苷酸,该多核苷酸编码一种Rb蛋白结合蛋白,本发明的新的Rb蛋白结合蛋白基因被命名为人Creaml基因。
本发明的另一个目的是提供一种新的Rb蛋白结合蛋白,该蛋白被命名为人Creaml蛋白。
本发明的再一个目的是提供一种利用重组技术生产所述的新的人的Creaml多肽的方法。
本发明还提供了这种人的Creaml核酸序列和多肽的应用,尤其在诊断Williams综合症的应用方面的用途。
在本发明的第一方面,提供了一种分离出的DNA分子,它包括编码具有人Creaml蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQID NO.1中从核苷酸8-2887位的核苷酸序列杂交。较佳地,所述的序列编码一多肽,该多肽具有SEQ ID NO.2所示的序列。更佳地,该序列具有SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列。
在本发明的第二方面,提供了一种分离的人Creaml蛋白多肽,它包括具有SEQ IDNO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.2序列的多肽。
在本发明的第三方面,提供了一种载体,它含有上述分离出的DNA。
在本发明的第四方面,提供了一种所述载体转化的宿主细胞。
在本发明的第五方面,提供了一种产生具有人Creaml蛋白活性的多肽的方法,该方法包括(a)将编码具有人Creaml蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人Creaml蛋白表达载体,所述的核苷酸序列与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成人Creaml蛋白的重组细胞;(c)在适合表达人Creaml蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有人Creaml蛋白活性的多肽。
在本发明的第六方面,提供了模拟、促进、拮抗人Creaml蛋白多肽活性的化合物,以及抑制人Creaml蛋白多肽的表达的化合物。还提供了筛选和/或制备这些化合物的方法。较佳地,该化合物是人Creaml蛋白多肽的编码序列或其片段的反义序列。
在本发明的第七方面,提供了用上述化合物来调节人Creaml蛋白在体内、体外活性的方法。
在本发明的第八方面,提供了一种检测与人Creaml蛋白多肽异常表达相关的疾病或疾病易感性(尤其是William综合症)的方法,该方法包括检测编码所述多肽的核酸序列中是否存在突变,或者检测基因组中Creaml基因是否处于半合状态。
在本发明的第九方面,提供了本发明多肽和编码序列的用途。例如本发明多肽可被用于筛选促进人Creaml蛋白多肽活性的激动剂,或者筛选抑制人Creaml蛋白多肽活性的拮抗剂、或者被用于肽指纹图谱鉴定。本发明的人Creaml蛋白的编码序列或其片段,可被作为引物用于PCR扩增反应,或者作为探针用于杂交反应,或者用于制造基因芯片或微阵列。
在本发明的第十方面,提供了一种药物组合物,它含有安全有效量的本发明的人Creaml蛋白多肽以及药学上可接受的载体。这些药物组合物可治疗William综合症、癌症、心血管疾病等病症。
本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。
在本申请,使用以下缩写BD: Gal 4的DNA结合域Ccr1-3: Creaml蛋白的保守区1-3Cr1-5: Creaml蛋白的重复序列1-5EST表达序列标志IIF直接免疫荧光Inr起始子MBP麦芽糖结合蛋白NLS核定位信号SIEc-sis血小板衍生生长因子诱导元件SRE血清应答元件Tcr1-3 TFⅡ-1的保守区1-3TnIs 慢肌纤维特异性肌钙蛋白ⅠTr1-6TFⅡ-Ⅰ的重复序列1-6在本发明的一个具体实施方案中,本发明的分离的多核苷酸全长为683个核苷酸,其详细序列见SEQ ID NO.1,其中开放读框位于8-2887位核苷酸。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“人Creaml蛋白(或多肽)编码序列”指编码具有人Creaml蛋白活性的多肽的核苷酸序列,如SEQ ID NO.1中8-2887位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.1序列的编码框8-2887位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ ID NO.1中8-2887位核苷酸序列同源性低至约70%的简并序列也能编码出SEQID NO.2所述的序列。该术语还包括能在中度严紧条件下,更佳地在高度严紧条件下,与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列杂交的核苷酸序列。还术语还包括与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%。最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与人Creaml相同功能的蛋白的、SEQ ID NO.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5'和/或3'端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“人Creaml蛋白多肽”指具有人Creaml蛋白活性的SEQ ID NO.2序列的多肽。该术语还包括具有与人Creaml相同功能的、SEQ ID NO.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人Creaml蛋白的活性片段和活性衍生物。
该多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧度条件下能与人Creaml DNA杂交的DNA所编码的蛋白、以及利用抗人Creaml多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含人Creaml多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括了人Creaml多肽的可溶性片段。通常,该片段具有人Creaml多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。作为人Creaml多肽的可溶性片段的一种用途,它们可以被用作免疫原性的抗原来免疫动物,以制备抗Creaml多肽的抗体。
发明还提供人Creaml蛋白或多肽的类似物。这些类似物与天然人Creaml多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,“人Creaml保守性变异多肽”指与SEQ ID NO.2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个,最佳地至多3个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行氨基酸替换而产生。
表1
本发明还包括人Creaml多肽编码序列及其片段的反义序列。这种反义序列可用于抑制细胞内人Creaml的表达。
本发明还包括一种可用作探针的核酸分子,该分子通常具有人Creaml多肽编码序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码人Creaml的核酸分子。
本发明还包括检测人Creaml核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于人Creaml多肽的编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
在本发明中,可选用本领域已知的各种载体,如市售的载体。比如,选用市售的载体,然后将编码本发明多肽的核苷酸序列可操作地连于表达调控序列,可以形成蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于” 意味着相邻近,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞, 昆虫细胞、和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
另一方面,本发明还包括对人Creaml DNA或是其片段编码的多肽具有特异性的多克隆抗体和单克隆抗体,尤其是单克隆抗体。这里,“特异性”是指抗体能结合于人Creaml基因产物或片段。较佳地,指那些能与人Creaml基因产物或片段结合但不识别和结合于其它非相关抗原分子的抗体。本发明中抗体包括那些能够结合并抑制人Creaml蛋白的分子,也包括那些并不影响人Creaml蛋白功能的抗体。本发明还包括那些能与修饰或未经修饰形式的人Creaml基因产物结合的抗体。
本发明不仅包括完整的单克隆或多克隆抗体,而且还包括具有免疫活性的抗体片段,如Fab′或(Fab)2片段;抗体重链;抗体轻链;遗传工程改造的单链Fv分子(Ladner等人,美国专利No.4,946,778);或嵌合抗体,如具有鼠抗体结合特异性但仍保留来自人的抗体部分的抗体。
本发明的抗体可以通过本领域内技术人员已知的各种技术进行制备。例如,纯化的人Creaml基因产物或者其具有抗原性的片段,可被施用于动物以诱导多克隆抗体的产生。与之相似的,表达人Creaml或其具有抗原性的片段的细胞可用来免疫动物来生产抗体。本发明的抗体也可以是单克隆抗体。此类单克隆抗体可以利用杂交瘤技术来制备(见Kohler等人,Nature 256;495,1975;Kohler等人,Eur.J.Immunol.6:511,1976;Kohler等人,Eur.J.Immunol.6:292,1976;Hammerling等人,In Monoclonal Antibodies andT Cell Hybridomas,Elsevier,N.Y.,1981)。本发明的抗体包括能阻断人Creaml功能的抗体以及不影响人Creaml功能的抗体。本发明的各类抗体可以利用人Creaml基因产物的片段或功能区,通过常规免疫技术获得。这些片段或功能区可以利用重组方法制备或利用多肽合成仪合成。与人Creaml基因产物的未修饰形式结合的抗体可以用原核细胞(例如E.coli)中生产的基因产物来免疫动物而产生;与翻译后修饰形式结合的抗体(如糖基化或磷酸化的蛋白或多肽),可以用真核细胞(例如酵母或昆虫细胞)中产生的基因产物来免疫动物而获得。
本发明的人Creaml核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得含有关序列的DNA。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。目前,已经可以完全通过化学合成来编码本发明蛋白(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中的各种DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
可以将本发明的多肽和拮抗剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。
本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。
药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。Creaml以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的Creaml的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。
人Creaml蛋白的多聚核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于Creaml的无表达或异常/无活性的Creaml的表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计成表达变异的Creaml,以抑制内源性的Creaml活性。例如,一种变异的Creaml可以是缩短的、缺失了信号传导功能域的Creaml,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗Creaml表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将Creaml基因转移至细胞内。构建携带Creaml基因的重组病毒载体的方法可见于已有文献(Sambrook,et al.)。另外重组人Creaml蛋白基因可包装到脂质体中然后再转移至细胞内。
抑制人Creaml蛋白mRNA的寡聚核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。
多聚核苷酸导入组织或细胞内的方法包括将多聚核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多聚核苷酸导入细胞中,再将细胞移植到体内等。
本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析。
本发明还提供了针对人Creaml蛋白抗原决定簇的抗体。这些抗体包括(但不限于)多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。
抗人Creaml蛋白的抗体可用于免疫组织化学技术中,检测活检标本中的人Creaml蛋白。
与人Creaml蛋白结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。
本发明中的抗体可用于治疗或预防与人Creaml蛋白相关的疾病。给予适当剂量的抗体可以刺激或阻断人Creaml蛋白的产生或活性。
抗体也可用于设计针对体内某一特殊部位的免疫毒素。如人Creaml蛋白高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭人Creaml蛋白阳性的细胞。
多克隆抗体的生产可用人Creaml蛋白或多肽免疫动物,如家兔,小鼠,大鼠等。多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。
人Creaml蛋白单克隆抗体可用杂交瘤技术生产(Kohler and Milstein.Nature,1975,256:495-497)。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrison等,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗人Creaml蛋白的单链抗体。
能与人Creaml蛋白结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,必须对人Creaml蛋白分子进行标记。
本发明还涉及定量和定位检测人Creaml蛋白水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的人Creaml蛋白水平,可以用作解释人Creaml蛋白在各种疾病中的重要性和用于诊断Creaml起作用的疾病。
Creaml的多聚核苷酸可用于Creaml相关疾病的诊断和治疗。在诊断方面,Creaml的多聚核苷酸可用于检测Creaml的表达与否或在疾病状态下Creaml的异常表达。如CreamlDNA序列可用于对活检标本的杂交以判断Creaml的表达异常。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Mlcroarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用Creaml特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测Creaml的转录产物。
检测Creaml基因的突变也可用于诊断Creaml相关的疾病。Creaml突变的形式包括与正常野生型Creaml DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。
本发明多肽和多核苷酸的上述及其他用途包括例如,本发明多肽可用于肽指纹图谱鉴定;本发明的人Creaml蛋白的编码序列或其片段,可被作为引物用于PCR扩增反应;或者作为探针用于杂交反应,或者用于制造基因芯片或微阵列。根据本发明的教导,这些应用对于本领域技术人员而已是显而易见的。
Creaml蛋白是本发明人鉴定出的一个新的与Rb结合的候选蛋白。它能在体外条件下通过C端与Rb特异性地结合,因此是一种Rb蛋白结合蛋白。
在结构上,Creaml蛋白是一个广泛表达的含有959个氨基酸,分子量约120Kda的核蛋白,有一个与SV40大T抗原核定位信号相似的核定位信号。Creaml的氨基酸序列含有5个与多功能转录调节因子TFⅡ-Ⅰ有一定同源性的重复序列。除了这5个重复序列外,Creaml另外还有3个与TFⅡ-Ⅰ高度同源的区域。TFⅡ-Ⅰ在无TATA盒的转录起始体系中起着重要的作用,而且它受一些信号传导通路的调控。但是不同之处在于,Creaml能形成同二聚体,而与TFⅡ-Ⅰ不能形成异二聚体。
此外,Creaml与最近发现的一个新的肌肉细胞增强子结合蛋白MusTRD1高度同源,但MusTRD1只含有Creaml的N端的458个氨基酸,造成这种结果的原因是MusTRDl cDNA编码区多一个“G”,导致读框移码。它们之间的关系暗示着Creaml可能参与肌肉细胞的基因表达调控。
除此之外,Creaml基因位于染色体7q11.23区域上,含27个外显子,结果基因总长度超过150Kb。该基因位于Williams综合症病人的染色体缺失区内。该基因在一条染色体上的缺失有可能是Williams综合症中某些病症的病因。因而,该基因可用于Williams综合症的产前诊断。
综上所述,Creaml蛋白很可能是处于Rb调控之下的一种普遍存在的转录调节因子。由于本发明的Creaml具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
在附图中,


图1显示了Creaml cDNA核苷酸序列和推测的氨基酸序列。
(A)Creaml不同的cDNA克隆,克隆S22在1,406核苷酸位置上有一个“G”的缺失;克隆S21缺失了1,977-2,021的核苷酸序列。最后一个克隆是完整的核苷酸序列,黑框区域表示编码区,并标明了构建质粒所用的限制性酶切位点。
(B)cDNA序列以及推测的Creaml氨基酸序列。划线的部分是推测的核定位信号及一串丝氨酸。推导的NLS被框出。
图2显示了TFⅡ-Ⅰ和Creaml之间序列的比较。其中,图2A显示了两个蛋白质的结构特性,相同形式的框代表同源区。图2B显示了TFⅡ-Ⅰ(Tr1-6)和Creaml(Cr1-5)这11个重复序列的序列比较。在保守序列中,出现频率高的列在第一行,而其它相近的氨基酸残基列在第二行(下列氨基酸被视为同源L、V和I,Y和F,S和T,K和R,E和D)。划粗线部分代表在所有的重复序列中最保守的区域,长度含有80个氨基酸残基。图2C显示了Tcr13和Ccr1-3保守区域的氨基酸顺序。划线的氨基酸是参与二聚体形成的“疏水拉链”结构中的疏水性氨基酸。
图3A显示了Creaml基因结构图。Creaml的基因结构是根据华盛顿大学医学院基因组测序中心的R.H.Waterston博士公布在Genbank中的DJ0665P05号基因克隆(约133Kb,Genbank的登录号是AC004851)和DJ1186P10(约149Kb,Genbank的登录号是AC005231)排列成的。这个基因目前分布于四个片段中,它们之间有3段未知长度的间隔。每个外显子的第一个和最后一个核苷酸都按照它们在cDNA上的排列位置表示出来。外显子的长度没有按比例画出来。图3B显示了Creaml中的外显子-内含子边界。
图4显示了Creaml基因在Williams综合症的关键区域内。在这个关键区域已知的基因包括ELN(编码弹性蛋白),LIMK1(编码LIM激酶1),RFC2(编码复制因子C),FZD3(编码frizled同源物),STX1A(编码突出融合蛋白1A),以及GTF21(编码TFⅡ-Ⅰ)。
(A)A图显示由其它研究人员发表的基因连锁图谱。黑框部分代表Williams综合症的关键区域,GTF2IP是GTF2I的假基因拷贝。
(B)RH图谱是从公布在NIH网站上的98年基因图谱中人类第7号染色体从D7S2415-D7S669的区域内获得的。Distance代表到染色体短臂端粒的距离,序列标记的位点(STS),以及相应的基因的名称也已列出。
图5显示了Creaml能与Rb在体外条件下结合。
(A)在这个体系使用的与多聚组氨酸(His6)融合的p56Rb。图5A图显示的是His6p56Rb从细菌裂解液中纯化后,经过10%SDS聚丙烯酰胺电泳后,通过抗多聚组氨酸的单克隆抗体经免疫印记法显示的带。该图显示了His6-P56RB的大小以及纯度。
(B)图5B图显示的是不同的FLAG融合蛋白,通过8%SDS聚丙烯酰胺凝胶电泳后,用抗FLAG的单克隆抗体经免疫印迹法显出的带。它表示出在膜上不同蛋白质的相应含量。
(C)图5C图表示的是与B图同样的膜经过与“RB夹心物”(即1μgHis6P56RB,1μg抗His6的单克隆抗体以及1μl碱性磷酸酯酶耦联的羊抗兔IgG所形成的免疫复合物)在冰上温育3小时后,经免疫印迹法显示的带。箭头所指为不同FLAG融合蛋白的位置,其它带为细菌蛋白。
(D)图5D图显示的是该体系所用的两个Creaml突变体的结构。
图6显示了抗Creaml多克隆抗体T8的特异性。
(A).泳道2是12%SDS聚丙烯酰胺凝胶电泳后经考马斯亮兰染色显示的蛋白条带,泳道1是MBP-p05融合蛋白,泳道2是用十因子酶切后的MBP-P05(下面两条约30KDa左右的带是P05,即免疫兔子产生抗Creaml多克隆抗体的抗原;中间一条是MBP。)。泳道3是酶切后的MBP-P05与免疫前血清经免疫印迹法显色后的结果,没有出现蛋白带,说明免疫前血清不能识别抗原。泳道4是酶切后的MBP-P05与T8经免疫印迹法显色后的结果,说明T8能特异性地识别抗原(P05)。
(B)泳道1,3,5是Creaml的突变体FLAG-Ap32,泳道2,4,6是全长的His6-TFⅡ-Ⅰ,泳道1-2是与抗体T8经免疫印迹后的结果,泳道3-4是与抗多聚组氨酸的单克隆抗体经免疫印迹后的结果,泳道5-6是与抗FLAG的单克隆抗体经免疫印迹后的结果,该图表示抗体T8只特异地识别FLAG-Ap32,而不识别TFⅡ-Ⅰ。
图7.(A)在CV1(非洲绿猴肾细胞)细胞裂解液中鉴定出Creaml是120KDa大小的蛋白质。泳道1,3,5是MBP-P05融合蛋白,泳道2,4,6是CV1细胞裂解液。泳道1,2是与抗体T8经免疫印迹的结果。与泳道3,4反应的抗体T8预先与5μgMBP-P05温育过,与泳道5,6反应的抗体T8预先和5μgMBP温育过。A图说明T8识别的120KDa的蛋白是特异性的,应是creaml。
(B)泳道1是CV1细胞裂解液,泳道2是细菌裂解液中的FLAG-Creaml。B图是通过与抗体T8免疫印迹法显示处的蛋白带。说明FLAG-Creaml与细胞中的野生型的Creaml大小相同,因而我们克隆到的cDNA是全长的。
图8显示了CV1核提取物中USEB1-蛋白复合物的形成。CV1核提取物与放射性标记的含有MusTRD1结合位点的USEB1探针混合。用迁移率分析来检测复合物的形成。利用50,100,300倍的未标记的USEB1,USEB1b(-突变的双链核苷酸)作为竞争者。特异结合条带用箭头指示,非特异结合条带(NS)用箭头表示。
图9显示了Creaml的核定位信号的鉴定。其中,图9A、融合蛋白FLAG-AP32和FLAG-AP32N的结构。图9B、表达FLAG-AP32和FLAG-AP32N的质粒转化到CV1细胞中,经过48小时,细胞用-20℃的冰甲醇固定,然后与抗FLAG的单克隆抗体(图片1,3,5)和抗Creaml的多克隆抗体T8的混合物温育2小时,再与藕联有荧光素的羊抗鼠或羊抗兔的二抗温育1小时,用免疫荧光显微镜观察、拍照。图片1和2是表达FLAG-AP32的细胞,图片3,4也是表达FLAG-AP32的细胞,但与它反应的抗体混合物预先与mbp-p5温育过。图片5和6是表达FLAG-AP32N的细胞。从B图可看出,抗FLAG的单抗和抗Creaml的多克隆抗体识别的蛋白在细胞中的定位是一致的。FLAG-AP32是核蛋白,而去掉核定位信号的FLAG-AP32N是细胞质蛋白,从这个现象可以说明FLAG-AP32N缺失的那一段核苷酸的序列含有Creaml的核定位信号。
图10显示了在酵母双杂交体系中Creaml能形成二聚体。
(A)A图显示的是在这个系统中使用的各种TFⅡ-1和Creaml的突变体的结构。AD代表激活区域,它有激活报告基因转录的作用。DB代表结合DNA的区域,这个区域能使蛋白质结合到DNA上。
(B)结果显示。列出的β半乳糖苷酶活性是两个随机挑选的克隆,通过ONPG方法测得的平均值。His-补偿表示的通过选择性培养基筛选的结果,+表明阳性结果,-阴性结果。从B图可见CreamlN和CreamlN易形成二聚体,AP32和AP2也能形成二聚体,但之间的相互作用转弱。而Creaml和TFⅡ-1之间不能形成异二聚体。
图11显示了Creaml能在体内与Rb结合。CV1细胞用表达Rb和FLAG-Creaml的质粒共转染。48小时后裂解细胞并用图中指定的抗体进行免疫共沉淀(IP)和免疫印迹。使用抗Rb的单克隆抗体不仅能沉淀下Rb蛋白(泳道1),而且还能得到Creaml(泳道3)。相比之下,对照抗体(抗CD4)抗体则不能沉淀Rb(泳道2)和Creaml(泳道4)。
图12A和12B分别显示了质粒pFLAP2和pFCreaml的结构图。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用F说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆实验室手册(New York:Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1人Creaml的cDNA序列的克隆和测定最初的cDNA片段Ap-2,是从HeLa表达cDNA文库中用纯化的Rb蛋白为探针分离出的(Shan,B.Mol Cell.Biol.12,5620-5631(1992))。该片段被放射性标记,以进一步筛选更长的cDNA克隆。由于在所用的文库中ZZ cDNA的丰度低,因此,将胎盘cDNA文库(Clontech)的质粒DNA和人胎脾的Marathon cDNA(Clontech)用作模板,用PCR法获得5'编码序列。
对于pACT2文库,用引物Gal-p(5'-CTATTCGATGATGAAGATACCCCA-3')和2p-r3(5′-GGCCGACTCAGGCCCAGGTCGCT-3')进行第一轮PCR,然后用引物Gal-p和2p-r4(5′-CTTCCTGCTTGAGCTCTCGGATG-3')进行第二轮。
对于人胎脾的Marathon cDNA(Clontech),用引物2p-r5(5′-GTACACATCTGAGCCATGTTCCA-3')和引物AP1(由Clontech提供)进行第一轮PCR,然后用引物2p-r6(5'-ACCTCCTTCGGGTGCTDTGCCT-3')和引物AP2(由Clontech提供)进行第二轮PCR。
PCR片段被亚克隆入pGEM-T Easy载体(Promega)中,用Southern印迹法进行挑选。为了避免因PCR而引入突变,对每种产物的至少3个独立克隆进行测序。挑选出具有多数克隆共有序列的cDNA片段,构建出全长cDNA(SEQ ID NO:1)。
含有整个编码区的cDNA(8-2884)亦通过PCR从人胎脾的Marathon cDNA(Clontech)中扩增出来。扩增出的片段可直接用于构建pFCreaml。所用酶为Pfu DNA多聚酶(Sangon)。引物为引物1:5'CATGGCCTTGCTGGGTAAGCGCTGTGAC 3'引物2:5'CTAGTAATTAAGAGGTCCCGGGAGCTGC 3'质粒构建(1)用于在哺乳动物细胞中表达FLAG-标记的Creaml的质粒。
为了表达全长的、带有FLAG表位标记的Creaml蛋白,将NcoⅠ-ScaⅠ限制性片段(含核苷酸6-2893),用Klenow酶填平末端后连入pCEP4F载体(Zhu,X.Mol.Cell.Biol.15,5017-5029(1995))的NheⅠ位点,从而构建出质粒pFCreaml(
图12B)。
以类似方式,用含核苷酸762-2893的NcoⅠ-ScaⅠ限制性片段构建质粒pFAP32。该质粒表达FLAG-Ap32(含氨基酸253-959)。
用PCR法构建质粒pFAP32N。该质粒FLAG-Ap32N(含氨基酸253-897)。
(2)用于在大肠杆菌中表达FLAG-标记的Creaml的质粒。
为了在大肠杆菌中表达FLAG-Ap32,先将来自pFAP32的2.1kb的NcoⅠ-XhoⅠ限制性片段插入用相同限制性内切酶消化的pTrcHisA(Invitrogen)中。
为了表达全长FLAG-Creaml蛋白,将全长cDNA按阅读框连入pTrcHisA(Invitrogen),得到质粒pFLAP2(
图12A)。
用PstⅠ切割pFLAP2,然后自我连接,形成质粒pFLCreamlp,该质粒表达FLAG-Creamlp(含氨基酸1-455)。
(3)用于酵母双杂交分析的质粒将NcoⅠ-SacⅠ限制性片段(含核苷酸8-2887),插入pAS2-1(Clontech)的NcoⅠ和SalⅠ位点(用Klenow酶填平)之间,以表达BD-Creaml(含氨基酸1-959)。
将PstⅠ片段缺失掉以表达BD-Creamlp(含氨基酸1-455)。
将cDNA克隆Ap-2的EcoRⅠ片段插入pY1(Sadowski,I.,Gene 118,137-141(1992)),以表达BD-Ap2(含氨基酸463-959)。
(4)用于在大肠杆菌中表达其他蛋白的质粒为了表达具有聚组氨酸标记的全长TFⅡ-Ⅰ(His6-TFⅡ-Ⅰ),将来自pI3-CX的3.4kbNotⅠ(用绿豆核酸酶切割)-BamHⅠ片段,连入用NheⅠ和BamHⅠ切割并填平pTrcHisA(Invitrogen)中。通过限制性消化和Western印迹分析而鉴别出所需的构建物pHisⅡ-Ⅰ。
为了表达FLAG-E2F1(含氨基酸123-437),将pGST-SH5(Shan B.等人,Mol.Cell.Biol.12,5620-5631(1992))的1.1kb BamHⅠ-EcoRⅠ片段连入用BglⅡ和XhoⅠ消化过的pFLAGl(IBI)。在连接前用Klenow酶填平EcoRⅠ和XhoⅠ末端。
为了表达FLAG-mitosin10N,将来自pMBP-10/H(Zhu,X.等人,Mol.Cell.Biol.15,5017-5029(1995))1.3kb的EcoRⅠ-HindⅢ限制性片段(用Klenow酶填平)克隆入pFLAG1的EcoRⅠ和SalⅡ位点之间(用Klenow酶填平),得到质粒pF10N。
为了表达His6-p56Rb,用BamHⅠ和EcoRⅠ切割质粒pGEX-2T-RBS(Goodrich,D.W.等人,Biochim.Biophy.Acta 1155,43-61(1993)),该质粒表达有功能的56kDa形式的Rb蛋白。然后将cDNA片段如上插入pTrcHisA(Invitrogen),得到质粒pTrcHisA-RBS。
抗体的产生将Ap-2的0.5kb的EcoRⅠ-AvaⅠ限制性片段(部分消化并用Klenow酶填平),即核苷酸1394-1925,插入用PstⅠ和EcoRⅠ消化的pMAL-c载体(New England Biolabs)中。形成的质粒pMAL-P05被用于表达MBP融合蛋白MBP-P05。在用直链淀粉交联的琼脂糖珠(NewEngland Biolabs)进行亲和纯化后(方法参照厂家的说明),用因子Xa(New EnglandBiolabs)切割融合蛋白。在12%SDS-PAGE后,将免疫原(P05)印迹在Western PVDF膜(Schleicher & Schuell)。将含免疫原的部分切下,按Knudsen,K.A.Anal Biochem.147,285-288(1985)所述的方法免疫兔子。
此外,按Smith,D.E.J.Cell.Biol.99,20-28(1984)所述的方法,用固定在Hybond-C膜(Amersham)上的MBP-P05,从血清中纯化出特异性的抗体。
体外Rb-结合分析按Zhu,X.Mol.Cell.Biol.15,5017-5029(1995)所述的方法,用大肠杆菌BL21株为宿主,表达FLAG-标记或His-标记的融合蛋白。His6-p56Rb用TALON金属亲和树脂(Clontech)纯化(按照厂家提供的方法),并用100mM EDTA(pH8.0)洗脱。对含FLAG-Creamlp、FLAG-Ap32、FLAG-mitosin10N和FLAG-E2F1的细胞裂解液进行8%SDS-PAGE,然后电印迹至Optitran BA-S膜(Schleicher & Schuell)。基本按Shan,B.等人,Mol.Cell.Biol.12,5620-5631(1992)所述的方法,进行体外Rb结合分析。其中Rb夹心复合物的制备是通过将1微克His6-p56Rb、1微升抗-聚组氨酸单克隆抗体(Sigma)和1微升偶联有碱性磷酸酶的羊抗鼠IgG(Promega)混入1毫升结合缓冲液。用CDP-Star化学荧光底物(Promega)显色。
细胞培养和转染将正常的猴肾细胞CV1、人胃癌细胞SGC-7901、人肺腺癌细胞SPC-A1和人卵巢癌细胞H0-8901,维持在补充有10%小牛血清的DMEM(Gibico)培养液中并处于含5%二氧化碳的空气下。用常规的磷酸钙法进行转染。
共免疫沉淀、免疫印迹和间接免疫荧光研究将约2×107个用1∶1的pFCreaml和pCepRB(由Dr.W.-H.Lee提供)共转染的CV1细胞,在1毫升缓冲液A(20mM Tris-HCl,pH 7.5,100mM KCl,0.1%Nonidet P40,1mM EDTA,1mM二硫苏糖醇、10%甘油、50mM NaF和蛋白酶抑制剂)中裂解。离心去除细胞碎片之后,将一半裂解液与5微克抗-Rb单克隆抗体3C8(由Dr.W.-H.Lee提供)一起在4℃孵育过夜,而另一半裂解液与等量的抗-CD4单克隆抗体(Dako)一起孵育。将预先与10微克兔抗-鼠IgG(Anogen)孵育过的25微升A蛋白-Sepharose(Pharmacia)加入,放置2小时。用1毫升缓冲液B(20mM Tris-HCl,pH 7.5,150mM KCl,0.5%Nonidet P40,1mM EDTA,1mM二硫苏糖醇、10%甘油、50mM NaF和蛋白酶抑制剂)洗涤3次。对样品进行8%SDS-PAGE并免疫印迹。
免疫印迹和间接免疫荧光(ⅡF)显微检测是用适当的一级抗体,按Zhu,X.等人,Mol.Cell.Biol.15,5017-5029(1995)所述的方式进行。酶偶联的二级抗体购自Promega。偶联有FITC的二级抗体购自Sino-America Biotechnology Company,Shanghai,China。抗-FLAG M2和抗-聚组氨酸单克隆抗体分别购自Kodak和Sigma公司。在竞争性试验中,将一级抗体与5微克MBP-P05或MBP孵育30分钟,然后进行免疫印迹或ⅡF染色。ⅡF图像用Olympus BX50荧光显微镜记录在Kodak GoldⅢ(ASA400)胶片上。
酵母转化和β-半乳糖苷酶活性分析按照厂商Clontech所建议的条件,用适当的质粒通过乙酸锂法转染酵母Y190株(Clontech)。转化子在缺乏色氨酸的合成培养基上进行筛选。对随机挑选的克隆,用ONPG法测定β-半乳糖苷酶活性。数据如
图10B所示。
结果分析Creaml是一种与TFⅡ-Ⅰ相关的新蛋白根据cDNA序列而推导出的氨基酸序列(SEQ ID NO:2和
图1)表明,该新颖的多肽具有3段保守重复序列,每段重复序列有86个氨基酸。因此,该全长的蛋白被命名为Creaml(protein containing repetirive eighty-six amino-acid motif)。
因为Northern印迹分析表明,存在一普遍表达的约3kb的mRNA(数据未示出),因此用32P-标记的Ap-2为探针来筛选成视网膜细胞瘤Y79 cDNA文库。两个最长的克隆S21(2.2kb)和S22(2.2kb)被进一步研究(
图1A)。序列分析表明,克隆S21缺失了核苷酸1974-2018,但是不破坏阅读框(数据未示出),这可能是由于其他剪接方式所造成的。克隆S22在未知1406处缺失了一个“G”,这导致阅读框移动。对其他cDNA文库的进一步筛选没有发现更长的片段。因此,用PCR对人胎盘cDNA库(Clontech)进行扩增,其中一个引物对应于载体上的序列,而另一引物对应于S22的5'端区域。
然而,最长的PCR产物(B18,0.6kb)仍缺少约200bp的某些编码序列。因此,用人肽脾的Marathon cDNA(Clontech)作为模板进行第二轮PCR扩增,获得了320bp的PCR片段(克隆A1)。拼接后得到SEQ ID NO:1所示的3043bp的核苷酸序列,其开放阅读框位于8-2887,编码959个氨基酸的Creaml蛋白(
图1)。然后构建一cDNA克隆,其中核苷酸1-289来自克隆A1,核苷酸290-762来自克隆B18,核苷酸763-1239来自克隆S22,核苷酸1240-1522来自克隆S2l,其余核苷酸来自Ap-2。所有这些片段都加以测序以排除可能的序列变化。
以读框两侧的序列为引物,用PCR也从胎脾Marathon cDNA(Clontech)中扩增出了同样的cDNA。由于Creaml表达的广泛性,该cDNA亦可通过常规的RT-PCR法从人的组织或细胞的mRNA中扩增出来。
本发明的Creaml与多功能转录调控因子TFⅡ-Ⅰ(也称为BAP-1335或SPIN)有显著的相似性(图2)。首先,Creaml具有一组5个保守重复序列即Cr1-Cr5,这与TFⅡ-Ⅰ的6个重复序列(Tr1-Tr6)是相似的(图2A和2B)。事实上,每个重复序列中的80个残基区域在两种蛋白之间是保守的(图2B,下划线部分)。
其次,Creaml的N端部分(氨基酸30-88,即Ccr1)与TFⅡ-Ⅰ对应的Tcr1(氨基酸22-80)是高度同源的(图2A和2C)。Ccr1和Tcr1都含有在蛋白质-蛋白质作用所涉及的保守的疏水拉链样基序(图2C)(Roy,A.L.等人,EMBO.J.16,7091-7104(1997))。
此外,Creaml中从氨基酸499-510的Ccr2和从氨基酸527-532的Ccr3,也分别对应于TFⅡ-Ⅰ中从氨基酸801-812的Tcr2和从氨基酸224-229的Tcr3(图2A和2C)。这些相似性表明,这两种蛋白属于同一个新的蛋白质家族。
然而,Creaml还具有其独特的特征。其中包括在氨基酸912-923处有一端12个丝氨酸的片段,并且在898-905位有推定的核定位信号(NLS)(
图1B)。该NLS与SV40的大T抗原的NLS相似。
有趣的是,编码一种新的肌肉增强子-结合蛋白(MusTRD1)的cDNA(O'Mahoney,J.V.等人,Mol.Cell.Biol.18,6641-6652(1998)),与Creaml cDNA基本相同。然而,MusTRD1仅长458氨基酸,因为在对应于Creaml cDNA的1307-1309位区域插入了一个额外的“G”而导致阅读框移动。因此,MusTRD1仅含有Creaml的2个重复序列。根据对克隆S21、S22和其他已有EST的序列分析,没有一种序列含有MusTRD1 CDNA所特有的“G”插入。因此,MusTRD1的这种差别可能是在肌肉中的一种特殊形式,也有可能是因为突变或人为因素所导致。
Creaml的基因结构和基因座还确定了Creaml的完整基因结构(图2D)。结构基因Creaml被发现位于基因组克隆DJ0665P05(约133kb,Genbank登录号AC004851)和DJ1186P10(约149kb,Genbank登录号AC005231)中。这两个克隆已经几乎被测序完毕并登录于Genbank中。
Creaml位于4个独立的毗连群中。该基因由位于至少150kb范围内的27个外显子构成(图2D和表1)。外显子2含第一个ATG,并且与外显子3一起编码疏水的拉链样区域Ccr1。保守区域Ccr2和Ccr3的编码序列分别位于外显子13和14。此外,每个Creaml重复序列由3个相邻外显子编码。例如,Cr1由外显子4-6编码;Cr2由外显子8-10编码;Cr3由外显子16-18编码;Cr4由外显子20-22编码;Cr5由外显子23-25编码。在每套3个外显子中,中间一个外显子的程度固定为184bp,除了外显子24为193bp(图2D,表1)。
本发明Creaml cDNA对应于人UniGene Hs.21075。其对应基因被定位于人染色体7q11.23(NIH网点http://www.ncbi.nlm.nih.gov于1998年公布的基因图)。用于定位Creaml的序列标志位点(sts-AA019591),部分位于外显子26和27之间的内含子中并且部分延伸入外显子27中。
重要的是,Creaml基因座位于LIM-激酶和xyntaxin 1A之间。由于这两种基因在William综合症中经常缺失(Frangi skakis,J.M.等人,Cell 86,59-69(1996);Osborne,L.R.等人,Am.J.Hum.Genet.61,449-52(1997)),因此这表明Creaml在该疾病中也常缺失。因此,通过检测Creaml基因的缺失与否,以及Creaml蛋白含量是否异常,可以检测William综合症。
Creaml是一种普遍表达的120kDa蛋白质为了探究Creaml的生化性质,用细菌表达的Creaml多肽抗原(P05)(含氨基酸463-640)来制备兔多克隆抗体。先表达约70kDa麦芽糖结合蛋白融合物(MBP-P05)(图3A,泳道1)。在用因子Xa处理后,MBP-P05被切成2部分单独的MBP(约40kDa)和P05(图3A,泳道2)。P05表现约为30和31kDa的双联体形式,这可能是由于降解或因子Xa在该蛋白上还有别的切割位点的缘故。因为cDNA插入片段并不破坏pMAL-c(New EnglandBiolabs)中LacZα基因的阅读框,因此P05也含有一部分β-gal(约60个残基)。如图3所示,免疫前血清中检测不到蛋白(泳道3)。免疫血清可特异性地识别P05双联体和微量的完整MBP-P05分子,但是不识别MBP尽管其丰度很高(泳道4)。
因为P05含有与TFⅡ-Ⅰ同源的第三重复序列和2个额外区域(
图1和2),因此对抗体进行测试以确定是否与TFⅡ-Ⅰ交叉反应。如图3B所示,在总细菌裂解液中,无论用抗-Creaml多克隆抗体T8(泳道1)还是用抗-FLAG M2单克隆抗体(泳道5)检测,Creaml突变体FLAG-Ap32都可作约为90kDa的片段被特异地检测出。然而,这两种抗体都不识别全长的聚组氨酸标记的TFⅡ-Ⅰ(His6-TFⅡ-Ⅰ)(泳道2和6)。相反,抗-组氨酸单克隆抗体可检测出120kDa的TFⅡ-Ⅰ(泳道4)。这些结果表明,抗-Creaml多克隆抗体T8是高度特异的。
然后用T8抗体来检测非洲绿猴CV1细胞中的内源性Creaml(图4)。该抗体可特异地识别细菌裂解液中的MBP-P05(图4A,泳道1)和CV1总细胞裂解液中的约120kDa的蛋白(泳道2)。为了测试该120kDa的蛋白是Creaml,将抗体与pMAL-c载体表达的MBP或MBP-P05一起预孵育。被MBP-P05所中和后的抗体不能检测MBP-P05(泳道3),也不能检测出120kDa的蛋白(泳道4)。而与MBP一起预孵育对抗体却无影响(泳道5和6)。因此,这些结果表明在CV1细胞中的Creaml在SDS-PAGE中以120kDa蛋白形式迁移。此外,同一蛋白还在各种不同的人细胞系和组织中被检测到,其中包括胚胎肾细胞HEK293、胃癌SGC-7901、肺癌SPC-A1、卵巢癌HO-8901、胎儿和成人骨骼肌、心脏、和胎脑(数据未示出)。通常,该蛋白在所测试样品中的水平都很低。
为了测试Creaml cDNA是否含有完整的阅读框,将细胞中的Creaml与大肠杆菌中表达的FLAG-标记的全长Creaml(FLAG-Creaml)的迁移率进行比较(图4)。结果表明,两者迁移率相近,而且FLAG-Creaml(泳道2)迁移比CV1细胞中内源Creaml(泳道1)稍慢(因为存在FLAG标记)。这证实了SEQ ID NO:1所示的cDNA含有了完整的Creaml编码序列。
Creaml在体内和体外都结合于Rb蛋白分离的Creaml是一种候选的Rb-结合蛋白,最初被命名为Rbap2(Rb-associatedprotein 2,Rb相关蛋白2)。为了证实筛选结果,测试其与Rb相互作用。
为了方便起见,用亲和纯化的聚组氨酸-标记的Rb(His6-p56Rb)来制备“Rb夹心”(图5A)。含mitosin蛋白氨基酸2484-2927的FLAG-mitosin10N(图5B,泳道1)被作为阴性对照(图5C,泳道1)。FLAG-E2F1(含残基123-437)(图5B,泳道3)被用作阳性对照(图5C,泳道3)。测试了Creaml的两种重迭缺失变异体FLAG-Creamlp和FLAG-Ap32(图5D)。FLAG-Ap32可明显与Rb探针作用(图5C,泳道2)。FLAG-Creamlp(图5B,泳道4)却是阴性(图5C,泳道4)。因为克隆Ap2所编码的多肽包括氨基酸463-959,因此这些结果表明,在体外Rb可特异性地与Creaml的C末端部分发生作用。
体内试验。由于内源Creaml的水平低,因此将FLAG-Creaml和Rb在CV1细胞中共表达,以提高这两种蛋白质的局部浓度。用ⅡF染色法检测FLAG-Creaml的表达。当共表达细胞的裂解液用抗-Rb单克隆抗体进行共沉淀后(图ll,泳道1),可用抗-FLAGl单克隆抗体M2在多个试验中轻易地检测出FLAG-Creaml(泳道3)。与之相反,对照抗体(抗-CD4单克隆抗体)不能使Rb(泳道2)或Creaml(泳道4)沉淀。
这表明,Creaml可在体内结合于Rb。我们还进一步证明Creaml亦能与Rb在体内结合(
图11)。为增加细胞内的蛋白浓度,我们利用共转染的办法在细胞内表达了Rb和Creaml。抗Rb抗体不仅能沉淀Rb蛋白(泳道1),还使Creaml也随之沉淀下来(泳道3);作为对照的抗CD4抗体则不沉淀Rb或Creaml。这说明Creaml确为Rb在细胞内的结合蛋白之一。
Creaml的NLS与SV40大T抗原的NLS相似作为潜在的转录调控因子,Creaml应是一种核蛋白。根据氨基酸序列分析,Creaml含有一个与SV40大T抗原的NLS相似的NLS(
图1B)。将表达FLAG-Ap32和FLAG-Ap32N的质粒分别转入CV1细胞。在转染后48小时,用冷甲醇固定细胞,然后用抗-FLAG抗体M2(泳道1、3、5)和兔抗-Creaml抗体T8(泳道2、4、6)进行双重ⅡF染色。
结果如图7所示。FLAG-Ap32表现出典型的核定位情况(泳道1用抗-FLAG抗体显色;和泳道2用抗-Creaml抗体显色)。为了排除标记过程中抗体间可能的交叉反应,将MBP-P05加至一级抗体混合物中以限选择性地中和抗-Creaml抗体。这种处理导致用抗-Creaml抗体标记明显下降(泳道3),但却不影响抗-FLAG抗体的标记(泳道4)。这表明,这两种抗体独立地识别各自的表位。
当用全长FLAG-Creaml表达时,也观察到了核定位现象。此外,当推定的NLS被缺失掉时,相应的变异蛋白FLAG-Ap32N(图7A)就成为细胞质类型的蛋白(图7B,泳道5和6),这表明,Creaml的确使用NLS序列。
Creaml具有内在的激活活性为了测试Creaml是否含有激活结合域,将Creaml的不同部分与Gal4的DNA结合域(BD)融合,然后检测所形成的融合蛋白在酵母中的反式激活作用。酵母株Y190含有处于Gal4-应答型启动子控制下的β-半乳糖苷酶报道基因。结果如图8所示,用β-半乳糖苷酶活性测定表明,在Y190中表达BD-Creaml可有力地残基报道基因的转录。含Creaml的氨基酸1-455的BD-Creamlp仍然具有活性。相反,含氨基酸463-959的融合蛋白(即BD-Ap2)仅表现出比背景稍高的转录活性。因此,激活结构域似乎位于Creaml的N端部分。
Creaml的潜在功能由于Creaml在多种不同的细胞系和组织中普遍表达,而且其结构与TFⅡ-Ⅰ很相似,因此这表明Creaml是一种作用广泛的转录调控物,很可能是一种新的介导某些无TATA启动子转录的结合Inr的因子。
另一方面,Creaml和TFⅡ-Ⅰ的功能是由不同的机理调控的。TFⅡ-可结合于btk(一种src超家族的B细胞特异性胞质酪氨酸激酶)(Yang,W.美国科学院院报(Proc.Natl.Acad.Sci.USA)94,604-609(1997))。一旦B细胞抗原受体介入,TFⅡ-Ⅰ就会在酪氨酸残基上发生磷酸化。此外,TFⅡ-Ⅰ对c-fos启动子的刺激作用取决于ras-信号传导途径(Kim,D.W.,Mol.Cell.Biol.18,3310-3320(1998))。而且TFⅡ-Ⅰ的src自我磷酸化位点对于Vβ启动子的TFⅡ-Ⅰ依赖性转录激活是至关重要的(NoVina,C.D.J.Biol.Chem.273,33443-33448(1998))。
然而,Creaml明显缺乏src磷酸化位点,而且它也不与btk反应(数据未示出)。然而,它可以被MAP激酶通过潜在的磷酸化位点调控(
图1)。此外,数据表明Creaml可以通过与Rb的缔合而被调控。根据其广泛的表达谱,Creaml可能是一种在细胞周期进程中涉及的广泛的转录调控因子。此外,因为Rb对于骨骼肌的最终分化很关键,因此,Creaml可能在肌肉分化中也在Rb控制下发挥作用。
William综合症是一种先天性疾病,特征是小精灵样面容和精神发育迟缓,并常伴有心血管和肌肉骨骼缺陷。染色体7q11.23的半合子状态是该病的致病原因(Ewart,A.K.等人,Nat.Genet.5,11-16(1993))。常见的缺失断裂点位于弹性蛋白基因两侧约lcM处。目前为止,已发现一些基因在William病的主要人群中呈半合子状态。其中包括弹性蛋白基因、LIM-激酶、复制因子C、syntaxin 1A、TFⅡ-Ⅰ、Wscrl和Fkbp6等。尽管高浓度的LIM-激酶(一种主要在脑中表达的蛋白激酶)似乎对于该疾病是至关重要的,但是其余基因对该综合症的病理也有作用。
重要的是,Creaml基因座位于LIM-激酶和xyntaxin 1A之间。由于这两种基因在William综合症中经常缺失,因此这表明Creaml在该疾病中也常缺失。进一步研究表明,在William综合症病人中,的确有一个拷贝的Creaml基因存在缺失。因此,通过检测Creaml基因的缺失与否,以及Creaml蛋白活性或功能是否异常,可以检测William综合症。
由于Creaml在脑中表达(数据未给出),因此其含量下降可能会影响对神经发育至关重要的其他蛋白。此外,研究还表明Creaml的半合状态与William综合症相关的某些心血管和骨骼肌肉异常也存在关联性。
本发明的人Creaml除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明人Creaml还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明人Creaml的C端与其他物种的Creaml的C端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人Creaml的抗体,用于筛选该家族的其他成员,或者用于亲和纯化结合蛋白(如该家族的其他成员)。
此外,本发明人Creaml核酸(编码序列或反义序列)可以被引入细胞,以提高人Creaml的表达水平或者抑制人Creaml的过度表达。本发明的人Creaml蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人Creaml缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表(1)一般信息(ⅱ)发明名称新的成视网膜细胞瘤蛋白结合蛋白及其制法和用途(ⅲ)序列数目2(2)SEQ ID NO.1的信息(ⅰ)序列特征(A)长度3043bp(B)类型核酸(C)链性双链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO.1ggcgaccatg gccttgctgg gtaagcgctg tgacgtcccc accaacggct gcggacccga 60ccgctggaac tccgcgttca cccgcaaaga cgagatcatc accagcctcg tgtctgcctt 120agactccatg tgctcagcgc tgtccaaact gaacgccgag gtggcctgtg tcgccgtgca 180cgatgagagc gcctttgtgg tgggcacaga gaaggggaga atgttcctga atgcccggaa 240ggagctacag tcagacttcc tcaggttctg ccgagggccc ccgtggaagg atccggaggc 300agagcacccc aagaaggtgc agcggggcga gggtggaggc cgtagcctcc ctcggtcctc 360cctggaacat ggctcagatg tgtaccttct gcggaagatg gtagaggagg tgtttgatgt 420tctttatagc gaggccctgg gaagggccag tgtggtgcca ctgccctatg agaggctgct 480cagggagcca gggctgctgg ccgtgcaggg gctgcccgag ggcctggcct tccgaaggcc 540agccgagtat gaccccaagg ccctcatggc catcctggaa cacagccacc gcatccgctt 600caagctcaag aggccacttg aggatggcgg gcgggactcg aaggccctgg tggagctgaa 660tggtgtctcc ctgattccca aggggtcacg ggactgtggc ctgcatggcc aggcccccaa 720ggtgccaccc caggacctgc ccccaaccgc cacctcctcc tccatggcca gcttcctgta 780cagcacggcg ctccccaacc acgccatccg agagctcaag caggaagCAC CTTCCTGCCC 840CCTTGCCCCC AGCGACCTGG GCCTGAGTCG GCCCATGCCA GAGCCCAAGG CCACCGGTGC 900CCAAGACTTC TCCGACTGTT GTGGACAGAA GCCCACTGGG CCTGGTGGGC CTCTCATCCA 960GAACGTCCAT GCCTCCAAGC GCATTCTCTT CTCCATCGTC CATGACAAGT CAGAGAAGTG 1020GGACGCCTTC ATAAAGGAAA CCGAGGACAT CAACACGCTC CGGGAGTGTG TGCAGATCCT 1080GTTTAACAGC AGATATGCGG AAGCCCTGGG CCTGGACCAC ATGGTCCCCG TGCCCTACCA 1140GAAGATTGCC TGTGACCCGG AGGCTGTGGA GATCGTGGGC ATCCCGGACA AGATCCCCTT 1200CAAGCGCCCC TGCACTTATG GAGTCCCCAA GCTGAAGCGG ATCCTGGAGG AGCGCCATAG 1260TATCCACTTC ATCATTAAGA GGATGTTTGA TGAGCGAATT TTCACAGGGA ACAAGTTTAC 1320CAAAGACACC ACGAAGCTGG AGCCAGCCAG CCCGCCAGAG GACACCTCTG CAGAGGTCTC 1380TAGGGCCACC GTCCTTGACC TTGCTGGGAA TGCTCGGTCA GACAAGGGCA GCATGTCTGA 1440AGACTGTGGG CCAGGAACCT CCGGGGAGCT GGGCGGGCTG AGGCCGATCA AAATTGAGCC 1500AGAGGATCTG GACATCATTC AGGTCACCGT CCCAGACCCC TCGCCAACCT CTGAGGAAAT 1560GACAGACTCG ATGCCTGGGC ACCTGCCATC GGAGGATTCT GGTTATGGGA TGGAGATGCT 1620GACAGACAAA GGTCTGAGTG AGGACGCGCG GCCCGAGGAG AGGCCCGTGG AGGACAGCCA 1680CGGTGACGTG ATCCGGCCCC TGCGGAAGCA GGTGGAGCTG CTCTTCAACA CACGATACGC 1740CAAGGCCATT GGCATCTCGG AGCCCGTCAA GGTGCCGTAC TCCAAGTTTC TGATGCACCC 1800GGAGGAGCTG TTTGTGGTGG GACTGCCTGA AGGCATCTCC CTCCGCAGGC CCAACTGCTT 1860CGGGATCGCC AAGCTCCGGA AGATTCTGGA GGCCAGCAAC AGCATCCAGT TTGTCATCAA 1920GAGGCCCGAG CTGCTCACTG AGGGAGTCAA AGAGCCCATC GTGGATAGTC AAGGAACTGC 1980CTCCTCACTT GGCTTCTCTC CCCCTGCCCT GCCCCCAGAG AGGGATTCCG GGGACCCTCT 2040GGTGGACGAG AGCCTGAAGA GACAGGGCTT TCAAGAAAAT TATGACGCGA GGCTCTCACG 2100GATCGACATC GCCAACACAC TAAGGGAGCA GGTCCAGGAC CTTTTCAATA AGAAATACGG 2160GGAAGCCTTG GGCATCAAGT ACCCGGTCCA GGTCCCCTAC AAGCGGATCA AGAGTAACCC 2220CGGCTCCGTG ATCATCGAGG GGCTGCCCCC AGGAATCCCG TTCCGAAAGC CCTGTACCTT 2280CGGCTCCCAG AACCTGGAGA GGATTCTTGC TGTGGCTGAC AAGATCAAGT TCACAGTCAC 2340CAGGCCTTTC CAAGGACTCA TCCCAAAGCC TGATGAAGAT GACGCCAACA GACTCGGGGA 2400GAAGGTGATC CTGCGGGAGC AGGTGAAGGA ACTCTTCAAC GAGAAATACG GTGAGGCCCT 2460GGGCCTGAAC CGGCCGGTGC TGGTCCCTTA TAAACTAATC CGGGACAGCC CAGACGCCGT 2520GGAGGTCACG GGTCTGCCTG ATGACATCCC CTTCCGGAAC CCCAACACGT ACGACATCCA 2580CCGGCTGGAG AAGATCCTGA AGGCCCGAGA GCATGTCCGC ATGGTCATCA TTAACCAGCT 2640CCAACCCTTT GCAGAAATCT GCAATGATGC CAAGGTGCCA GCCAAAGACA GCAGCATTCC 2700CAAGCGCAAG AGAAAGCGGG TCTCGGAAGG AAATTCCGTC TCCTCTTCCT CCTCGTCTTC 2760CTCTTCCTCG TCCTCTAACC CGGATTCAGT GGCATCGGCC AACCAGATCT CACTCGTGCA 2820ATGGCCAATG TACATGGTGG ACTATGCCGG CCTGAACGTG CAGCTCCCGG GACCTCTTAA 2880TTACTAGACC TCAGTACTGA ATCAGGACCT CACTCAGAAA GACTAAAGGA AATGTAATTT 2940ATGTACAAAA TGTATATTCG GATATGTATC GATGCCTTTT AGTTTTTCCA ATGATTTTTA 3000CACTATATTC CTGCCACCAA GGCCTTTTTA AATAAGTAAA AAA 3043(2)SEQ ID NO.2的信息(ⅰ)序列特征(A)长度959个氨基酸(B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQ ID NO.2MALLGKRCDV PTNGCGPDRW NSAFTRKDEI ITSLVSALDS MCSALSKLNA EVACVAVHDE 60SAFVVGTEKG RMFLNARKEL QSDFLRFCRG PPWKDPEAEH PKKVQRGEGG GRSLPRSSLE 120HGSDVYLLRK MVEEYFDVLY SEALGRASVV PLPYERLLRE PGLLAVQGLP EGLAFRRPAE 180YDPKALMAIL EHSHRIRFKL KRPLEDGGRD SKALVELNGV SLIPKGSRDC GLHGQAPKVP 240PQDLPPTATS SSMASFLYST ALPNHAIREL KQEAPSCPLA PSDLGLSRPM PEPKATGAQD 300FSDCCGQKPT GPGGPLIQNV HASKRILFSI VHDKSEKWDA FIKETEDINT LRECVQILFN 360SRYAEALGLD HMVPVPYQKI ACDPEAVEIV GIPDKIPFKR PCTYGVPKLK RILEERHSIH 420FIIKRMFDER IFTGNKFTKD TTKLEPASPP EDTSAEVSRA TVLDLAGNAR SDKGSMSEDC 480GPGTSGELGG LRPIKIEPED LDIIQVTVPD PSPTSEEMTD SMPGHLPSED SGYGMEMLTD 540KGLSEDARPE ERPVEDSHGD VIRPLRKQVE LLFNTRYAKA IGISEPVKYP YSKFLMHPEE 600LFVVGLPEGI SLRRPNCFGI AKLRKILEAS NSIQFVIKRP ELLTEGVKEP IVDSQGTASS 660LGFSPPALPP ERDSGDPLVD ESLKRQGFQE NYDARLSRID IANTLREQVQ DLFNKKYGEA 720LGIKYPVQVP YKRIKSNPGS VIIEGLPPGI PFRKPCTFGS QNLERILAVA DKIKFTVTRP 780FQGLIPKPDE DDANRLGEKV ILREQVKELF NEKYGEALGL NRPVLVPYKL IRDSPDAVEV 840TGLPDDIPFR NPNTYDIHRL EKILKAREHV RMVIINQLQP FAEICNDAKV PAKDSSIPKR 900KRKRVSEGNS VSSSSSSSSS SSSNPDSVAS ANQISLVQWP MYMVDYAGLN VQLPGPLNY 959
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人Creaml蛋白活性的多肽的核苷酸序列,所述的核苷酸序列与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码一多肽,该多肽具有SEQ ID NO.2所示的序列。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列,或SEQ ID NO.1中从核苷酸1-3043位的核苷酸序列。
4.一种分离的人Creaml蛋白多肽,其特征在于,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽选自下组具有SEQ ID NO.2序列的多肽,具有SEQ ID NO:2中氨基酸253-959的多肽,具有SEQ ID NO:2中氨基酸253-897的多肽,具有SEQ ID NO:2中氨基酸1-455的多肽,或具有SEQID NO:2中氨基酸463-959的多肽。
6.一种载体,其特征在于,它含有权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.一种产生具有人Creaml蛋白活性的多肽的方法,其特征在于,该方法包括(a)将编码具有人Creaml蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人Creaml蛋白表达载体,所述的核苷酸序列与SEQ ID NO.1中从核苷酸8-2887位的核苷酸序列有至少70%的同源性;(b)将步骤(a)中的表达载体转入宿主细胞,形成人Creaml蛋白的重组细胞;(c)在适合表达人Creaml蛋白多肽的条件下,培养步骤(b)中的重组细胞;(d)分离出具有人Creaml蛋白活性的多肽。
9.一种能与权利要求4所述的人Creaml蛋白多肽特异性结合的抗体。
10.一种探针分子,其特征在于,它含有权利要求1所述的DNA分子中8-100个连续核苷酸。
11.一种药物组合物,其特征在于,它含有安全有效量的权利要求1所述的多肽以及药学上可接受的载体。
全文摘要
本发明涉及一种新的人基因核苷酸序列,它是编码Creaml(protein containing repetitive eighty-six amino-acid motif)的cDNA序列,该基因编码产物是一种新的转录调控因子,也是成视网膜细胞瘤蛋白(Rb蛋白)的结合蛋白。本发明还涉及由该核苷酸序列编码的多肽,这些多核苷酸和多肽的应用,以及所述多核苷酸和所述多肽的生产方法。
文档编号C12N15/63GK1303861SQ0011142
公开日2001年7月18日 申请日期2000年1月7日 优先权日2000年1月7日
发明者朱学良, 鄢秀敏, 钱敏 申请人:中国科学院上海细胞生物学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1