使用甲酰-甘氨酸生成酶(fge)对多种硫酸酯酶缺乏症和其它病症进行诊断和治疗的制作方法

文档序号:426087阅读:518来源:国知局
专利名称:使用甲酰-甘氨酸生成酶(fge)对多种硫酸酯酶缺乏症和其它病症进行诊断和治疗的制作方法
技术领域
此发明涉及诊断和治疗多种硫酸酯酶缺乏症(MSD)以及其它硫酸酯酶缺乏症的方法和组合物。更特异地,本发明涉及被分离的调节硫酸酯酶翻译后修饰的分子。这类修饰为硫酸酯酶的正确功能所必需。
背景技术
硫酸酯酶是高度保守的基因家族的成员,共享广泛的序列同源性(Franco,B.等,Cell,1995,8115-25;Parenti,G.等,Curr.Opin.Gen.Dev.,1997,7386-391),高度的结构类似性(Bond,C.S.等,Structure,1997,5277-289;Lukatela,G.等,Biochemistry,1998,373654-64),和独特的为硫酸酯断裂所必需的翻译后修饰(Schmidt,B.等,Cell,1995,82271-278;Selmer,T.等,Eur.J.Biochem.,1996,238341-345)。翻译后修饰包括对保守的半胱氨酸(在真核细胞中)或丝氨酸(在某些原核细胞中)残基在Cβ处的氧化,得到L-Cα-甲酰甘氨酸(也叫做FGly;2-氨基-3-氧代丙酸),其中醛基代替了侧链的硫代甲基基团。醛基是硫酸酯酶催化位点的必需部分,很可能作为醛水合物起作用。成对的羟基之一在硫酸酯断裂时接受硫酸基团,导致共价硫酸化的酶中间物的形成。其它羟基是随后的硫酸基团消去和醛基再生所需要的。此修饰在初生硫酸酯酶多肽输入期间或间隔很短时间之后发生于内质网,并被围绕着将被修饰的半胱氨酸(或丝氨酸)残基的短线性序列所调控。此高度保守序列是六肽L/V-C(S)-X-P-S-R(SEQ ID NO32),出现在所有真核细胞硫酸酯酶的N末端区域,并最频繁地在残基X上携带羟基或硫羟基(Dierks,T.等,Proc.Natl.Acad .Sci.U.S.A.,1997,9411963-11968)。
迄今为止,已在人体中鉴别出13个硫酸酯酶基因。它们编码具有不同底物专一性和亚细胞定位如溶酶体、高尔基体和内质网定位的酶。这些基因中的四种ARSG,ARSD,ARSE,和ARSF(分别编码芳基硫酸酯酶C,D,E和F),位于相同的染色体区域(Xp22.3)内。它们共享显著的序列类似性和几乎相同的基因组组织方式,说明它们来源于在进化中近来才发生的复制事件(Franco B等,Cell,1995,8115-25;Meroni G等,Hum Mol Genet,1996,5423-31)。
由单独硫酸酯酶活性的缺乏所引起的至少八种人单基因疾病的鉴定,强调了硫酸酯酶在人体代谢中的重要性。这些病症中的大部分是溶酶体存贮病,其中,表型结果源于被储存物质的类型和组织分布。在它们中,有五种不同类型的因硫酸酯酶对粘多糖分解代谢作用的缺乏而引起的粘多糖病(MPS类型II,IIIA,IIID,IVA和VI)(Neufeld和Muenzer,2001,The mucopolysaccharidoses,In The Metabolicand Molecular Bases of Inherited Disease,C.R.Scriver,A.L.Beaudet,W.S.Sly,D.Valle,B.Childs,K.W.Kinzler和B.Vogelstein编,New YorkMc Graw-Hill,pp.3421-3452),和以脑硫脂在中枢和外周神经系统中储存并引起严重和渐进性神经退化为特征的异常染性脑白质营养不良(MLD)。两种另外的人类疾病由非溶酶体硫酸酯酶缺乏引起。这些包括X-连锁的鱼鳞病,因类固醇硫酸酯酶(STS/ARSC)缺乏而引起的皮肤病;和点状软骨发育不全,由芳基硫酸酯酶E(ARSE)缺乏引起的影响骨和软骨的疾病。硫酸酯酶也牵涉到药物诱导的人畸形综合症,例如Warfarin胚胎病,由怀孕期间在宫内暴露于杀鼠灵而抑制ARSE活性所引起。
在引起人兴趣的人类单基因疾病中,多种硫酸酯酶缺乏症(MSD)是所有硫酸酯酶活性同时有缺陷。因此,此严重的多系统性疾病的表型结合了在单独硫酸酯酶缺乏中所观察到的特征。来自多种硫酸酯酶缺乏症患者的细胞即使以编码人硫酸酯酶的cDNAs转染之后也缺乏硫酸酯酶活性,暗示所有硫酸酯酶活性所需要的普遍机制的存在(Rommerskirch和von Figura,Proc.Natl.Acad Sci.,USA,1992,892561-2565)。硫酸酯酶的翻译后修饰被发现在多种硫酸酯酶缺乏症患者中有缺陷,暗示此疾病由基因的突变所引起,该基因牵涉到半胱氨酸至甲酰甘氨酸的转化机制(Schmidt,B.等,Cell,1995,82271-278)。尽管存在强烈的生物学和医学兴趣,以鉴别此基因为目标的努力却被多种硫酸酯酶缺乏症患者的稀有性和随之带来的缺乏合适的家族病例而无法完成遗传图谱绘制所妨碍。
发明概述本发明提供诊断和治疗多种硫酸酯酶缺乏症(MIM 272200)及治疗其它硫酸酯酶缺乏症的方法和组合物。更特异地,已鉴别出编码甲酰甘氨酸生成酶(FGE)的基因,此酶负责发生于硫酸酯酶的独特的翻译后修饰(形成L-Cα-甲酰甘氨酸;也叫做FGly和/或2-氨基-3-氧代丙酸),该翻译后修饰为硫酸酯酶功能所必需。已发现,出乎意料的是FGE基因中的突变导致受试者中的多种硫酸酯酶缺乏症(MSD)的发展。也发现,出乎意料的是FGE增强了硫酸酯酶的活性,包括但不限于,艾杜糖醛酸2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺6-硫酸酯酶,N-乙酰葡萄糖胺6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。考虑到这些发现,本发明的分子可用于诊断和治疗多种硫酸酯酶缺乏症以及其它硫酸酯酶缺乏症。
在多种硫酸酯酶缺乏症的诊断中应用本发明的分子的方法被提供。
另外,为调节硫酸酯酶上FGly形成的目的而在体内或体外应用这些分子的方法,治疗与这种修饰相关的病症的方法,和对制备治疗多种硫酸酯酶缺乏症及其它硫酸酯酶缺乏症的药学制剂有用的组合物,也被提供。
本发明因此在几个方面包括调节硫酸酯酶上FGly形成的多肽,分离的编码那些多肽的核酸,它们的功能修饰物和变体,它们的有用的片段,以及与其相关的治疗、诊断和研究的方法、组合物与工具。
根据本发明的一个方面,选自下列的分离的核酸分子被提供(a)与SEQ ID NO1所示的核苷酸序列所组成的分子在严格条件下杂交的核酸分子,该核酸分子编码具有Cα-甲酰甘氨酸生成活性的甲酰甘氨酸生成酶(FGE);(b)与(a)的核酸分子在密码子序列上因遗传密码简并性而有所区别的核酸分子;和(c)(a)或(b)的互补链。在一定的实施方案中,分离的核酸分子包括SEQ ID NO1所示的核苷酸序列。在某些实施方案中,分离的核酸分子由SEQ ID NO3所示的核苷酸序列或其片段组成。
本发明的另一方面提供分离的选自下列的核酸分子(a)SEQ IDNO1所示的核苷酸序列的独特(unique)片段,和(b)(a)的互补链,条件是(a)中的独特片段包括了不与某些序列相同的连续核苷酸序列,所述某些序列选自(1)与SEQ ID NO.4和/或SEQ ID NO.4的核苷酸20-1141相同的序列,和(2)(1)中核酸分子的互补链。在任何前述的实施方案中,互补链指全长互补链。
在一个实施方案中,连续核苷酸序列选自(1)至少两个不与序列组完全相同的连续核苷酸,(2)至少三个不与序列组完全相同的连续核苷酸,(3)至少四个不与序列组完全相同的连续核苷酸,(4)至少五个不与序列组完全相同的连续核苷酸,(5)至少六个不与序列组完全相同的连续核苷酸,和(6)至少七个不与序列组完全相同的连续核苷酸。
在另一实施方案中,片段大小选自至少8个核苷酸,10个核苷酸,12个核苷酸,14个核苷酸,16个核苷酸,18个核苷酸,20个核苷酸,22个核苷酸,24个核苷酸,26个核苷酸,28个核苷酸,30个核苷酸,40个核苷酸,50个核苷酸,75个核苷酸,100个核苷酸,200个核苷酸,1000个核苷酸和其间的每一整数长度。
根据又一方面,本发明提供包含上述核酸分子的表达载体和以该表达载体转化或转染的宿主细胞。
根据又一方面,本发明提供表达内源FGE基因的活化形式的细胞。在一个实施方案中,内源FGE基因的活化通过同源重组发生。
根据本发明又一方面,分离的多肽被提供。分离的多肽被前述的本发明核酸分子所编码。在某些实施方案中,分离的多肽被SEQ IDNO1的核酸编码,产生出具有SEQ ID NO2序列和Cα-甲酰甘氨酸生成活性的多肽。在其它的实施方案中,分离的多肽也许是前述的片段或变体,其长度足以代表人基因组中独特序列并且是具有Cα-甲酰甘氨酸生成活性的多肽,条件是该片段包括不与任何被具有SEQ ID NO.4的核酸序列所编码的序列相同的连续氨基酸的序列。在另一实施方案中,上述多肽分子的免疫源性片段被提供。免疫源性片段也许具有也许不具有Cα-甲酰甘氨酸生成活性。
根据本发明又一方面,分离的结合多肽被提供,其选择性地与前述的本发明核酸分子所编码的多肽结合。优选分离的结合多肽选择性地结合包含SEQ ID NO2序列的多肽、其片段或属于分离的具有Cα-甲酰甘氨酸生成活性的多肽家族而在本文其它部分所述的多肽。在优选的实施方案中,分离的结合多肽包括抗体和抗体片段(如Fab,F(ab)2,Fd和包括了与FGE多肽选择性结合的CDR3区域的抗体片段)。在一定的实施方案中,抗体是人抗体。在某些实施方案中,抗体是单克隆抗体。在某一实施方案中,抗体是多克隆抗血清。在进一步的实施方案中,抗体是人源化的。在更进一步的实施方案中,抗体是嵌合的。
根据本发明又一方面,具有Cα-甲酰甘氨酸生成活性的分离的多肽的家族被提供。每一所述多肽从氨基端到羧基端包含(a)氨基端亚结构域1;亚结构域2;包含35到45个氨基酸的羧基端亚结构域3,而其中亚结构域3与选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的多肽的亚结构域3具有至少约75%的同源性和大致相同的长度。在重要的实施方案中,亚结构域2含有120到140个氨基酸。在进一步的重要实施方案中,亚结构域2中至少5%的氨基酸是色氨酸。在某些实施方案中,亚结构域2与选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的多肽的结构域2之间具有至少50%的同源性。在一定的实施方案中,每一多肽的亚结构域3与选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的多肽的亚结构域3具有介于约80%和约100%之间的同源性。
根据本发明进一步的方面,用于测定某一受试者中的FGE表达水平的方法被提供。方法包括测量来自某一受试者的测试样本中的FGE表达以确定FGE在受试者中的表达水平。在一定的实施方案中,测得的测试样本中的FGE表达与对照样本(含有已知FGE表达水平)中的FGE表达进行比较。表达被定义成FGE mRNA表达,FGE多肽表达,或如本文其它部分所定义的FGE的Cα-甲酰甘氨酸生成活性。多种方法能用于测量表达。本发明优选的实施方案包括用于测量mRNA表达的PCR和RNA印迹,作为测量FGE多肽表达的试剂的FGE单克隆抗体或FGE多克隆抗血清,以及测量FGE Cα-甲酰甘氨酸生成活性的方法。
在一定的实施方案中,测试样本例如活检样本和生物液体如血液被用作测试样本。FGE在某一受试者的测试样本中的表达与对照样本中的FGE表达比较。
根据本发明另一方面,用于鉴别在调节分子的Cα-甲酰甘氨酸生成活性中有用的物质的方法被提供。方法包括(a)将具有Cα-甲酰甘氨酸生成活性的分子与候选物质接触,(b)测量该分子的Cα-甲酰甘氨酸生成活性,和(c)将测得的该分子Cα-甲酰甘氨酸生成活性与对照进行比较以确定候选物质是否调节分子的Cα-甲酰甘氨酸生成活性,其中该分子是具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的核苷酸序列的核酸分子,或其表达产物(例如,具有选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)。在一定的实施方案中,对照是在缺乏候选物质的条件下测得的该分子的Cα-甲酰甘氨酸生成活性。
根据本发明又一方面,在受试者中诊断多种硫酸酯酶缺乏症的方法被提供。方法包括将生物样本与试剂接触,所述生物样本来自被怀疑具有多种硫酸酯酶缺乏症的受试者,所述试剂特异结合选自下面的分子(i)具有SEQ ID NO1,3,或4核苷酸序列的FGE核酸分子,(ii)核酸分子(i)的表达产物,或(iii)(ii)的表达产物的片段;以及测量结合的试剂数量并由此确定所述核酸分子或其表达产物的表达是否异常,异常表达表明受试者患有多种硫酸酯酶缺乏症。
根据本发明又一方面,用于对特征为核酸分子或其表达产物的异常表达的病症进行诊断的方法被提供。方法包括将来自受试者的生物样本与试剂接触,其中所述试剂特异结合所述核酸分子、其表达产物或其表达产物的片段;并测量结合的试剂数量并由此确定所述核酸分子或其表达产物的表达是否异常,异常表达表明具有所述病症,其中所述核酸分子具有SEQ ID NO1核苷酸序列而所述病症是多种硫酸酯酶缺乏症。
根据本发明又一方面,用于在受试者中测量特征为核酸分子或其表达产物的异常表达的多种硫酸酯酶缺乏症的方法被提供。方法包括对来自患者的样本监测选自下面的参数(i)具有SEQ ID NO1,3,4的核苷酸序列的核酸分子或具有来源于FEG基因组位点的序列的核酸分子,(ii)所述核酸分子编码的多肽,(iii)来源于所述多肽的肽,和(iv)选择性结合所述多肽或肽的抗体,将它们作为对受试者中的多种硫酸酯酶缺乏症的测定。在某些实施方案中,样本是如前述实施方案任一项所描述的生物液体或组织。在一定的实施方案中,监测步骤包括将样本与选自下面的可检测的试剂接触(a)在严格条件下与(i)中的核酸分子选择性杂交的分离的核酸分子,(b)选择性结合(ii)中的多肽或(iii)中的肽的抗体,和(c)与(iv)中的抗体结合的多肽或肽。抗体、多肽、肽或核酸能用放射性标记或酶进行标记。在进一步的实施方案中,方法进一步包含检验样品中的肽。
根据本发明又一方面,试剂盒被提供。试剂盒包含包装,包装包含选择性结合前述FGE的分离的核酸或其表达产物的任一种的试剂,和用于与测量值比较的对照,此测量值为所述试剂与前述FGE的分离的核酸或其表达产物的任一种结合的测量值。在某些实施方案中,对照是用于与测量值比较的预定值。在一定的实施方案中,对照包含前述FGE的分离的核酸的任一种的表达产物的表位。在一种实施方案中,试剂盒进一步包含选择性结合选自下面的多肽的第二试剂艾杜糖醛酸2-硫酸酯酶,硫酸胺酶(sulfamidase),N-乙酰半乳糖胺6-硫酸酯酶,N-乙酰葡萄糖胺6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6,或其肽段,和用于与所述第二试剂结合到所述多肽或其肽段的测量值进行比较的对照。
根据本发明进一步的方面,治疗多种硫酸酯酶缺乏症的方法被提供。方法包括对需要这种治疗的受试者施用调节Cα-甲酰甘氨酸生成活性的试剂,用量为治疗受试者的多种硫酸酯酶缺乏症的有效量。在某些实施方案中,方法进一步包含某一试剂的共施用,所述试剂选自编码艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,或HSulf-6的核酸分子,该核酸分子的表达产物,和该核酸分子的表达产物的片段。在一定的实施方案中,调节Cα-甲酰甘氨酸生成活性的试剂是本发明的分离的核酸分子(例如如权利要求1-8所要求的核酸分子或具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸)。在重要的实施方案中,调节Cα-甲酰甘氨酸生成活性的试剂是本发明的肽(例如,如权利要求11-15,19,20所要求的肽,或具有选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)。调节Cα-甲酰甘氨酸生成活性的试剂可通过表达内源和/或外源FGE核酸分子的细胞产生。在重要的实施方案中,内源FGE核酸分子可被活化。
根据本发明的一个方面,用于在受试者中增加Cα-甲酰甘氨酸生成活性的方法被提供。方法包括施用本发明的分离的FGE核酸分子(例如,权利要求1-8的核酸分子,或具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸),和/或其表达产物到受试者中,用量为在受试者中增加Cα-甲酰甘氨酸生成活性的有效量。
根据本发明的一个方面,用于治疗患多种硫酸酯酶缺乏症的受试者的方法被提供。方法包括对需要这种治疗的受试者施用调节Cα-甲酰甘氨酸生成活性的试剂,用量为在受试者中增加Cα-甲酰甘氨酸生成活性的有效量。在某些实施方案中,调节Cα-甲酰甘氨酸生成活性的试剂是本发明的有义核酸(例如,权利要求1-8的核酸分子,或具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸)。在一定的实施方案中,调节Cα-甲酰甘氨酸生成活性的试剂是本发明的分离的多肽(例如,权利要求11-15,19,20的多肽或具有选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)。
根据本发明又一方面,用于在细胞中增加Cα-甲酰甘氨酸生成活性的方法被提供。方法包括将细胞与本发明的分离的核酸分子接触(例如,权利要求1-8的核酸分子,或具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸),或其表达产物,用量为在细胞中增加Cα-甲酰甘氨酸生成活性的有效量。在重要的实施方案中,方法包括活化内源FGE基因以在细胞中增加Cα-甲酰甘氨酸生成活性。
根据本发明进一步的方面,药物组合物被提供。组合物包含治疗多种硫酸酯酶缺乏症的药学有效量的某种试剂,该试剂含有本发明的分离的核酸分子(例如,权利要求1-8中任一项的分离的核酸分子,具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87序列的FGE核酸分子),或其表达产物,以及药学上可接受的载体。
根据本发明的一个方面,用于鉴别在治疗多种硫酸酯酶缺乏症中有用的候选物质的方法被提供。方法包括测定一套核酸分子在细胞或组织中的表达,条件是缺乏候选物质时,允许该套核酸分子的最初量的表达,其中该套核酸分子包含至少一种选自下面的核酸分子(a)严格条件下与由SEQ ID NO1所示核苷酸序列组成的分子杂交并编码具有Cα-甲酰甘氨酸生成活性(FGE)的多肽的核酸分子,(b)遗传密码简并性引起的在密码子序列中与(a)或(b)中核酸分子不同的核酸分子,(c)具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸分子,和(d)(a)或(b)或(c)的互补链,将细胞或组织与候选物质接触并探测该套核酸分子表达的测试量,其中在候选物质存在的条件下表达的测试量相对于表达最初量的增加表明候选物质在治疗多种硫酸酯酶缺乏症中有用。
根据本发明进一步的方面,制备在治疗多种硫酸酯酶缺乏症和/或其它硫酸酯酶缺乏症中有用的药剂的方法被提供。
根据本发明又一方面,固相核酸分子阵列被提供。阵列基本上由固定于固相基质的一套核酸分子、其表达产物或其片段(或是核酸的或是多肽分子的)组成,每一核酸分子编码选自下面的多肽SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。在某些实施方案中,固相阵列进一步包含至少一种对照核酸分子。在一定的实施方案中,该套核酸分子包含至少一种、至少两种、至少三种、至少四种或甚至至少五种核酸分子,每一种选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。
根据本发明进一步的方面,用于在受试者中治疗硫酸酯酶缺乏症的方法被提供。方法包括对需要这种治疗的受试者施用已根据本发明生产出的硫酸酯酶,用量为在受试者中治疗硫酸酯酶缺乏症的有效量,而此硫酸酯酶缺乏症不是多种硫酸酯酶缺乏症。在重要的实施方案中,通过已与调节Cα-甲酰甘氨酸生成活性的试剂接触的细胞产生硫酸酯酶。在一定的实施方案中,硫酸酯酶缺乏症包括但不限于粘多糖病II(MPS IIHunter综合症),粘多糖病IIIA(MPS IIIA;Sanfilippo综合症A),粘多糖病VIII(MPS VIII),粘多糖病IVA(MPS IVA;Morquio综合症A),粘多糖病VI(MPS VI;Maroteaux-Lamy综合症),异常染性脑白质营养不良(MLD),X-连锁的隐性点状软骨发育不全1,或X-连锁的鱼鳞病(类固醇硫酸酯酶缺乏症)。在一定的实施方案中,调节Cα-甲酰甘氨酸生成活性的试剂可以是本发明的核酸分子或肽。在一种实施方案中,硫酸酯酶和调节Cα-甲酰甘氨酸生成活性的试剂在同一细胞中共表达。硫酸酯酶和/或调节Cα-甲酰甘氨酸生成活性的试剂可以是内源性或外源性的来源。如果是内源性来源,它可被活化(例如,通过在本领域中已知的合适的位置插入强启动子和/或其它元件)。如果是外源性的,其表达可被表达载体上的元件所驱动,或它可靶向于细胞基因组中合适的位置以允许其被增强的表达(例如,强启动子下游)。
根据本发明又一方面,药物组合物被提供。组合物包含治疗硫酸酯酶缺乏症的药学有效量的某种试剂,该试剂含有本发明的分离的核酸分子或其表达产物,及药学上可接受的载体。
根据本发明更进一步的方面,用于在细胞中增加硫酸酯酶活性的方法被提供。方法包括将表达硫酸酯酶的细胞与本发明的分离的核酸分子(例如,权利要求1-8中任一项的分离的核酸分子,具有选自SEQID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的FGE核酸分子)或其表达产物(例如,权利要求11-15,19,20的多肽,或具有选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽)接触,用量为在细胞中增加硫酸酯酶活性的有效量。细胞可表达内源性和/或外源性的硫酸酯酶。在重要的实施方案中,内源性的硫酸酯酶被活化。在一定的实施方案中,硫酸酯酶是艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和/或HSulf-6。在一定的实施方案中,细胞是哺乳动物细胞。
根据本发明又一方面,药物组合物被提供。组合物包含治疗硫酸酯酶缺乏症的药学有效量的被细胞产生的硫酸酯酶,和药学上可接受的载体,其中所述细胞已与包含本发明的分离的核酸分子(例如,权利要求1-8中的,或具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸分子),或其表达产物(例如,选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的肽)的试剂接触。
根据本发明又一方面,分离的人FGE基因的变体等位基因(其编码变体FGE多肽)被提供。分离的变体等位基因包含某一氨基酸序列,该氨基酸序列在SEQ ID NO2中至少包含一个变异,其中这至少一个变异包含MetlArg;MetlVal;Leu20Phe;Ser155Pro;Ala177Pro;Cys218Tyr;Arg224Trp;Asn259Ile;Pro266Leu;Ala279Val;Arg327Stop;Cys336Arg;Arg345Cys;Ala348Pro;Arg349Gln;Arg349Trp;Arg349Trp;Ser359Stop;或其组合。
根据本发明又一方面,分离的人类变体FGE多肽被提供。分离的人类变体FGE多肽包含某一氨基酸序列,该氨基酸序列在SEQ ID NO2中至少含有一个变异,其中这至少一个变异包含Met1Arg;Met1Val;Leu20Phe;Ser155Pro;Ala177Pro;Cys218Tyr;Arg224Trp;Asn259Ile;Pro266Leu;Ala279Val;Arg327Stop;Cys336Arg;Arg345Cys;Ala348Pro;Arg349Gln;Arg349Trp;Arg349Trp;Ser359Stop;或其组合。
以前述任何人类变体FGE多肽为免疫原的抗体也被提供。这类抗体包括多克隆抗体、单克隆、嵌合的抗体,也可被进行可探测性的标记。可探测性的标记也许包含放射性元素,荧光化学物或酶。
根据本发明又一方面,产生硫酸酯酶的细胞被提供,其中被细胞产生的活性硫酸酯酶对总硫酸酯酶的比率得到增加。细胞包含(i)表达增强的硫酸酯酶,和(ii)表达增强的甲酰甘氨酸生成酶,其中被细胞产生的活性硫酸酯酶对总硫酸酯酶的比率(即,硫酸酯酶的比活性)相对于由缺乏甲酰甘氨酸生成酶的细胞产生的活性硫酸酯酶对总硫酸酯酶的比率至少增加5%。在一定的实施方案中,被细胞产生的活性硫酸酯酶对总硫酸酯酶的比率相对于由缺乏甲酰甘氨酸生成酶的细胞产生的活性硫酸酯酶对总硫酸酯酶的比率,增加了至少10%,15%,20%,50%,100%,200%,500%,1000%。
根据本发明进一步的方面,在受试者中治疗硫酸酯酶缺乏症的改进方法被提供。方法包括以在受试者中治疗硫酸酯酶缺乏症的有效量对需要这种治疗的受试者施用硫酸酯酶,其中硫酸酯酶与有效增加硫酸酯酶比活性的量的甲酰甘氨酸生成酶接触。在重要的实施方案中,硫酸酯酶选自艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6。在一定的实施方案中,甲酰甘氨酸生成酶被权利要求1-8的核酸分子或具有选自SEQ ID NO1,3,4,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,和80-87的序列的核酸所编码。在某些实施方案中,甲酰甘氨酸生成酶是权利要求11-15,19,20的肽,或是具有选自SEQ ID NO.2,5,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,和78的序列的肽。
本发明的这些和其它目标将被进一步结合本发明详细描述进行详述。
序列简述SEQ ID NO1是人FGE cDNA的核苷酸序列。
SEQ ID NO2是人FGE cDNA(SEQ ID NO1)的翻译产物的预期氨基酸序列。
SEQ ID NO3是编码SEQ ID NO2的多肽的人FGE cDNA的核苷酸序列(即,SEQ ID NO1的核苷酸20-1141)。
SEQ ID NO4是GenBank Acc.No.AK075459的核苷酸序列。
SEQ ID NO5是SEQ ID NO4翻译产物的预期氨基酸序列,一未命名的具有GenBank Acc.No.BAC11634的蛋白产物。
SEQ ID NO6是人艾杜糖醛酸-2-硫酸酯酶cDNA(GenBank Acc.No.M58342)的核苷酸序列。
SEQ ID NO7是人艾杜糖醛酸-2-硫酸酯酶cDNA(SEQ ID NO6)的翻译产物的预期氨基酸序列。
SEQ ID NO8是人硫酸胺酶cDNA(GenBank Acc.No.U30894)的核苷酸序列。
SEQ ID NO9是人硫酸胺酶cDNA(SEQ ID NO8)的翻译产物的预期氨基酸序列。
SEQ ID NO10是人N-乙酰半乳糖胺-6-硫酸酯酶cDNA(GenBankAcc.No.U06088)的核苷酸序列。
SEQ ID NO11是人N-乙酰半乳糖胺-6-硫酸酯酶cDNA(SEQ IDNO10)的翻译产物的预期氨基酸序列。
SEQ ID NO12是人N-乙酰葡萄糖胺-6-硫酸酯酶cDNA(GenBankAcc.No.Z12173)的核苷酸序列。
SEQ ID NO13是人N-乙酰葡萄糖胺-6-硫酸酯酶cDNA(SEQ IDNO12)的翻译产物的预期氨基酸序列。
SEQ ID NO14是人芳基硫酸酯酶A cDNA(GenBank Acc.No.X52151)的核苷酸序列。
SEQ ID NO15是人芳基硫酸酯酶A cDNA(SEQ ID NO14)的翻译产物的预期氨基酸序列。
SEQ ID NO16是人芳基硫酸酯酶B cDNA(GenBank Acc.No.J05225)的核苷酸序列。
SEQ ID NO17是人芳基硫酸酯酶B cDNA(SEQ ID NO16)的翻译产物的预期氨基酸序列。
SEQ ID NO18是人芳基硫酸酯酶C cDNA(GenBank Acc.No.J04964)的核苷酸序列。
SEQ ID NO19是人芳基硫酸酯酶C cDNA(SEQ ID NO18)的翻译产物的预期氨基酸序列。
SEQ ID NO20是人芳基硫酸酯酶D cDNA(GenBank Acc.No.X83572)的核苷酸序列。
SEQ ID NO21是人芳基硫酸酯酶D cDNA(SEQ ID NO20)的翻译产物的预期氨基酸序列。
SEQ ID NO22是人芳基硫酸酯酶E cDNA(GenBank Acc.No.X83573)的核苷酸序列。
SEQ ID NO23是人芳基硫酸酯酶E cDNA(SEQ ID NO22)的翻译产物的预期氨基酸序列。
SEQ ID NO24是人芳基硫酸酯酶F cDNA(GenBank Acc.No.X97868)的核苷酸序列。
SEQ ID NO25是人芳基硫酸酯酶F cDNA(SEQ ID NO24)的翻译产物的预期氨基酸序列。
SEQ ID NO26是人芳基硫酸酯酶G cDNA(GenBank Acc.No.BC012375)的核苷酸序列。
SEQ ID NO27是人芳基硫酸酯酶G(SEQ ID NO26)的翻译产物的预期氨基酸序列。
SEQ ID NO28是HSulf-1 cDNA(GenBank Acc.No.AYl01175)的核苷酸序列。
SEQ ID NO29是HSulf-1 cDNA(SEQ ID NO28)的翻译产物的预期氨基酸序列。
SEQ ID NO30是HSulf-2 cDNA(GenBank Acc.No.AYl01176)的核苷酸序列。
SEQ ID NO31是HSulf-2 cDNA(SEQ ID NO30)的翻译产物的预期氨基酸序列。
SEQ ID NO32是出现于硫酸酯酶的高度保守的六肽L/V-FGly-X-P-S-R。
SEQ ID NO33是合成的FGly形成底物;其一级序列是来源于人芳基硫酸酯酶A。
SEQ ID NO34是混杂寡肽PVSLPTRSCAALLTGR。
SEQ ID NO35是Ser69寡肽PVSLSTPSRAALLTGR。
SEQ ID NO36是人FGE-特异性引物1199nc。
SEQ ID NO37是人FGE-特异性正向引物1c。
SEQ ID NO38是人FGE-特异性反向引物1182c。
SEQ ID NO39是包含EcoRI位点的人5’-FGE-特异性引物。
SEQ ID NO40是HA-特异性引物。
SEQ ID NO41是c-myc-特异性引物。
SEQ ID NO42是RGS-His6-特异性引物。
SEQ ID NO43是来自人FGE制备物的胰蛋白酶解寡肽SQNTPDSSASNLGFR。
SEQ ID NO44是来自人FGE制备物的胰蛋白酶解寡肽MVPIPAGVFTMGTDDPQIK。
SEQ ID NO45是人FGE2平行进化同源物(paralog)(GenBank GI24308053)的核苷酸序列。
SEQ ID NO46是人FGE2平行进化同源物(SEQ ID NO45)的翻译产物的预期氨基酸序列。
SEQ ID NO47是小鼠FGE平行进化同源物(GenBank GI26344956)的核苷酸序列。
SEQ ID NO48是小鼠FGE平行进化同源物(SEQ ID NO47)的翻译产物的预期氨基酸序列。
SEQ ID NO49是小鼠FGE定向进化同源物(ortholog)(GenBankGI22122361)的核苷酸序列。
SEQ ID NO50是小鼠FGE定向进化同源物(SEQ ID NO49)的翻译产物的预期氨基酸序列。
SEQ ID NO51是果蝇FGE定向进化同源物(GenBank GI20130397)的核苷酸序列。
SEQ ID NO52是果蝇FGE定向进化同源物(SEQ ID NO51)的翻译产物的预期氨基酸序列。
SEQ ID NO53是蚊子FGE定向进化同源物(GenBank GI21289310)的核苷酸序列。
SEQ ID NO54是蚊子FGE定向进化同源物(SEQ ID NO53)的翻译产物的预期氨基酸序列。
SEQ ID NO55是密切相关的S.coelicolor FGE定向进化同源物(GenBank GI21225812)的核苷酸序列。
SEQ ID NO56是S.coelicolor FGE定向进化同源物(SEQ IDNO55)的翻译产物的预期氨基酸序列。
SEQ ID NO57是密切相关的C.efficiens FGE定向进化同源物(GenBank GI25028125)的核苷酸序列。
SEQ ID NO58是C.efficiens FGE定向进化同源物(SEQ ID NO57)的翻译产物的预期氨基酸序列。
SEQ ID NO59是N.aromaticivorans FGE定向进化同源物(GenBank GI23108562)的核苷酸序列。
SEQ ID NO60是N.aromaticivorans FGE定向进化同源物(SEQID NO59)的翻译产物的预期氨基酸序列。
SEQ ID NO61是M.loti FGE定向进化同源物(GenBank GI13474559)的核苷酸序列。
SEQ ID NO62是M.loti FGE定向进化同源物(SEQ ID NO61)的翻译产物的预期氨基酸序列。
SEQ ID NO63是B.fungorum FGE定向进化同源物(GenBank GI22988809)的核苷酸序列。
SEQ ID NO64是B.fungorum FGE定向进化同源物(SEQ ID NO63)的翻译产物的预期氨基酸序列。
SEQ ID NO65是S.meliloti FGE定向进化同源物(GenBank GI16264068)的核苷酸序列。
SEQ ID NO66是S.meliloti FGE定向进化同源物(SEQ ID NO65)的翻译产物的预期氨基酸序列。
SEQ ID NO67是微颤菌属物种FGE定向进化同源物(GenBank GI14518334)的核苷酸序列。
SEQ ID NO68是微颤菌属物种FGE定向进化同源物(SEQ ID NO67)的翻译产物的预期氨基酸序列。
SEQ ID NO69是P.putida KT2440FGE定向进化同源物(GenBankGI26990068)的核苷酸序列。
SEQ ID NO70是P.putida KT2440FGE定向进化同源物(SEQ IDNO69)的翻译产物的预期氨基酸序列。
SEQ ID NO71是R.metallidurans FGE定向进化同源物(GenBankGI22975289)的核苷酸序列。
SEQ ID NO72是R.metallidurans FGE定向进化同源物(SEQ IDNO71)的翻译产物的预期氨基酸序列。
SEQ ID NO73是P.marinus FGE定向进化同源物(GenBank GI23132010)的核苷酸序列。
SEQ ID NO74是P.marinus FGE定向进化同源物(SEQ ID NO73)的翻译产物的预期氨基酸序列。
SEQ ID NO75是C.crescentus CB15 FGE定向进化同源物(GenBank GI16125425)的核苷酸序列。
SEQ ID NO76是C.crescentus CB15 FGE定向进化同源物(SEQID NO75)的翻译产物的预期氨基酸序列。
SEQ ID NO77是M.tuberculosis Ht37Rv FGE定向进化同源物(GenBank GI15607852)的核苷酸序列。
SEQ ID NO78是M.tuberculosis Ht37Rv FGE定向进化同源物(SEQ ID NO77)的翻译产物的预期氨基酸序列。
SEQ ID NO79是出现在FGE定向进化同源物和平行进化同源物的亚结构域3的高度保守六肽。
SEQ ID NO80是具有GenBank Acc.No.CA379852的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO81是具有GenBank Acc.No.AI721440的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO82是具有GenBank Acc.No.BJ505402的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO83是具有GenBank Acc.No.BJ054666的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO84是具有GenBank Acc.No.AL892419的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO85是具有GenBank Acc.No.CA064079的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO86是具有GenBank Acc.No.BF189614的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO87是具有GenBank Acc.No.AV609121的FGE定向进化同源物EST片段的核苷酸序列。
SEQ ID NO88是HSulf-3 cDNA核苷酸序列.
SEQ ID NO89是HSulf-3 cDNA(SEQ ID NO88)的翻译产物的预期氨基酸序列。
SEQ ID NO90是HSulf-4 cDNA核苷酸序列.
SEQ ID NO91是HSulf-4 cDNA(SEQ ID NO90)的翻译产物的预期氨基酸序列。
SEQ ID NO92是HSulf-5 cDNA核苷酸序列.
SEQ ID NO93是HSul-5 cDNA(SEQ ID NO92)的翻译产物的预期氨基酸序列。
SEQ ID NO94是HSulf-6 cDNA核苷酸序列.
SEQ ID NO95是HSulf-6 cDNA(SEQ ID NO94)的翻译产物的预期氨基酸序列。
附图简述

图1在缺乏(A)或存在(B)来自牛睾丸微粒体的可溶性抽提物的条件下培育后的P23的MALDI-TOF质谱图示。
图2来源于人FGE和PFAM-DUF323种子的21种蛋白的排列的系统发生树。
图3人和鼠FGE基因位点的组织。外显子显示为以盒子和亮盒子(鼠的位点)表示。内含子线上的数字指出了以kb表示的内含子大小。
图4显示FGE表达质粒pXMG.1.3结构图的图表。
图5柱状图描述以FGE表达质粒瞬时转染的36F细胞中的N-乙酰半乳糖胺-6-硫酸酯酶活性。
图6柱状图描述以FGE表达质粒瞬时转染的36F细胞中的N-乙酰半乳糖胺-6-硫酸酯酶比活性。
图7柱状图描述以FGE表达质粒瞬时转染的36F细胞中的N-乙酰半乳糖胺-6-硫酸酯酶生产。
图8描述以FGE表达质粒瞬时转染的30C6细胞中的艾杜糖醛酸-2-硫酸酯酶活性。
图9描述了囊括本发明的特征的试剂盒。
发明详述本发明包括对编码甲酰甘氨酸生成酶(FGE)的基因的发现,此酶负责发生在硫酸酯酶上的对硫酸酯酶功能必需的独特翻译后修饰形成L-Cα-甲酰甘氨酸(a.k.a.FGly和/或2-氨基-3-氧代丙酸)。已发现,出人意料地,FGE基因中的突变引起受试者中的多种硫酸酯酶缺乏症(MSD)的发展。也已发现,出人意料地,FGE增强硫酸酯酶的活性,包括但不限于,艾杜糖醛酸-2-硫酸酯酶,硫酸胺酶,N-乙酰半乳糖胺-6-硫酸酯酶,N-乙酰葡萄糖胺-6-硫酸酯酶,芳基硫酸酯酶A,芳基硫酸酯酶B,芳基硫酸酯酶C,芳基硫酸酯酶D,芳基硫酸酯酶E,芳基硫酸酯酶F,芳基硫酸酯酶G,HSulf-1,HSulf-2,HSulf-3,HSulf-4,HSulf-5,和HSulf-6,及在申请号为20030073118,20030147875,20030148920,20030162279和20030166283的U.S.临时申请中所述的硫酸酯酶(其内容被清楚地整合在本文中)。考虑到这些发现,本发明的分子可用于诊断和/或治疗多种硫酸酯酶缺乏症,以及其它硫酸酯酶缺乏症的治疗。
在诊断多种硫酸酯酶缺乏症中应用本发明的分子的方法被提供。
此外,为了对硫酸酯酶上FGly的形成进行调节的目的而在体内或体外应用这些分子的方法,治疗与这种修饰相关的病症的方法,及在制备用于治疗多种硫酸酯酶缺乏症及其它硫酸酯酶缺乏症的治疗性制剂中有用的组合物也被提供。
本发明因此在几个方面中包括调节硫酸酯酶上的FGly的形成的多肽,编码这些多肽的分离的核酸,前述的功能性修饰物和变体,前述的有用片段,以及治疗、诊断和研究的方法、组合物和与其相关的工具。
“Cα-甲酰甘氨酸生成活性”指分子在底物上形成FGly或增强FGly形成的能力。底物也许是如本文其它部分所述的硫酸酯酶,或合成的寡肽(参见,例如SEQ ID NO33,和实施例)。底物优选包含SEQ IDNO32的保守六肽[L/V-C(S)-X-P-S-R]。分析FGly形成的方法如本领域中(参见,例如Dierks,T.等,Proc.Natl.Acad.Sci.U.S.A.,1997,9411963-11968),和本文其它部分(参见,例如实施例)所描述。在本文中所用的“分子”包含“核酸”和“多肽”。FGE分子能在体内和体外形成FGly,或增强/增加FGly的形成。
在本文中所用的“增强(或“增加”)”Cα-甲酰甘氨酸生成活性,典型地指增加FGE和/或它编码的多肽表达。增加的表达指增加(即,到可探测的程度)本发明任意核酸(如本文其它部分所描述的FGE核酸)的复制、转录和/或翻译,既然上调任何这些过程将导致基因(核酸)所编码多肽的浓度/数量的增加。增强(或增加)Cα-甲酰甘氨酸生成活性也指防止或抑制FGE的降解(例如通过增加的泛素化作用)、下调等,所述降解和下调导致例如相对于对照被增加的或稳定的FGE分子t1/2(半衰期)。下调或减少的表达指基因和/或它编码的多肽减少的表达。通过使用本领域已知的任何适合的方法例如核酸杂交或抗体探测方法,分别探测基因(例如FGE)mRNA水平或基因所编码的多肽的蛋白表达水平相对于对照的增加或是减少,可直接测定基因表达的上调或下调。FGE基因表达的上调或下调也能通过探测Cα-甲酰甘氨酸生成活性的变化而间接测定。
在本文中所用的“表达”指核酸和/或多肽表达,以及多肽分子的活性(例如分子的Cα-甲酰甘氨酸生成活性)。
本发明的一个方面包括对编码FGE的cDNA的克隆。根据本发明的FGE是包含SEQ ID NO1的核酸分子的分离的核酸分子,并编码具有Cα-甲酰甘氨酸生成活性的多肽。人FGE cDNA的序列以SEQ ID NO1而出现,此cDNA编码的蛋白产物的预期氨基酸序列以SEQ ID NO2出现。
在本文中所用的受试者是哺乳动物或非人类的哺乳动物。在所有实施方案中,人FGE和人受试者都是优选。
本发明因此在一个方面包括分离的FGE多肽,编码此多肽的cDNA,前述的功能性修饰物和变体,前述的有用片段,以及与其相关的诊断和治疗。
在本文中所用的关于核酸的术语“分离的”表示(i)在体外通过例如聚合酶链式反应(PCR)所扩增的;(ii)通过克隆所重组性地产生的;(iii)如通过切断和凝胶分离所纯化的;或(iv)通过例如化学合成所合成。分离的核酸是容易通过本领域众所周知的重组DNA技术操作的类型。因此,包含在一定载体中的核苷酸序列被认为是分离的,其中所述载体的5’和3’限制性位点已知或者其聚合酶链式反应(PCR)引物序列已被公开,但在其天然宿主中以其天然状态存在的核酸不是分离的。分离的核酸可被充分纯化,但不必这样。例如,在克隆或表达载体内的分离的核酸不纯,这在于它在其寄生的细胞中也许只包含很少百分比的物质。然而,这种核酸是分离的,如本文中所用的术语一样,因为它容易通过本领域中一般技术人员所知道的标准技术被操作。
在本文中所用的关于多肽的术语“分离的”表示从其天然环境中被以充分纯的形式分开以至于它可被操作于或用于本发明的任一目的。因此,“分离的”表示纯度足以(i)用于生产和/或分离抗体,(ii)用作分析中的试剂,(iii)用于测序,(iv)用作治疗等。
根据本发明,编码具有Cα-甲酰甘氨酸生成活性的FGE多肽的分离的核酸分子包括(a)核酸分子,其在严格条件下与SEQ ID NO1的核酸所组成的分子杂交并编码具有Cα-甲酰甘氨酸生成活性的FGE多肽,(b)(a)的删除、添加和置换物,其编码各自的具有Cα-甲酰甘氨酸生成活性的FGE多肽,(c)因为遗传密码简并性而与(a)或(b)的核酸分子在密码子序列中不同的核酸分子,和(d)(a),(b)或(c)的互补链。在本文中所用的“互补链”包括“(a),(b)或(c)的全长互补链或100%的互补链”。
也具有Cα-甲酰甘氨酸生成活性的本发明的FGE核酸的同源物和等位基因也被本发明所包含。本文所述的同源物,包括本文其它部分所鉴别的分子(参见例如SEQ ID NOs4,5,45-78,和80-87)即定向进化同源物和平行进化同源物。进一步的,同源物能依照本发明的指导以及传统技术所鉴别。既然本文所述的FGE同源物全都具有Cα-甲酰甘氨酸生成活性,它们能与人FGE分子在本发明的所有方面中互换性使用。
因此,本发明的一个方面是那些编码FGE多肽并在严格条件下与SEQ ID NO1的编码区所组成的核酸分子杂交的核酸序列。在重要的实施方案中,如在此所用的术语“严格条件”指本领域所熟悉的参数。对核酸,被称为严格的杂交条件典型的是在低离子强度和恰好低于DNA杂交复合物熔点(Tm)(典型地,低于杂交物Tm约3℃)的温度下。更高的严格性限定了探针序列和靶之间更专一的相关性。核酸杂交中所用的严格条件在本领域中众所周知,可在汇编这类方法的参考文献中找到,例如Molecular CloningA Laboratory Manual,J.Sambrook等编,Second Edition,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,New York,1989,或Current Protocolsin Molecular Biology,F.M.Ausubel等编,John Wiley & Sons,Inc.,New York.“严格条件”的实例是在6xSSC中于65℃下杂交。另一严格条件的实例是在杂交缓冲液中于65℃下杂交,杂交缓冲液由3.5xSSC,0.02% Ficoll,0.02%聚乙烯吡咯烷酮,0.02%牛血清白蛋白,2.5mM NaH2PO4[pH7],0.5%SDS,2mM EDTA组成(SSC是0.15M氯化钠/0.15M柠檬酸钠,pH7;SDS是十二烷基硫酸钠;而EDTA是乙二胺四乙酸)。杂交之后,转上DNA的膜在2xSSC中于室温下清洗,然后在最高68℃的温度下于0.1xSSC/0.1xSDS中清洗。在进一步的实施例中,杂交水溶液的使用的替代是杂交甲酰胺溶液的使用。应用例如50%甲酰胺溶液和42℃,严格的杂交条件能因此被实现。有其它能被应用的条件、试剂等,并将导致类似的严格程度。技术人员将熟悉这类条件,因此它们不在这里给出。然而,需要被理解的是,技术人员将能以允许清晰鉴别本发明FGE核酸的同源物和等位基因的方式操控条件。技术人员也将熟悉对于细胞和之后将被常规分离的这类分子的表达库进行筛选,然后再分离相关的核酸分子和序列的方法。
一般地,同源物和等位基因典型地将分别与SEQ ID NO1和SEQ IDNO2具有至少40%核苷酸同一性和/或至少50%氨基酸同一性,在某些情况下将具有至少50%核苷酸同一性和/或至少65%氨基酸同一性,而在其它情况下将具有至少60%核苷酸同一性和/或至少75%氨基酸同一性。在进一步的情形中,同源物和等位基因典型地将分别与SEQ IDNO1和SEQ ID NO2具有至少90%,95%或甚至99%的核苷酸同一性和/或至少95%,98%或甚至99%的氨基酸同一性。同一性可应用多种由NCBI(Bethesda,Maryland)开发的公开可得的软件工具计算得到。示例的工具包括Altschul SF等的启发式算法(J Mol Biol,1990,215403-410),也称为BLAST。Pairwise和ClustalW比对(BLOSUM30矩阵设置)以及Kyte-Doolittle水疗分析可应用公开(EMBL,Heidelberg,Germany)和商业(例如来自Oxford MolecularGroup/Genetics Computer Group,Madison,WI的MacVector序列分析软件)的类型而获得。前述核酸的Watson-Crick互补链也被本发明所包括。
在对FGE相关基因如FGE的同源物和等位基因的筛选中,Southern印迹可应用前述条件以放射性探针来完成。对DNA最终转移上去的膜进行清洗之后,此膜可放置到X-射线胶片或磷成像平板(phosphoimager plate)以探测放射性信号。
在此给定关于全长人FGE cDNA克隆的指导,则对应于人FGE基因的其它哺乳动物序列如小鼠cDNA克隆可应用标准菌落杂交技术从cDNA库中分离。
本发明也包括含有天然物质中出现的那些密码子的替代物的简并核酸。例如,丝氨酸残基被密码子TCA,AGT,TCC,TCG,TCT和AGC编码。因此,本领域一般技术人员将很明白,任何丝氨酸编码核苷酸三联体可被用于在体内或体外指导蛋白质合成装置,以将丝氨酸残基整合进入正在延伸的FGE多肽。类似地,编码其它氨基酸残基的核苷酸序列三联体包括但不限于CCA,CCC,CCG和CCT(脯氨酸密码子);CGA,CGC,CGG,CGT,AGA和AGG(精氨酸密码子);ACA,ACC,ACG和ACT(苏氨酸密码子);AAC和AAT(天冬酰胺密码子);及ATA,ATC和ATT(异亮氨酸密码子)。其它氨基酸残基可类似地被若干核苷酸序列编码。因此,本发明包括与生物学上分离的核酸在密码子序列中因遗传密码简并性而有所不同的简并核酸。
本发明也提供分离的SEQ ID NO1或SEQ ID NO3或其互补链的独特片段。独特片段是这样的类型,它是更大的核酸的“标志”。例如,独特片段长度足以确保其精确序列无法在人基因组中位于上述FGE核酸(及人的等位基因)之外的分子中找到。那些本领域中的一般技术人员可不必应用常规之外的程序来测定片段是否在人基因组中是独特的。然而,独特片段排除完全由选自SEQ ID NO4和/或其它如本申请的申请日以前发表过的序列的核苷酸序列所组成的片段。
完全由前述GenBank保藏库描述的序列所组成的片段不包括任何对于本发明序列而言独特的核苷酸。因此,根据本发明的独特片段必须包含除那些GenBank保藏库中的确切序列或其片段之外的核苷酸序列。区别可以是相对于GenBank序列的添加、删除或置换,或可以是完全不同于GenBank序列的序列。
独特片段能在Southern和Northern印迹分析中用作探针以鉴别这类核酸,或能用于如那些采用PCR的扩增分析。如本领域技术人员已知的,大探针如200,250,300或更多的核苷酸优选用于一定的应用如Southern和Northern印迹,而更小的片段将优选用于例如PCR。独特片段也能被用于产生融合蛋白,以产生抗体或测定如实施例中证明的多肽片段的结合或产生免疫分析组分。同样地,独特片段可被用于产生例如在抗体制备、免疫分析或治疗应用中有用的FGE多肽非融合片段。独特片段进一步地可被用作反义分子以抑制FGE核酸和多肽各自的表达。
如将被本领域技术人员所认识到的一样,独特片段的大小将依赖于其遗传密码中的保守性。因此,SEQ ID NO1或SEQ ID NO3的部分区域和互补链将需要更长的节段来实现独特,而其它的只需要短节段,典型的是长12和32个核苷酸之间(例如12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31和32碱基)或更长,长到公开序列的全长。如上述所提及的,此公开内容倾向于包含每一序列的每一片段,起点在第一核苷酸、第二核苷酸等等,直到离末端剩下8个核苷酸,而终点在从第8、9、10核苷酸等等开始直到恰好最后一个核苷酸的任何位置(前提为序列是如上述的独特片段)。事实上SEQ ID NO1区域的以核苷酸1开始而在核苷酸1180终止或SEQ ID NO3区域的以核苷酸1开始而在核苷酸1122终止的任何节段或其互补链,长度为20或更多核苷酸都将是独特的。本领域技术人员对选择这类序列的方法(一般是基于独特片段选择性区分目的序列与人类基因组中其它序列的能力)很精通,虽然可以进行体外的证实性的杂交和序列分析。
如上述所提及的,本发明包含选择性结合编码FGE多肽的核酸分子以减少FGE活性的反义寡核苷酸。
在本文中所用的术语“反义寡核苷酸”或“反义”描述一定的寡核苷酸,该寡核苷酸是在生理条件下与包含特定基因的DNA或该基因的mRNA转录产物杂交,而因此抑制该基因的转录和/或该mRNA的翻译的寡核糖核苷酸,寡脱氧核糖核苷酸,修饰后的寡核糖核苷酸,或修饰后的寡脱氧核糖核苷酸。反义分子被设计成与靶基因或转录物杂交以干扰靶基因的转录或翻译。本领域技术人员将认识到反义寡核苷酸的确切长度和它与其目标互补的程度将依赖于所选的特异靶,包括靶的序列和构成那一序列的特定碱基。优选反义寡核苷酸被构建和安排成在生理条件下选择性地与靶结合,即相对于靶细胞中的任何其它序列在生理条件下更充分地与靶序列杂交。基于SEQ ID NO1或基于等位基因或同源基因组和/或cDNA序列,本领域中的技术人员能容易地挑选和合成出大量合适的反义分子中的任何类型以根据本发明而应用。为了具有充分的选择性和充分有能力进行抑制,这类反义寡核苷酸应包含与靶互补的至少10个和更多连续碱基,优选至少15个,虽然在某些情形中长度短至7个碱基的修饰后的寡核苷酸被成功用作反义寡核苷酸(Wagner等,Nat.Med,1995,1(11)1116-1118;Nat.Biotech.,1996,14840-844)。最优选的是,反义寡核苷酸包含20-30个碱基的互补序列。虽然对基因或mRNA转录物任何区段反义的寡核苷酸可被选出,在优选实施方案中,反义寡核苷酸对应于N端或5’上游位点例如翻译起点、转录起点或启动子位点。此外,3’-非翻译区可被反义寡核苷酸所靶向。对mRNA拼接位点的靶向也在本领域中应用,但如果替代性的mRNA拼接发生,则可能不是那么被优选。此外,反义物优选靶向于不希望出现mRNA二级结构(参见,例如Sainio等,Cell Mol.Neurobiol.14(5)439-457,1994)和不希望出现蛋白结合的位点。最后,虽然SEQ ID No1公开了cDNA序列,本领域中的一般技术人员可容易地得到对应于此序列的基因组DNA。因此,本发明也提供与对应于SEQ ID NO1的基因组DNA互补的反义寡核苷酸。类似地,等位基因或同源FGE cDNAs和基因组DNAs的反义物也能应用,而不需要过度的实验。
在一组实施方案中,本发明的反义寡核苷酸可由“天然”脱氧核糖核苷酸,核糖核苷酸,或它们的任意组合所组成。也就是,一种天然核苷酸的5’末端和另一天然核苷酸的3’末端可通过核苷间的磷酸二酯键共价连接,如在天然系统中的一样。这些寡核苷酸可通过领域内认可的方法制备,所述方法可人工或通过自动合成仪而实施。它们也可通过载体被重组性地产生。
然而,在优选的实施方案中,本发明的反义寡核苷酸也可包括“修饰后的”寡核苷酸。也就是,寡核苷酸可通过许多不会阻止它们杂交至其目标但增强它们的稳定性或靶向性或者增强它们的治疗效力的方式被修饰。
在本文中所用的术语“修饰后的寡核苷酸”描述这样的寡核苷酸,其中(1)其核苷酸中的至少两个通过合成性的核苷间连接而共价连接(即,一个核苷酸5’末端和另一核苷酸3’末端之间除磷酸二酯键之外的连接)和/或(2)通常不与核酸连接的化学基团已被共价附着到寡核苷酸。优选的合成性核苷间连接是硫代磷酸酯,烷基膦酸酯,二硫代磷酸酯,磷酸酯,烷基硫代硫酸酯(alkylphosphonothioates),氨基磷酸酯,氨基甲酸酯,碳酸酯,磷酸三酯,acetamidates,羧甲基酯和肽。
术语“修饰后的寡核苷酸”也包括具有被共价修饰的碱基和/或糖的寡核苷酸。例如,修饰后的寡核苷酸包括具有已在除3’位置羟基和5’位置磷酸基之外的位置共价附着到低分子量有机基团的糖骨架的寡核苷酸。因此修饰后的寡核苷酸可包括2’-O-烷基化核糖基团。此外,修饰后的寡核苷酸可包括糖,例如代替核糖的阿拉伯糖。本发明因此涉及含有修饰后的反义分子与药学上可接受的载体的药物制剂,所述反义分子与编码FGE多肽的核酸互补并在生理条件下杂交。反义寡核苷酸可作为药物组合物的一部分被施用。这类药物组合物可包括与任何本领域中已知的生理性和/或药学上可接受的标准载体组合的反义寡核苷酸。组合物应是消毒过的,并以适合对患者施用的单位重量或体积而含有药学有效量的反义寡核苷酸。术语“药学上可接受的”表示不干扰活性成分的生物活性的效力的非毒性物质。术语“生理上可接受的”指与生物系统如细胞、细胞培养物、组织或器官相容的非毒性物质。载体的特征将依赖于施用途经。生理上和药学上可接受的载体包括本领域众所周知的稀释剂、填充物、盐、缓冲剂、稳定物、增溶剂和其它物质。
本发明也包括在细胞中增加Cα-甲酰甘氨酸生成活性的方法。在重要的实施方案中,这通过应用载体(“表达载体”和/或“靶向载体”)而完成。
在本文中所用的“载体”可以是多种某类核酸中的任何类型,所需序列可通过限制和连接而插入所述核酸以在不同遗传环境间运输或在宿主细胞中表达。载体典型地由DNA组成,虽然RNA载体也可用。载体包括但不限于质粒、噬菌粒和病毒基因组。克隆载体是能在宿主细胞中复制,并进一步以一个或更多核酸内切酶限制性位点为特征的类型,载体能以可测方式在所述核酸内切酶限制性位点处被切断,所需DNA序列可连接进入所述位点处而使得新重组载体保持其在宿主细胞中复制的能力。在质粒的情形中,所需序列的复制可因为质粒在宿主菌内增加拷贝数目而发生很多次,或在宿主通过有丝分裂而复制之前在每一宿主中恰好单独一次。在噬菌体的情形中,复制可在裂解期期间主动发生或在溶原期被动发生。“表达载体”是这样的类型,所需DNA序列(例如SEQ ID NO3的FGE cDNA)通过限制和连接插入其中而使得所需DNA序列被可操作性地连接于调节序列并可表达为RNA转录物。载体可进一步包含一个或更多适合用于鉴别细胞已被或未被载体转化或转染的标记序列。标记包括,例如增加或减少对抗生素或其它化合物的抗性或敏感性的蛋白的编码基因,其活性通过本领域中已知的标准分析可测的酶(例如β-半乳糖苷酶或碱性磷酸酶)的编码基因,及可视性地影响转化或转染细胞、宿主、菌落或菌斑的表型(如绿色荧光蛋白)的基因。
“靶向载体”是典型地含有一定靶向性结构/序列的类型,所述靶向性结构/序列用于例如在内源性基因中(例如,在外显子和/或内含子序列内),内源性基因启动子序列中,或内源性基因启动子序列上游插入调节序列。在另一实施例中,靶向载体可包含目的基因(例如SEQID NO1的cDNA所编码的)和对基因靶向于基因组中优选位置所需的其它序列(例如,转录活跃位置如无关基因的内源启动子下游)。靶向性构建体和载体的构建在U.S.Patents 5,641,670和6,270,989中详细描述,其被清楚地整合在本文中作为参考。
事实上,任何能被异源性DNA或RNA转化并能在培养基中生长或保存的细胞(原核或真核),可被用在本发明的实践中。实施例包括细菌细胞如大肠杆菌,昆虫细胞,和哺乳动物如人、小鼠、仓鼠、猪、山羊、灵长类等的细胞。它们可以是原代或次级细胞株(其在培养中显示有限数目的平均群体倍增而不是永久的)和永久的细胞系(其在培养中显示明显的无限寿命)。原代和次级细胞包括,例如,成纤维细胞,角质化细胞,上皮细胞(例如乳腺上皮细胞,肠上皮细胞),内皮细胞,神经胶质细胞,神经细胞,血液的组成成分(例如淋巴细胞,骨髓细胞),肌肉细胞和这些体细胞类型的前体包括胚胎干细胞。在细胞将被在基因治疗中应用时,原代细胞优选从施予操作后的细胞的个体中获得。然而,原代细胞能从相同物种的供体(而不是受体)获得。可与本发明的DNA构建物和方法一起应用的永久的人细胞系实例包括但不限于HT-1080细胞(ATCC CCL 121),HeLa细胞和HeLa细胞衍生物(ATCC CCL 2,2.1和2.2),MCF-7乳腺癌细胞(ATCC BTH 22),K-562白血病细胞(ATCC CCL 243),KB癌细胞(ATCC CCL 17),2780AD卵巢癌细胞(Van der Blick,A.M.等,Cancer Res,485927-5932(1988),Raji细胞(ATCC CCL 86),WiDr结肠腺癌细胞(ATCC CCL 218),SW620结肠腺癌细胞(ATCC CCL 227),Jurkat细胞(ATCC TIB 152),Namalwa细胞(ATCC CRLl432),HL-60细胞(ATCC CCL 240),Daudi细胞(ATCC CCL 213),RPMI 8226细胞(ATCCCCL 155),U-937细胞(ATCC CRL 1593),Bowes黑色素瘤细胞(ATCCCRL 9607),WI-38VA13亚系2R4细胞(ATCC CLL 75.1),和MOLT-4细胞(ATCC CRL 1582),CHO细胞,和COS细胞,以及通过人细胞和另一物种细胞融合而产生的异杂交瘤细胞。次级人成纤维细胞株,如WI-38(ATCC CCL 75)和MRC-5(ATCC CCL 171)也可被应用。对可在实践本发明的方法中应用的细胞类型的进一步讨论,在U.S.Patents 5,641,670和6,270,989中被描述。无细胞的转录系统也可代替细胞。
本发明的细胞被保存在本领域已知的条件下,这将引起FGE蛋白或其功能性片段的表达。应用所述方法,表达的蛋白可从细胞裂解物或细胞上清中纯化。根据此方法制得的蛋白质能被制成药学上有用的配剂,并通过本领域中已知的传统药学途径而递送至人或非人的动物(例如口服,静脉内,肌肉内,鼻内,气管内或皮下)。如本文其它部分所描述的,重组细胞可以是永生化的、原代的或次级的细胞,优选人的细胞。来自其它物种的细胞的应用可在一定的情形中是合意的,所述情形为非人细胞有利于在所产生的非人FGE在药学上有用的情况下的蛋白产生的目的。
在本文中所用的编码序列和调控序列,当它们以将编码序列的表达或转录置于调控序列的影响或控制之下的方式而共价连接时,被表述成“可操作性地”连接。如果期望编码序列被翻译成功能性蛋白质,而假如5’调控序列中的启动子的诱导导致编码序列的转录,并且两个DNA序列间的连接(1)不会导致移码突变的引入,(2)不会干扰启动子区域指导编码序列转录的能力,或(3)不会干扰相应的RNA转录物被翻译成为蛋白的能力,则两个DNA序列被表述成“可操作性地”连接。因此,如果启动子区域能影响那一DNA序列的转录从而所得的转录物可被翻译成所期望的蛋白或多肽,则启动子区域将可操作性地连接编码序列。
基因表达所需的调控序列的精确本质可在物种或细胞类型间变动,但将一般性地包括,如所必需的,于转录和翻译各自启动有关的5’非转录和5’非翻译序列,如TATA盒,加帽序列,CAAT序列和类似物。尤其是,这类5’非转录调控序列将包括包含对可操控性连接的基因进行转录控制的启动子序列的启动子区域。调控序列也可包括所期望的增强子序列或上游激动子序列。本发明的载体可随意包括5’前导或信号序列。对合适载体的选择和设计是在本领域一般技术人员的能力和指导之内。
包含所有表达必需的元件的表达载体可商业性地获得,并为本领域技术人员所知。参见,例如Sambrook等,Molecular CloningALaboratory Manual,Second Edition,Cold Spring HarborLaboratory Press,1989。细胞通过编码FGE多肽或其片段或变体的异源性DNA(RNA)被引入而基因工程化。那一DNA(RNA)被置于转录元件的可操作性控制之下,以允许异源DNA在宿主细胞中的表达。
用于在哺乳动物细胞中表达mRNA的优选系统例如包含选择标记如给予G418抗性的基因(其促进对稳定性转染的细胞系的选择)和人细胞巨化病毒(CMV)增强子-启动子序列的pRc/CMV(可从Invitrogen,Carlsbad,CA得到)。此外,适合在灵长类和犬类细胞系中进行表达的类型有pCEP4载体(Invitrogen,Carlsbad,CA),其包含促进质粒作为多拷贝的染色体外元件而保存的EB病毒(EBV)复制起点。另一表达载体是包含多肽延伸因子1α的启动子的pEF-BOS质粒,其有效刺激了体外的转录。质粒被Mishizuma和Nagata(Nuc.Acids Res.185322,1990)描述,而其在转染实验中的应用已得到公开,例如,Demoulin(Mol.Cell.Biol.164710-4716,1996)。又一优选的表达载体是Stratford-Perricaudet所述的腺病毒,其E1和E3蛋白有缺陷(J,Clin.Invest.90626-630,1992)。腺病毒作为Adeno.P1A重组体的应用被Warnier等所公开,用于在小鼠皮内注射以得到抗P1A的免疫化(INt.J.Cancer,67303-310,1996)。
本发明也包括所谓的表达试剂盒,其允许技术人员制备所期望的表达载体或载体。这类表达试剂盒至少包括每一前面讨论的编码序列的单独部分。其它成分可按需要添加,只要前面提到的所需的序列被包括在内。
也应认识到,本发明包含上述的包含表达FGE cDNA序列的载体转染宿主细胞和细胞系的应用,这些细胞是原核(例如大肠杆菌)或真核性(例如CHO细胞,COS细胞,酵母表达系统和在昆虫细胞中表达的杆状病毒)的。尤其有用的是哺乳动物细胞如人,小鼠,仓鼠,猪,山羊,灵长动物等的细胞。它们可以是多种组织类型,包括如本文其它部分所描述的原代细胞和永生化的细胞系。具体实例包括HT-1080细胞,CHO细胞,树状细胞,U293细胞,外周血白细胞,骨髓干细胞,胚胎干细胞,和昆虫细胞。本发明也允许细胞和动物中的FGE基因“敲除”的构建,为研究FGE活性的某些方面提供材料。
本发明也提供被前述FGE核酸编码的分离的多肽(包括完整蛋白和部分蛋白),也包括SEQ ID NO2的多肽和其独特片段。这类多肽可用于,例如,单独或作为融合蛋白的部分去产生作为免疫分析成分的抗体。多肽可以是从生物样本包括组织或细胞匀浆中分离的,也可是在多种原核或真核表达系统中重组性表达的,所述重组性表达通过构建适合于表达系统的表达载体,将表达载体引入表达系统,及分离重组性表达的蛋白而完成。短多肽,包括抗原性肽(如被MHC分子呈递在细胞表面以进行免疫识别的)也能应用已良好建立的肽合成方法化学合成。
一般而言,FGE多肽的独特片段具有如上述讨论的与核酸相关的独特片段的特征和特性。如本领域技术人员将认识到的,独特片段的大小将依赖于一定的因素,例如片段是否组成了保守蛋白结构域的一部分。因此,SEQ ID NO2的部分区域将需要更长的片段以保证独特,而其它的只需要短片段,典型的是在5和12个氨基酸之间(例如5,6,7,8,9,10,11和12氨基酸长或者更多,包括每一整数直到全长,287个氨基酸长)。
多肽的独特片段优选保持明显的多肽功能能力的那些片段。可被保持在多肽的独特片段中的功能能力包括与抗体的相互作用、与其它多肽或其片段的相互作用,与其它分子的相互作用等。一种重要的活性是作为鉴别多肽的标签而起作用的能力。本领域技术人员很精通于选择独特氨基酸序列的方法,典型的是基于独特片段从非家族成员中选择性识别出目的序列的能力。片段的序列与那些数据库中已知序列进行比较即是所需的。
本发明包括上述FGE多肽的变体。在本文中所用的FGE多肽的“变体”是包含一种或更多对FGE多肽一级氨基酸序列的修饰的多肽。创造FGE多肽变体的修饰,典型的是被施加给编码FGE多肽的核酸,可包括删除、点突变、截断、氨基酸置换和氨基酸或非氨基酸部分的添加,以1)减少或消除FGE多肽的活性;2)增强FGE多肽的性质,如表达系统中的蛋白稳定性或蛋白-配体结合的稳定性;3)对FGE多肽提供新活性或性质,如抗原性表位的添加或可探测部分的添加;或4)提供与FGE多肽受体或其它分子的相等或更好的结合。替代性地,修饰可直接施加给多肽,如通过切断,连接分子的添加,可探测部分如生物素的添加,脂肪酸的添加和类似的方式。修饰也包括包含全部或部分FGE氨基酸序列的融合蛋白。本领域技术人员将会熟悉预测蛋白序列变化对蛋白构象的影响的方法,并能因此根据已知方法而“设计”FGE多肽的变体。这种方法的一个实例被Dahiyat和Mayo在Science27882-87,1997中描述,其中蛋白质可被重新设计。此方法能被应用于已知的蛋白,以仅改变多肽序列的一部分。通过应用Dahiyat和Mayo的计算方法,具体的FGE多肽的变体可得到提议和被测试以测定变体是否保持了所期望的构象。
变体可包括被专一修饰的FGE多肽,所述修饰是为了改变多肽的与其生理活性无关的特征。例如,半胱氨酸残基能被置换或删除以防止不必要的二硫键连接。类似地,一定的氨基酸可被改变以通过消除表达系统中由蛋白酶作用的蛋白水解而增强FGE多肽的表达(例如存在KEX2蛋白酶活性的酵母表达系统中的双碱性氨基酸残基)。
编码FGE多肽的核酸的突变优选保存编码序列的氨基酸阅读框,并优选不在核酸中创造出很可能杂交以形成二级结构的区域,二级结构例如发卡或环结构能对变体多肽的表达有害。
突变可通过选择氨基酸置换或多肽编码核酸中选定位置的随机突变而发生。变体多肽随后得到表达,并进行对一种或更多活性的检测,以测定哪个突变为变体多肽提供了期望的性质。进一步的对多肽的氨基酸序列而言沉默的突变可提供给变体(或非变体的FGE多肽),但其提供在特定宿主中优选的翻译密码子,或改变mRNA的结构以,例如,增强稳定性和/或表达。优选的在例如大肠杆菌、哺乳动物细胞等中的核酸翻译密码子,对本领域中的一般技术人员而言众所周知。其它突变也可提供给FGE基因或cDNA克隆的非编码序列以增强多肽的表达。
技术人员将意识到保守氨基酸置换可发生在FGE多肽中以提供功能等同的前述多肽的变体,即,变体保持FGE多肽的功能能力。在本文中所用的“保守氨基酸置换”指不显著改变三级结构和/或多肽活性的氨基酸置换。变体可根据本领域一般技术人员已知的改变多肽序列的方法而制备,并包括那些在汇编这类方法的参考文献中找到的类型,例如Molecular CloningA Laboratory Manual,J.Sambrook等编,Second Edition,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,New York,1989,或Current Protocols in MolecularBiology,F.M.Ausubel等编,John Wiley & Sons,Inc.,New York。示例性的FGE多肽的功能等同性变体包括对SEQ ID NO2的保守氨基酸置换。保守氨基酸置换包括发生在下列组群内部氨基酸中间的置换(a)M,I,L,V;(b)F,Y,W;(c)K,R,H;(d)A,G;(e)S,T;(f)Q,N;和(g)E,D.
因此FGE多肽的功能等同的变体,即,保持天然FGE多肽功能的FGE多肽的变体被本发明所涉及。FGE多肽氨基酸序列中产生功能等同性变体的保守氨基酸置换,典型地是通过编码FGE多肽的核酸(SEQ IDNOs1,3)的改变所提供。这类置换可通过多种本领域一般技术人员已知的方法而得到。例如,氨基酸置换可通过PCR导向突变,根据Kunkel的方法(Kunkel,Proc.Nat.Acad.Sci.U.S.A.82488-492,1985)的定点突变,或编码FGE多肽的基因的化学合成而得到。FGE多肽的功能等同片段的活性能通过将编码改变后的FGE多肽的基因克隆进细菌或哺乳动物表达载体,将载体引入合适的宿主细胞,表达改变后的FGE多肽,和测试在本文中公开的FGE多肽的功能能力(例如Cα-甲酰甘氨酸生成活性等),而得到测试。
在本文中所述的发明具有许多应用,其中的一部分在本文其它部分被描述。首先,本发明允许对FGE多肽的分离。技术从业人员众所周知的多种方法能被用于得到分离的FGE分子。多肽可从天然产生多肽的细胞中通过层析方式或免疫识别而纯化。替代性地,表达载体可被引入细胞以引起多肽的产生。在另一方法中,mRNA转录物可被微注射或另外地被引入细胞以引起被编码的多肽的产生。FGE mRNA在无细胞抽提物如网织红细胞降解系统中的翻译也可被用于产生FGE多肽。本领域技术人员也可容易地遵循已知的分离FGE多肽的方法。这些包括但不限于免疫层析,HPLC,大小排阻层析,离子交换层析和免疫亲和层析。
在一定的实施方案中,本发明也提供来源于FGE多肽的“显性失活”多肽。显性失活多肽是蛋白质的失活变体,其通过与细胞机制相互作用而从活性蛋白与细胞机制的相互作用中取代了活性蛋白,或与活性蛋白竞争,而减小了活性蛋白的效应。例如,与配体结合但不会转导响应于配体结合的信号的显性失活受体能减小配体表达的生物学效应。同样地,与靶蛋白正常相互作用但不磷酸化靶蛋白的显性失活催化惰性激酶,能减少靶蛋白响应于细胞信号的磷酸化。类似地,结合到基因调控区域的启动子位置但不增加基因转录的显性失活转录因子能通过占据启动子结合位置而不增加转录来减小正常转录因子的效应。
显性失活多肽在细胞中表达的最终结果是活性蛋白质的功能的减少。本领域一般技术人员能评估显性失活蛋白变体的潜力,并用标准突变技术创造一种或更多显性失活变体蛋白。参见,例如U.S.PatentNo.5,580,723和Sambrook等,Molecular CloningA LaboratoryManual,Second Edition,Cold Spring Harbor Laboratory Press,1989。技术人员随后能测试经诱变的蛋白群体的选定活性的减少和/或对这种活性的保持力。其它类似的用于创造和测试蛋白的显性失活变体的方法对本领域一般技术人员将是很显然的。
FGE cDNA的分离也使技术人员可能诊断以FGE异常表达为特征的疾病。这些方法包括测定FGE基因和/或源于其的FGE多肽的表达。在前者的情形下,这类测定能通过任何标准的核酸测定分析而进行,包括聚合酶链式反应,或如下面作为例子的采用标记性杂交探针的分析。在后者的情形下,这类测定能通过任何标准的(应用例如结合到分泌出的FGE蛋白的抗体的)免疫分析而进行。优选的可根据本发明诊断的疾病是多种硫酸酯酶缺乏症。
本发明也包括分离的肽结合试剂,所述试剂,例如,可以是具有选择性结合到FGE多肽的能力的抗体或抗体片段(“结合性多肽”)。抗体包括根据传统方法制备的多克隆和单克隆抗体。在一定的实施方案中,本发明排除了与SEQ ID NO4的核酸所编码的多肽结合的结合性试剂(例如抗体)。
值得注意的是,如本领域中众所周知的,只有抗体分子的一小部分,即抗原互补位,涉及抗体与其表位的结合(参见,一般地,Clark,W.R.(1986)The Experimental Foundations of Modern ImmunologyWiley & Sons,Inc.,New York;Roitt,I.(1991)EssentialImmunology,7th Ed.,Blackwell Scientific Publications,Oxford)。例如,pFc’和Fc区域是补体级联的效应子但不涉及抗原结合。pFc’区域已被酶切掉的抗体或产生时不含pFc’区域的抗体,它们被称为F(ab’)2片段,保持了完整抗体的两个抗原结合位点。类似地,Fc区域已被酶切掉的抗体或产生时不含Fc区域的抗体,它们被称为Fab片段,保持了完整抗体分子的一个抗原结合位点。进一步地,Fab片段由共价结合的抗体轻链和被表示为Fd的抗体重链的一部分所组成。Fd片段是抗体专一性的主要决定因素(单一Fd片段可与多达10条的不同轻链相连而不改变抗体专一性),并且Fd片段在分离后保持表位-结合能力。
如本领域中众所周知的,在抗体的抗原结合部分内部有直接与抗原表位相互作用的互补性决定区域(CDRs),也有保持抗体结合部位三级结构的构架区域(FRs)(参见,一般地,Clark,1986;Roitt,1991)。在IgG免疫球蛋白重链Fd片段和轻链中,有通过三个互补决定区域(CDR1到CDR3)分别分开的四个构架区域(FR1到FR4)。CDRs尤其是CDR3区域,更尤其是重链CDR3,很大程度上对抗体专一性负责。
现在在本领域中已很好地认识到,哺乳动物抗体的非CDR区域可被同种或异种特异性抗体的类似区域所替代,而保持原始抗体的表位专一性。这在制备和应用“人源化”抗体中表现得最清晰,其中非-人CDRs共价连接到人FR和/或Fc/pFc’区域以产生功能抗体。参见,例如U.S.patents 4,816,567,5,225,539,5,585,089,5,693,762和5,859,205。因此,例如,PCT国际
发明者K·冯菲古拉, B·施密特, T·蒂尔克斯, M·W·希尔特莱恩, A·巴拉比奥, M·P·考斯玛 申请人:核转移治疗公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1