新的人抗砷相关蛋白及其编码序列的制作方法

文档序号:581793阅读:363来源:国知局

专利名称::新的人抗砷相关蛋白及其编码序列的制作方法
技术领域
:本发明属于生物
技术领域
,具体地说,本发明描述了一种新的多肽——hARRG(humanarsenicresistantrelatedgene,hARRG)多肽,以及编码此多肽的多核苷酸序列。本发明还涉及此多核苷酸和多肽的制备方法和应用。hARRG多肽是一种抗砷相关蛋白。砷是自然界中广泛存在的有毒物质,长期暴露于高砷环境可引起急性、慢性砷中毒,并可使皮肤癌、肺癌的发病率升高。生物进化的过程中,许多生物(从细菌到哺乳动物)都产生了对抗砷毒的生理机制,而这些机制的产生往往由其遗传学基础所决定。六十年代,Novick(Novick,R.P.,Rath,C.,Plasmid¨DlinkedresistancetoinorganicsaltsinStaphylococcusaureus.J.Bacterial.1968,95(4):1335¨D42.)和Hedges(Hedges.R..W.Baumkerg.S.,ResisitancetoarseniccompoundsconferredbyaplasmidtransmissiblebetweenstrainsofEscherichiacoli,J.Bacteriol.1973,115(1):459¨D60)首先报道了金黄色葡萄菌和大肠杆菌有质粒介导的砷抗性。Mobley(Mobley,H.L.T.,Rosen,B.P.Energeticsofplasmid¨DmediatedarsenateresistanceinEscherichiacoli.,Proc.Natl.Acad.Sci,1982,79,6119¨D6122)和Chen(Chen,C.M.,Misra,T.K.Silver.S.,et.al,Nucleotidesequenceofthestructuralgenesforananionpump:theplasmid¨Dencodedarsenicalresistanceoperon.J.Biol.Chem,1986,261;150300¨D38)等人最终从砷抗性质粒R773中分离并确定了抗砷基因的操纵子,它由5个基因组成顺序为arsR、arsD、arsA、arsB、arsC。arsR和arsD为二个转录调节基因,arsA、B、C为抗砷结构基因分别编码ATP酶结合蛋白、膜氧阴离子通道蛋白和还原酶蛋白。1996年,Bobrowicz等从真核生物酿酒酵母的质粒中发现了三个抗砷基因,ACR1、ACR2、ACR3,并对其功能进行了研究。ACR1是一个调节基因,ACR2编码一个砷还原酶蛋白,作用与细菌arsD相似。ACR3基因受ACR1基因正相调节,编码一个氧阴离子转运通道,作用与细菌arsB相似(Bobrowicz,P.,Wysocki,R.,Owsianik,G.,et.al,Isolationofthreecontiguousgenes,ACR1,ACR2andACR3,involvedinresistancetoarseniccompoundsintheyeastSaccharomycescerevisiae,Yest,1997,13,819-828.)。细菌和酵母的抗砷机制均为将进入到细胞内的砷,通过膜氧阴离子转运通道排出细胞。在此之前需将五价砷还原为三价砷。实验证明,哺乳动物体内也存在可以诱导的对砷的排出机制(Bencko,V.,Symon,K.,Thecumulationdynamicsinsometissueofhairlessmiceinhalingarsenic,Atmos.Environ,1970,4:157¨D161)。Wang和Rossman(Wang,Z.,Rossman,T.G.,StableandInducibleArseniteResistanceinChineseHamsterV79cell.Toxicl.App.Pharmacl.1993,118:80¨D86)于1993年首次报道了中国仓鼠V79细胞用砷诱导建立的可稳定遗传的抗砷细胞株As/R28A。随后从该细胞株中分离出两个具有抗砷特征的cDNA片段asr1,asr2,将这两个片段分别转染入砷敏感细胞As/S5和野生型V79细胞后,均可使两类细胞获得一定的砷抗性(Rossman,T.G.,Wang,Z.,Expressioncloningforarsenite-resistanceresultedinisolationoftumor-suppressorfaucDNA:possibleinvolvementoftheubiquitinsysteminarseniccarcinogenesis.Carcinogenesis.1999,20(2):311¨D316.)。经DNA序列分析发现asr1与仓鼠肿瘤抑制基因fau高度同源。asr2基因未发现与已知的任何基因同源。该基因全长1041bp,开放阅读框678bp,编码225个氨基酸的蛋白。人类的抗砷基因国际上尚未见研究文章发表,基因数据库(GeneBank)中公布了二条基因序列,因与asr2同源性高而推测为人类抗砷基因。上海细胞所胡庚熙于1999年3月登录了一条人类asr2同源基因(检索号af082871)全长1423bp,编码425个氨基酸的蛋白。随后不久德国学者Wambutt,D等,于同年6月登录了一条更长的人类asr2同源基因(检索号hsm800627),全长2983bp,编码791个氨基酸的蛋白。序列分析发现这两条基因实际上是同一条基因,只是后者比前者更长,读框更完整。研究已表明,砷含量的异常与一些疾病相关,因此,为治疗目的研究和开发人抗砷蛋白具有重要意义。然而,在本申请之前,没有公开或报道过本发明所涉及的hARRG蛋白或其编码序列。本发明的一个目的是提供分离的新的多肽——hARRG(humanarsenicresistantrelatedgene,hARRG)多肽以及其片段、类似物和衍生物。本发明的另一个目的是提供编码该多肽的多核苷酸。本发明的另一个目的是提供含有编码hARRG多肽的多核苷酸的重组载体。本发明的另一个目的是提供含有编码hARRG多肽的多核苷酸的基因工程化宿主细胞。本发明的另一个目的是提供生产hARRG多肽的方法。本发明的另一个目的是提供针对本发明的多肽——hARRG多肽的抗体。本发明的另一个目的是提供含有hARRG多肽的药物组合物。本发明的另一个目的是提供了针对本发明多肽——hARRG多肽的模拟化合物、拮抗剂、激动剂、抑制剂。本发明的另一个目的是提供诊断和治疗与hARRG多肽异常相关的疾病的方法。本发明人对人类asr2同源基因进行了近两年的研究,克隆到了全长人类asr2同源基因,该基因序列比Wambutt公布的序列在5’端长了24bp,也就是比其更加完整,而且本发明的序列在两处与其有较大的不同。分析表明,本发明的该序列是同一基因的不同剪切形式,因而被命名为人类抗砷相关基因(humanarsenicresistantrelatedgene,hARRG)。本发明首先提供了一种分离的多肽,该多肽是人源的,它包括具有SEQIDNO:2氨基酸序列的多肽、或其保守性变异体、生物活性片段或衍生物。较佳地,该多肽是具有SEQIDNO:2氨基酸序列的多肽。本发明还提供一种分离的多核苷酸,它包括选自下组的一种核苷酸序列或其变体(a)编码具有SEQIDNO:2氨基酸序列的多肽的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸;(c)与(a)或(b)的多核苷酸序列具有至少99.764%相同性的多核苷酸。更佳地,该多核苷酸的序列是选自下组的一种(a)具有SEQIDNO:1中500-2866位的序列;和(b)具有SEQIDNO:1中1-2999位的序列。本发明还提供了一种含有本发明多核苷酸的载体,特别是表达载体;一种用该载体遗传工程化的宿主细胞,包括转化、转导或转染的宿主细胞;一种包括培养所述宿主细胞和回收表达产物的制备本发明多肽的方法。本发明还提供了一种能与本发明多肽特异性结合的抗体。本发明还提供了一种筛选的模拟、激活、拮抗或抑制hARRG多肽蛋白活性的化合物的方法,其包括利用本发明的多肽。本发明还涉及用该方法获得的化合物。本发明还提供了一种体外检测与hARRG多肽蛋白异常表达相关的疾病或疾病易感性的方法,包括检测生物样品中所述多肽或其编码多核苷酸序列中的突变,或者检测生物样品中本发明多肽的量或生物活性。本发明也提供了一种药物组合物,它含有本发明多肽或其模拟物、激活剂、拮抗剂或抑制剂以及药学上可接受的载体。本发明还涉及本发明的多肽和/或多核苷酸在制备用于治疗因体内砷过多而导致的疾病,包括砷中毒、恶性肿瘤、中毒性脑病、急性肾衰、急性溶血性贫血、心血管疾病、免疫性疾病、皮肤病和肝、肺、支气管、神经系统等各类炎症或其它由于hARRG多肽表达异常所引起疾病的药物的用途。本发明的其它方面由于本文的技术的公开,对本领域的技术人员而言是显而易见的。下列附图用于说明本发明的具体实施方案,而不用于限定由权利要求书所界定的本发明范围。图1是本发明hARRG多肽和hsm800627蛋白的氨基酸序列同源性比较图。上方序列是hARRG多肽,下方序列是hsm800627蛋白。相同氨基酸在两个序列间用字符“|”表示,相似氨基酸用“:”或“.”表示。图2显示了本发明hARRG多肽和hsm800627蛋白的核苷酸序列同源性比较图。图中上方序列为hARRG基因,下列为hsm800627基因。大写字母为hARRG基因与hsm800627基因不同之处、hsm800627序列在1684bp处缺少一个碱基“G”,造成读码框易位错误。图3显示了人体不同组织中hARRG的Northern印迹表达谱。其中,在心、脑、胎盘、肝、骨骼肌、肾及胰腺等组织器官中均有表达,肺中表达较少,胰腺、肝脏及心脏表达较高。除了3.0Kb的转录本外,另外在肝脏和胰腺中尚可见一5.5Kb的转录本。图4显示了原核表达及纯化的重组hARRG多肽的电泳图。其中,泳道M为蛋白质分子量Marker;泳道1为全菌裂解液;泳道2为第一次的洗脱液;泳道3为第二次的洗脱液;泳道4为hARRG多肽的第一次纯化液;泳道5为hARRG多肽的第二次纯化液。本说明书和权利要求书中使用的下列术语具有如下的含义,除非特别说明“核酸序列”是指寡核苷酸、核苷酸或多核苷酸及其片段或部分,也可以指基因组或合成的DNA或RNA,它们可以是单链或双链的,代表有义链或反义链。类似地,术语“氨基酸序列”是指寡肽、肽、多肽或蛋白质序列及其片段或部分。当本发明中的“氨基酸序列”涉及一种天然存在的蛋白质分子的氨基酸序列时,这种“多肽”或“蛋白质”不意味着将氨基酸序列限制为与所述蛋白质分子相关的完整的天然氨基酸。蛋白质或多核苷酸“变异体”是指一种具有一个或多个氨基酸或核苷酸改变的氨基酸序列或编码它的多核苷酸序列。所述改变可包括氨基酸序列或核苷酸序列中氨基酸或核苷酸的缺失、插入或替换。变异体可具有“保守性”改变,其中替换的氨基酸具有与原氨基酸相类似的结构或化学性质,如用亮氨酸替换异亮氨酸。变异体也可具有非保守性改变,如用色氨酸替换甘氨酸。“缺失”是指在氨基酸序列或核苷酸序列中一个或多个氨基酸或核苷酸的缺失。“插入”或“添加”是指在氨基酸序列或核苷酸序列中的改变导致与天然存在的分子相比,一个或多个氨基酸或核苷酸的增加。“替换”是指由不同的氨基酸或核苷酸替换一个或多个氨基酸或核苷酸。“生物活性”是指具有天然分子的结构、调控或生物化学功能的蛋白质。类似地,术语“免疫学活性”是指天然的、重组的或合成蛋白质及其片段在合适的动物或细胞中诱导特定免疫反应以及与特异性抗体结合的能力。“激动剂”是指当与hARRG多肽结合时,一种可引起该蛋白质改变从而调节该蛋白质活性的分子。激动剂可以包括蛋白质、核酸、碳水化合物或任何其它可结合hARRG多肽的分子。“拮抗剂”或“抑制物”是指当与hARRG多肽结合时,一种可封闭或调节hARRG多肽的生物学活性或免疫学活性的分子。拮抗剂和抑制物可以包括蛋白质、核酸、碳水化合物或任何其它可结合hARRG多肽的分子。“调节”是指hARRG多肽的功能发生改变,包括蛋白质活性的升高或降低、结合特性的改变及hARRG多肽的任何其它生物学性质、功能或免疫性质的改变。"基本上纯"是指基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化hARRG多肽。基本上纯的hARRG多肽在非还原性聚丙烯酰胺凝胶上能产生单一的主带。hARRG多肽的纯度可用氨基酸序列分析。“互补的”或“互补”是指在允许的盐浓度和温度条件下通过碱基配对的多核苷酸天然结合。例如,序列“C-T-G-A”可与互补的序列“G-A-C-T”结合。两个单链分子之间的互补可以是部分的或全部的。核酸链之间的互补程度对于核酸链之间杂交的效率及强度有明显影响。“同源性”是指互补的程度,可以是部分同源或完全同源。“部分同源”是指一种部分互补的序列,其至少可部分抑制完全互补的序列与靶核酸的杂交。这种杂交的抑制可通过在严格性程度降低的条件下进行杂交(Southern印迹或Northern印迹等)来检测。基本上同源的序列或杂交探针可竞争和抑制完全同源的序列与靶序列在的严格性程度降低的条件下的结合。这并不意味严格性程度降低的条件允许非特异性结合,因为严格性程度降低的条件要求两条序列相互的结合为特异性或选择性相互作用。“相似性”是指氨基酸序列之间排列对比时相应位置氨基酸残基的相同或保守性取代的程度。用于保守性取代的氨基酸例如,带负电荷的氨基酸可包括天冬氨酸和谷氨酸;带正电荷的氨基酸可包括赖氨酸和精氨酸;具有不带电荷的头部基团有相似亲水性的氨基酸可包括亮氨酸、异亮氨酸和缬氨酸;甘氨酸和丙氨酸;天冬酰胺和谷氨酰胺;丝氨酸和苏氨酸;苯丙氨酸和酪氨酸。“反义”是指与特定的DNA或RNA序列互补的核苷酸序列。“反义链”是指与“有义链”互补的核酸链。“衍生物”是指hARRG多肽或编码其的核酸的化学修饰物。这种化学修饰物可以是用烷基、酰基或氨基替换氢原子。核酸衍生物可编码保留天然分子的主要生物学特性的多肽。“抗体”是指完整的抗体分子及其片段,如Fab、F(ab’)2及Fv,其能特异性结合hARRG多肽的抗原决定簇。“人源化抗体”是指非抗原结合区域的氨基酸序列被替换变得与人抗体更为相似,但仍保留原始结合活性的抗体。“分离的”一词指将物质从它原来的环境(例如,若是自然产生的就指其天然环境)之中移出。比如说,一个自然产生的多核苷酸或多肽存在于活动物中就是没有被分离出来,但同样的多核苷酸或多肽同一些或全部在自然系统中与之共存的物质分开就是分离的。这样的多核苷酸可能是某一载体的一部分,也可能这样的多核苷酸或多肽是某一组合物的一部分。既然载体或组合物不是它天然环境的成分,它们仍然是分离的。如本文所用,“分离的hARRG多肽”是指hARRG多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化hARRG多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。本发明提供了一种新的多肽——hARRG多肽,其基本上是由SEQIDNO:2所示的氨基酸序列组成的。本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、高等植物、昆虫和哺乳动物细胞)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。本发明还包括hARRG多肽的片段、衍生物和类似物。如本发明所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明的hARRG多肽相同的生物学功能或活性的多肽。本发明多肽的片段、衍生物或类似物可以是(ⅰ)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ⅱ)在一个或多个氨基酸残基中具有取代基团的多肽,或(ⅲ)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(ⅳ)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围之内。本发明还提供了分离的多核苷酸,基本由编码具有SEQIDNO:2氨基酸序列的多肽的多核苷酸组成。本发明的多核苷酸序列包括SEQIDNO:1的核苷酸序列。在一个实施例中,本发明的多核苷酸是从人胎脑组织的cDNA文库中分离的。它包含的多核苷酸序列全长为2999个碱基,其开放读框(500-2886bp)编码了788个氨基酸。根据氨基酸序列同源比较发现,此多肽与中国仓鼠肺细胞的抗砷基因asr2有89.82%的同源性,可推断出该新的人hARRG具有asr2基因相似的结构和功能。从结构上说明也具有抗砷功能。本发明的多核苷酸可以是DNA形式或是RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQIDNO:1所示的编码区序列相同或者是简并的变异体。如本发明所用,“简并的变异体”在本发明中是指编码具有SEQIDNO:2的蛋白质或多肽,但与SEQIDNO:1所示的编码区序列有差别的核酸序列。编码SEQIDNO:2的成熟多肽的多核苷酸包括只有成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。术语“编码多肽的多核苷酸”是指包括编码此多肽的多核苷酸和包括附加编码和/或非编码序列的多核苷酸。本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一种多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。本发明还涉及与以上所描述的序列杂交的多核苷酸(两个序列之间具有至少50%,优选具有70%的相同性)。本发明特别涉及在严格条件下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加用变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在95%以上,更好是97%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQIDNO:2所示的成熟多肽有相同的生物学功能和活性。本发明还涉及与以上所描述的序列杂交的核酸片段。如本发明所用,“核酸片段”的长度至少含10个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段也可用于核酸的扩增技术(如PCR)以确定和/或分离编码hARRG多肽的多核苷酸。本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。本发明的编码hARRG多肽的特异的多核苷酸序列能用多种方法获得。例如,用本领域熟知的杂交技术分离多核苷酸。这些技术包括但不局限于1)用探针与基因组或cDNA文库杂交以检出同源的多核苷酸序列,和2)表达文库的抗体筛选以检出具有共同结构特征的克隆的多核苷酸片段。本发明的DNA片段序列也能用下列方法获得1)从基因组DNA分离双链DNA序列;2)化学合成DNA序列以获得所述多肽的双链DNA。上述提到的方法中,分离基因组DNA最不常用。DNA序列的直接化学合成是经常选用的方法。更经常选用的方法是cDNA序列的分离。分离感兴趣的cDNA的标准方法是从高表达该基因的供体细胞分离mRNA并进行逆转录,形成质粒或噬菌体cDNA文库。提取mRNA的方法已有多种成熟的技术,试剂盒也可从商业途径获得(Qiagene)。而构建cDNA文库也是通常的方法(Sambrook,etal.,MolecularCloning,ALaboratoryManual,ColdSpringHarborLaboratory.NewYork,1989)。还可得到商业供应的cDNA文库,如Clontech公司的不同cDNA文库。当结合使用聚合酶链反应技术时,即使极少的表达产物也能克隆。可用常规方法从这些cDNA文库中筛选本发明的基因。这些方法包括(但不限于)(1)DNA-DNA或DNA-RNA杂交;(2)标志基因功能的出现或丧失;(3)测定hARRG转录本的水平;(4)通过免疫学技术或测定生物学活性,来检测基因表达的蛋白产物。上述方法可单用,也可多种方法联合应用。在第(1)种方法中,杂交所用的探针是与本发明的多核苷酸的任何一部分同源,其长度至少10个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸。此外,探针的长度通常在2000个核苷酸之内,较佳的为1000个核苷酸之内。此处所用的探针通常是在本发明的基因序列信息的基础上化学合成的DNA序列。本发明的基因本身或者片段当然可以用作探针。DNA探针可用放射性同位素、荧光素或酶(如碱性磷酸酶)等进行标记。在第(4)种方法中,检测hARRG多肽基因表达的蛋白产物可用免疫学技术如Western印迹法,放射免疫沉淀法,酶联免疫吸附法(ELISA)等。应用PCR技术扩增DNA/RNA的方法(Saiki,etal.Science1985;230:1350-1354)被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法)。用于PCR的引物可根据本文所公开的本发明的多核苷酸序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。如上所述得到的本发明的基因或其各种DNA片段的核苷酸序列,可用常规方法如双脱氧链终止法(Sangeretal.PNAS,1977,74:5463-5467)测定。这类多核苷酸序列测定也可用商业测序试剂盒。为了获得全长的cDNA序列,测序需反复进行。有时需要测定多个克隆的cDNA序列,才能拼接成全长的cDNA序列。本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或直接用hARRG多肽编码序列经基因工程产生的宿主细胞,以及经重组技术产生本发明所述多肽的方法。本发明中,编码hARRG多肽的多核苷酸序列可插入到载体中,以构成含有本发明所述多核苷酸的重组载体。术语“载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其它载体。在本发明中适用的载体包括但不限于在细菌中表达的基于T7启动子的表达载体(Rosenberg,etal.Gene,1987,56:125);在哺乳动物细胞中表达的pMSXND表达载体(LeeandNathans,JBioChem.263:3521,1988)和在昆虫细胞中表达的来源于杆状病毒的载体。总之,只要能在宿主体内复制和稳定,任何质粒和载体都可以用于构建重组表达载体。表达载体的一个重要特征是通常含有复制起始点、启动子、标记基因和翻译调控元件。本领域的技术人员熟知的方法能用于构建含编码hARRG多肽的DNA序列和合适的转录/翻译调控元件的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等(Sambroook,etal.MolecularCloning,aLaboratoryManual,coldSpringHarborLaboratory.NewYork,1989)。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有大肠杆菌的lac或trp启动子;λ噬菌体的PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其它一些已知的可控制基因在原核细胞或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子等。在载体中插入增强子序列将会使其在高等真核细胞中的转录得到增强。增强子是DNA表达的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性等。本领域一般技术人员都清楚如何选择适当的载体/转录调控元件(如启动子、增强子等)和选择性标记基因。本发明中,编码hARRG多肽的多核苷酸或含有该多核苷酸的重组载体可转化或转导入宿主细胞,以构成含有该多核苷酸或重组载体的基因工程化宿主细胞。术语“宿主细胞”指原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有大肠杆菌,链霉菌属;细菌细胞如鼠伤寒沙门氏菌;真菌细胞如酵母;植物细胞;昆虫细胞如果蝇S2或Sf9;动物细胞如L-02、CHO、COS-7或Bowes黑素瘤细胞等。用本发明所述的DNA序列或含有所述DNA序列的重组载体转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是用MgCl2进行处理。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法磷酸钙共沉淀法,或者常规机械方法如显微注射、电穿孔、脂质体包装等。通过常规的重组DNA技术(Science,1984;224:1431),利用本发明的多核苷酸序列可用来表达或生产重组的hARRG多肽。一般来说有以下步骤(1).用本发明的编码人hARRG多肽的多核苷酸(或变异体),或用含有该多核苷酸的重组表达载体转化或转导合适的宿主细胞;(2).在合适的培养基中培养宿主细胞;(3).从培养基或细胞中分离、纯化蛋白质。在步骤(2)中,根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。在步骤(3)中,重组多肽可包被于细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法包括但并不限于常规的复性处理、蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超声波处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。本发明的多肽以及该多肽的拮抗剂、激动剂和抑制剂可直接用于疾病治疗和预防。例如,该多肽可治疗砷中毒、中毒性脑病、急性肾衰、急性溶血性贫血、心血管病、免疫性疾病、皮肤病和肝、肺、支气管、神经系统等各类炎症等。砷造成的以上各类疾病目前尚无特效治疗药物,用hARRG多肽可以将进入体内和细胞内的砷解毒并排出细胞和机体外,即降低了细胞内砷的浓度又降低了砷的毒性,达到高效治疗的目的。该多肽及其激动剂也可用于砷中毒的预防,给接触高砷环境的工人及生活在高砷地区的居民使用可及时排出进入体内的砷而避免砷中毒的发生。该多肽及其拮抗剂、激动剂和抑制剂也可用于恶性肿瘤的辅助治疗。目前,已有学者用砷剂治疗白血病、恶性淋巴瘤等恶性肿瘤并已取得显著疗效。但由于部分病人因发生砷中毒而影响用药剂量及治疗效果。另有部分病人对砷剂产生耐药性而影响疗效。可用该多肽及其激动剂提高病人正常组织的并用其拮抗剂和抑制剂降低肿瘤组织的耐砷性增加对砷的敏感性,从而提高砷治疗恶性肿瘤的效果。本发明也提供了筛选化合物以鉴定提高(激动剂)或阻遏(拮抗剂)hARRG的药剂的方法。激动剂提高hARRG正常细胞抗砷等生物功能,而拮抗剂降低各种正常或非正常细胞如癌细胞等的抗砷能力。例如,能在不同浓度砷的环境下,将哺乳动物细胞与拟筛选的药物一起培养。然后用细胞集落形成法或XTT显色法测定不同浓度砷的环境下细胞集落形成数或细胞存活数,从而分析药物提高或阻遏此hARRG的作用的能力。hARRG多肽的拮抗剂包括筛选出的抗体、化合物、受体缺失物和类似物等。hARRG多肽的拮抗剂可以与hARRG多肽结合并消除其功能,或是抑制该多肽的产生,或是与该多肽的活性位点结合使该多肽不能发挥生物学功能。在筛选作为拮抗剂的化合物时,可以将hARRG多肽加入生物分析测定中,通过测定化合物对hARRG多肽和其受体之间相互作用的影响来确定化合物是否是拮抗剂。用上述筛选化合物的同样方法,可以筛选出起拮抗剂作用的受体缺失物和类似物。能与hARRG多肽结合的多肽分子可通过筛选由各种可能组合的氨基酸结合于固相物组成的随机多肽库而获得。筛选时,一般应对hARRG多肽分子进行标记。本发明提供了用多肽,及其片段、衍生物、类似物或它们的细胞作为抗原以生产抗体的方法。这些抗体可以是多克隆抗体或单克隆抗体。本发明还提供了针对hARRG多肽抗原决定簇的抗体。这些抗体包括(但不限于)多克隆抗体、单克隆抗体、嵌合抗体、单链抗体、Fab片段和Fab表达文库产生的片段。多克隆抗体的生产可用hARRG多肽直接注射免疫动物(如家兔,小鼠,大鼠等)的方法得到。有多种佐剂可用于增强免疫反应,包括但不限于弗氏佐剂等。制备hARRG多肽的单克隆抗体的技术包括但不限于杂交瘤技术(KohlerandMilstein.Nature,1975,256:495-497),三瘤技术,人B-细胞杂交瘤技术,EBV-杂交瘤技术等。将人恒定区和非人源的可变区结合的嵌合抗体可用已有的技术生产(Morrisonetal,PNAS,1985,81:6851)。而已有的生产单链抗体的技术(U.S.PatNo.4946778)也可用于生产抗hARRG多肽的单链抗体。抗hARRG多肽的抗体可用于免疫组织化学技术中,检测活检标本中的hARRG多肽。与hARRG多肽结合的单克隆抗体也可用放射性同位素标记,注入体内可跟踪其位置和分布。这种放射性标记的抗体可作为一种非创伤性诊断方法用于肿瘤细胞的定位和判断是否有转移。抗体还可用于设计针对体内某一特殊部位的免疫毒素。如hARRG多肽高亲和性的单克隆抗体可与细菌或植物毒素(如白喉毒素,蓖麻蛋白,红豆碱等)共价结合。一种通常的方法是用巯基交联剂如SPDP,攻击抗体的氨基,通过二硫键的交换,将毒素结合于抗体上,这种杂交抗体可用于杀灭hARRG多肽阳性的细胞。本发明中的抗体可用于辅助治疗对砷有耐受性的恶性肿瘤的砷剂治疗方法,给予适当剂量的抗体可以阻断肿瘤细胞hARRG多肽的产生或活性。本发明还涉及定量和定位检测hARRG多肽水平的诊断试验方法。这些试验是本领域所熟知的,且包括FISH测定和放射免疫测定。试验中所检测的hARRG多肽水平,可以用作解释hARRG多肽在各种疾病中的重要性和用于诊断hARRG多肽起作用的疾病。本发明的多肽还可用作肽谱分析,例如,多肽可用物理的、化学或酶进行特异性切割,并进行一维或二维或三维的凝胶电泳分析,更好的是进行质谱分析。编码hARRG多肽的多核苷酸也可用于多种治疗目的。基因治疗技术可用于治疗由于hARRG多肽的无表达或异常/无活性表达所致的细胞增殖、发育或代谢异常。重组的基因治疗载体(如病毒载体)可设计用于表达变异的hARRG多肽,以抑制内源性的hARRG多肽活性。例如,一种变异的hARRG多肽可以是缩短的、缺失了信号传导功能域的hARRG多肽,虽可与下游的底物结合,但缺乏信号传导活性。因此重组的基因治疗载体可用于治疗hARRG多肽表达或活性异常所致的疾病。来源于病毒的表达载体如逆转录病毒、腺病毒、腺病毒相关病毒、单纯疱疹病毒、细小病毒等可用于将编码hARRG多肽的多核苷酸转移至细胞内。构建携带编码hARRG多肽的多核苷酸的重组病毒载体的方法可见于已有文献(Sambrook,etal.)。另外重组编码hARRG多肽的多核苷酸可包装到脂质体中然后再转移至细胞内。多核苷酸导入组织或细胞内的方法包括将多核苷酸直接注入到体内组织中;或在体外通过载体(如病毒、噬菌体或质粒等)先将多核苷酸导入细胞中,再将细胞移植到体内等。抑制hARRG多肽mRNA的寡核苷酸(包括反义RNA和DNA)以及核酶也在本发明的范围之内。核酶是一种能特异性分解特定RNA的酶样RNA分子,其作用机制是核酶分子与互补的靶RNA特异性杂交后进行核酸内切作用。反义的RNA和DNA及核酶可用已有的任何RNA或DNA合成技术获得,如固相磷酸酰胺化学合成法合成寡核苷酸的技术已广泛应用。反义RNA分子可通过编码该RNA的DNA序列在体外或体内转录获得。这种DNA序列已整合到载体的RNA聚合酶启动子的下游。为了增加核酸分子的稳定性,可用多种方法对其进行修饰,如增加两侧的序列长度,核糖核苷之间的连接应用磷酸硫酯键或肽键而非磷酸二酯键。编码hARRG多肽的多核苷酸可用于诊断与hARRG多肽相关的疾病。编码hARRG多肽的多核苷酸可用于检测hARRG的表达与否或在疾病状态下hARRG的异常表达。如编码hARRG多肽的DNA序列可用于对活检标本进行杂交以判断hARRG的表达状况。杂交技术包括Southern印迹法,Northern印迹法、原位杂交等。这些技术方法都是公开的成熟技术,相关的试剂盒都可从商业途径得到。本发明的多核苷酸的一部分或全部可作为探针固定在微阵列(Microarray)或DNA芯片(又称为“基因芯片”)上,用于分析组织中基因的差异表达分析和基因诊断。用hARRG特异的引物进行RNA-聚合酶链反应(RT-PCR)体外扩增也可检测hARRG的转录产物。检测hARRG多肽基因的突变也可用于诊断hARRG多肽相关的疾病。hARRG突变的形式包括与正常野生型hARRG多肽DNA序列相比的点突变、易位、缺失、重组和其它任何异常等。可用已有的技术如Southern印迹法、DNA序列分析、PCR和原位杂交检测突变。另外,突变有可能影响蛋白的表达,因此用Northern印迹法、Western印迹法可间接判断基因有无突变。本发明的序列对染色体鉴定也是有价值的。该序列会特异性地针对某条人染色体具体位置且并可以与其杂交。目前,需要鉴定染色体上的各基因的具体位点。然而,现在只有很少的基于实际序列数据(重复多态性)的染色体标记物可用于标记染色体位置。根据本发明,为了将这些序列与疾病相关基因相关联,其重要的第一步就是将这些DNA序列定位于染色体上。简而言之,根据cDNA制备PCR引物(优选15-35bp),可以将序列定位于染色体上。然后,将这些引物用于PCR筛选含各条人染色体的体细胞杂合细胞。只有那些含有相应于引物的人基因的杂合细胞会产生扩增的片段。体细胞杂合细胞的PCR定位法,是将DNA定位到具体染色体的快捷方法。使用本发明的寡核苷酸引物,通过类似方法,可利用一组来自特定染色体的片段或大量基因组克隆而实现亚定位。可用于染色体定位的其它类似策略包括原位杂交、用标记的流式分选的染色体预筛选和杂交预选,从而构建染色体特异的cDNA库。将cDNA克隆与中期染色体进行荧光原位杂交(FISH),可以在一个步骤中精确地进行染色体定位。此技术的综述,参见Verma等,HumanChromosomes:aManualofBasicTechniques,PergamonPress,NewYork(1988)。一旦序列被定位到准确的染色体位置,此序列在染色体上的物理位置就可以与基因图数据相关联。这些数据可见于例如,V.Mckusick,MendelianInheritanceinMan(可通过与JohnsHopkinsUniversityWelchMedicalLibrary联机获得)。然后可通过连锁分析,确定基因与业已定位到染色体区域上的疾病之间的关系。接着,需要测定患病和未患病个体间的cDNA或基因组序列差异。如果在一些或所有的患病个体中观察到某突变,而该突变在任何正常个体中未观察到,则该突变可能是疾病的病因。比较患病和未患病个体,通常涉及首先寻找染色体中结构的变化,如从染色体水平可见的或用基于cDNA序列的PCR可检测的缺失或易位。根据目前的物理作图和基因定位技术的分辨能力,被精确定位至与疾病有关的染色体区域的cDNA,可以是50至500个潜在致病基因间之一种(假定1兆碱基作图分辨能力和每20kb对应于一个基因)。可以将本发明的多肽、多核苷酸及其模拟物、激动剂、拮抗剂和抑制剂与合适的药物载体组合后使用。这些载体可以是水、葡萄糖、乙醇、盐类、缓冲液、甘油以及它们的组合。组合物包含安全有效量的多肽或拮抗剂以及不影响药物效果的载体和赋形剂。这些组合物可以作为药物用于疾病治疗。本发明还提供含有一种或多种容器的药盒或试剂盒,容器中装有一种或多种本发明的药用组合物成分。与这些容器一起,可以有由制造、使用或销售药品或生物制品的政府管理机构所给出的指示性提示,该提示反映出生产、使用或销售的政府管理机构许可其在人体上施用。此外,本发明的多肽可以与其它的治疗化合物结合使用。药物组合物可以以方便的方式给药,如通过局部、静脉内、腹膜内、肌内、皮下、鼻内或皮内的给药途径。hARRG多肽以有效地治疗和/或预防具体的适应症的量来给药。施用于患者的hARRG多肽的量和剂量范围将取决于许多因素,如给药方式、待治疗者的健康条件和诊断医生的判断。本发明hARRG基因序列的结构特征hARRG序列第1410bp处比Hsm800627序列多了"AAG"3个碱基,而在2574bp处少了12个碱基其序列为"tactccccccag"。经过与基因库(GenBank)中EST片段进行的同源性分析表明,这两种可变剪切形式在已测得的EST中也有存在,这就排除了测序错误的可能。分析以上两个可变剪切形式发现它们符合真核生物内含子的剪切位点特征——末端均有"AG"。本发明的hARRG具有序列的功能与hARRG基因的高度同源的序列,是从中国仓鼠抗砷细胞株中分离出的具有一定抗砷作用的基因。我们的研究表明,人的抗砷基因在大多数组织中均有分布,尤其在肝脏、胰腺中表达最为丰富。在高等生物中,可变剪接的现象普遍存在。在不同发育阶段和细胞类型中,可变剪接作为一种基因表达调控方式,可以使同一基因产生不同功能的蛋白,从而调节细胞的发育和生理功能。该基因的这两种不同剪接形式均在开放阅读框内,可翻译成为不同的蛋白质,从而行使不同的功能。由于该基因在体内分布广泛,所以在正常情况下除抗砷作用外一定具备一些其它的生理功能,可能是细胞新陈代谢所必须的基因。研究表明,砷是一种原浆毒物质,且能麻痹毛细血管,并使肝脏脂变、肝小叶中心坏死,心、肝、肾、肠充血,上皮细麻痹毛细血管胞坏死,毛细血管扩张。砷在细胞中能与所有含巯基的酶结合抑制这些酶的活性,从而引起细胞代谢的严重紊乱和障碍。出现特有的神经系统和内脏器官的血管功能障碍,血管紧张度下降,渗透性增高,大脑和内脏器官的血管麻痹,导致中枢和末梢神经系统以及内脏器官的活动障碍。急性中毒表现为腹绞疼、腹泻、血尿、休克、中枢神经系统麻痹,甚至死亡。还可表现为急性溶血性贫血及肝、肾、脑、脊髓的功能障碍和炎症。慢性中毒主要表现为皮肤过度角化、血管病变,并伴有支气管、肺肝、肠的损害。砷还具有致突变、致畸、致癌作用。国际癌症研究机构(IARC)确认长期接触砷可引起皮肤癌、肺癌。妊娠妇女接触砷可造成胎儿畸形。砷是染色体的强烈断裂剂,可引起染色体畸变、重组、断裂及微核率增加。由此可见砷是一种严重危害人类健康的有毒元素。抗砷基因的表达产物可以将进入细胞内的砷通过代谢解毒并将其排出细胞外从而保证细胞和机体免受砷的危害。hARRG的可变剪切将影响该蛋白抗砷作用的开启和作用的强弱。由于砷是一种致癌物质,抗砷作用的强弱直接影响到砷在细胞内的浓度,进而影响砷对基因作用的时间和强度,从而有可能对基因突变、致癌产生一定的影响。如上所述,因为hARRG多肽蛋白在抗毒和新陈代谢等机体重要功能中起重要作用,因此新hARRG多肽蛋白编码基因的分离为研究确定该蛋白在健康和疾病状态下的作用提供了基础。此外,由于本发明的人hARRG具有源自人的天然氨基酸序列,因此,与来源于其他物种的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。实施例1人类抗砷相关基因(hARRG)cDNA的克隆用异硫氰酸胍/酚/氯仿一步法提取人胎脑总RNA。用QuickmRNA分离试剂盒(Qiagene公司产品)从总RNA中分离poly(A)mRNA。2ugpoly(A)mRNA经逆转录形成cDNA。用SmartcDNA克隆试剂盒(购自Clontech)将cDNA片段定向插入到pBSK(+)载体(Clontech公司产品)的多克隆位点上,转化DH5α细菌形成cDNA文库。用DyeTerminateCycleReaction测序试剂盒(Perkin-Elmer公司产品)和ABI377自动测序议(Perkin-Elmer公司)测定所有克隆的5’和3’末端的序列。将测定的cDNA序列与已有的公共DNA序列数据库(Genbank)进行比较,结果发现其中一个克隆0233H10的cDNA序列为新的DNA。通过合成一系列引物对该克隆所含的插入cDNA片段进行双向测定。结果表明,0233H10克隆所含的全长cDNA为2999bp(如SEQIDNO:1所示),从第500bp至2866bp有一个2364bp的开放阅读框架(ORF),编码一个新的含788个氨基酸(不包括终止密码子)的蛋白质(如SEQIDNO:2所示)。此克隆被命名为pBS-233H10,所编码的蛋白质被命名为hARRG多肽。实施例2hARRGcDNA克隆的同源检索将本发明的hARRG的序列及其编码的蛋白序列,用Blast程序(BasiclocalAlignmentsearchtool)[Altschul,SFetal.J.Mol.Biol.1990;215:403-10],在Genbank、Swissport等数据库进行同源检索。与本发明的hARRG同源性最高的基因是一种已知人抗砷蛋白基因,其编码的蛋白在Genbank的准入号为hsm800627。蛋白质同源结果示于图1,两者高度同源,其相同性为98.858%;相似性为99.112%。核苷酸同源比较示于图2,其中大写字母为hARRG基因与hsm800627基因不同之处,hsm800627序列在1684bp处缺少一个碱基“G”,造成读码框易位错误(两个序列的相同性为99.764%)。实施例3用RT-PCR方法克隆hARRG基因用胎脑细胞总RNA为模板,以oligo-dT为引物进行逆转录反应合成cDNA,用Qiagene的试剂盒纯化后,用下列引物进行PCR扩增引物1:5’-GGCCATTATGGCCGGGGGGAGGCG-3’(SEQIDNO:3)引物2:5’-CCCTGTGGAAGTGCTTTTATTAGCAG-3’(SEQIDNO.4)引物1为位于SEQIDNO:1的5’端的第1bp开始的正向序列;引物2为SEQIDNO:1的中的3’端反向序列。扩增反应的条件在50μl的反应体积中含有50mmol/LKCl,10mmol/LTris-Cl,(pH8.5),1.5mmol/LMgCl2,200μmol/LdNTP,10pmol引物,1U的TaqDNA聚合酶(Clontech公司产品)。在PE9600型DNA热循环仪(Perkin-Elmer公司)上按下列条件反应25个周期94℃30sec;55℃30sec;72℃2min。在RT-PCR时同时设β-肌动蛋白为阳性对照和模板空白为阴性对照。扩增产物用QIAGEN公司的试剂盒纯化,用TA克隆试剂盒连接到pCR载体上(Invitrogen公司产品)。DNA序列分析结果表明PCR产物的DNA序列与SEQIDNO:1所示的1-2999bp完全相同。实施例4Northern印迹法分析hARRG的表达用一步法提取不同组织总RNA[Anal.Biochem1987,162,156-159]。该法包括酸性硫氰酸胍苯酚-氯仿抽提。即用4M异硫氰酸胍-25mM柠檬酸钠,0.2M乙酸钠(pH4.0)对组织进行匀浆,加入1倍体积的苯酚和1/5体积的氯仿-异戊醇(49∶1),混合后离心。吸出水相层,加入异丙醇(0.8体积)并将混合物离心得到RNA沉淀。将得到的RNA沉淀淀用70%乙醇洗涤,干燥并溶于水中。用20μgRNA,在含20mM3-(N-吗啉代)丙磺酸(pH7.0)-5mM乙酸钠-1mMEDTA-2.2M甲醛的1.2%琼脂糖凝胶上进行电泳。然后转移至硝酸纤维素膜上。用α-32PdATP通过随机引物法制备32P-标记的DNA探针。所用的DNA探针为PCR扩增的hARRG编码区序列(SEQIDNO:1中500bp至2866bp)。将32P-标记的探针(约2×106cpm/ml)与转移了RNA的硝酸纤维素膜在一溶液中于42℃杂交过夜,该溶液包含50%甲酰胺-25mMKH2PO4(pH7.4)-5×SSC-5×Denhardt’s溶液和200μg/ml鲑精DNA。杂交之后,将滤膜在1×SSC-0.1%SDS中于55℃洗30min。然后,用PhosphorImager进行分析和定量。结果发现,hARRG在多数组织中均有分布,即在心、脑、胎盘、肝、骨骼肌、肾及胰腺等组织器官中均有表达,而肺中表达较少,胰腺、肝脏及心脏表达较高。除了3.0Kb的转录本外,另外在肝脏和胰腺中尚可见-5.5Kb的转录本(见图3)。实施例5重组hARRG的体外表达、分离和纯化根据SEQIDNO:1和图1所示的编码区序列,设计出一对特异性扩增引物,序列如下引物3:5’-cgcgcatatgagcacagctctgacc-3’(SEQIDNO5)引物4:5’-cgcgaattccggctcaaaagaaatcaac-3’(SEQIDNO6)此两段引物的5’端分别含有NdeⅠ和EcoRⅠ酶切位点,其后分别为目的基因5’端和3’端的编码序列,NdeⅠ和EcoRⅠ酶切位点相应于表达载体质粒pET-28b(+)(Novagen公司产品,Cat.No.69865.3)上的选择性内切酶位点。以含有全长目的基因的pBS-0097d10质粒为模板,进行PCR反应。PCR反应条件为总体积50μl中含实施例3的RT-PCR扩增产物作为模板、引物-3和引物-4分别为10pmol、AdvantagepolymeraseMix(Clontech公司产品)1μl。循环参数94℃20s,60℃30s,68℃2min,共25个循环。用NdeⅠ和EcoRⅠ分别对扩增产物和质粒pET-28(+)进行双酶切,分别回收大片段,并用T4连接酶连接。连接产物转化用氯化钙法大肠杆细菌DH5α,在含卡那霉素(终浓度30μg/ml)的LB平板培养过夜后,用菌落PCR方法筛选阳性克隆,并进行测序。挑选序列正确的阳性克隆(pET-0097d10)用氯化钙法将重组质粒转化大肠杆菌BL21(DE3)plySs(Novagen公司产品)。在含卡那霉素(终浓度30μg/ml)的LB液体培养基中,宿主菌BL21(pET-0097d10)在37℃培养至对数生长期,加入IPTG至终浓度1mmol/L,继续培养5小时。离心收集菌体,经超声波破菌,离心收集上清,用能与6个组氨酸(6His-Tag)结合的亲和层析柱His.BindQuickCartridge(Novagen公司产品)进行层析,得到了纯化的目的蛋白hARRG多肽。经SDS-PAGE电泳,在89.2kDa处得到一单一的条带(图4)。将该条带转移至PVDF膜上用Edams水解法进行N-端氨基酸序列分析,结果N-端15个氨基酸与SEQIDNO:2所示的N-端15个氨基酸残基完全相同。实施例6抗hARRG抗体的产生用多肽合成仪(PE公司产品)合成下述hARRG特异性的多肽NH2-Met-Ser-Thr-Ala-Leu-Thr-His-Thr-Thr-Val-Ala-Met-Arg-Cys-Pro(SEQIDNO:7)。将该多肽分别与血蓝蛋白和牛血清白蛋白耦合形成复合,方法参见Avrameas,etal.Immunochemistry,1969;6:43。用4mg上述血蓝蛋白多肽复合物加上完全弗氏佐剂免疫家兔,15天后再用血蓝蛋白多肽复合物加不完全弗氏佐剂加强免疫一次。采用经15μg/ml牛血清白蛋白多肽复合物包被的滴定板做ELISA测定兔血清中抗体的滴度。用蛋白A-Sepharose从抗体阳性的家兔血清中分离总IgG。将多肽结合于溴化氰活化的Sepharose4B柱上,用亲和层析法从总IgG中分离抗多肽抗体。免疫沉淀法证明纯化的抗体可特异性地与hARRG蛋白结合。在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。序列表(1)一般信息(ⅱ)发明名称新的人抗砷相关蛋白及其编码序列(ⅲ)序列数目7(2)SEQIDNO:1的信息(ⅰ)序列特征(A)长度2999bp(B)类型核酸(C)链性双链(D)拓扑结构线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQIDNO:1:GGCCATTATGGCCGGGGGGAGGCGTGGGTGACGCAGGCGCAGCGCGGGCTGCGCGCGCTA60CTGCCCATCCCCGGTTGTCCCACTTTTGTTCGCCTCTCTTCGGTCCTCTACTCAAGAGCT120CCGTCTCCGTCTCGCCCTCCTCGAAGTCCTCGTCGCGCGCCCGCGACCCAGGTCGCCCTG180AAATCTAGCCCGTCCGAGCGCGAGTCCAACGGCCGCGGCCGCACCAAGGCCCCCTCAGAC240CGTGCCATGGGTGACAGTGATGACGAGTACGATCGAAGGCGCAGGGACAAGTTCAGAAGA300GAGCGCAGCGACTACGACCGTTCCCGCGAGAGAGATGAAAGACGTCGAGGGGACGATTGG360AATGACAGAGAGTGGGACCGTGGCCGTGAGCGCCGTAGTCGGGGTGAATATCGGGACTAT420GACCGGAATCGGCGAGAGCGCTTCTCGCCACCTCGCCACGAACTCAGCCCGCCACAGAAG480CGCATGAGGAGAGACTGGGATGAGCACAGCTCTGACCCATACCACAGTGGCTATGAGATG540CCCTATGCTGGGGGGGGGTGGGGGCCCAACTTATGGCCCCCCTCAGCCCTGGGGCCACCC600TGAAGTCCACATCATGCAGCACCATGTCCTGCCTATCCAGGCCAGGCTGGGCAGCATTGC660AGAGATTGACCTGGGTGTGCCGCCGCCCGTGATGAAGACCTTCAAGGAGTTTCTCCTCTC720CCTGGATGACTCGGTGGATGAGACGGAGGCCGTCAAGCGCTATAATGACTACAAGCTGGA780TTTCCGGAGGCAACAGATGCAGGATTTCTTCCTGGCGCACAAAGATGAGGAGTGGTTTCG840GTCTAAGTACCACCCAGATGAGGTGGGGAAGCGTCGGCAGGAGGCCCGGGGGGCCCTGCA900AAACCGACTGAGGGTCTTCCTGTCCCTCATGGAGACTGGCTGGTTTGATAACCTTCTCCT960GGACATAGACAAAGCTGATGCCATTGTCAAGATGCTGGATGCAGCCGTGATTAAGATGGA1020AGGAGGCACGGAGAATGATCTCCGCATCCTGGAGCAGGAGGAGGAGGAGGAGCAGGCAGG1080AAAGCCTGGGGAGCCCAGCAAGAAAGAAGAAGGACGGGCTGGAGCAGGCCTAGGGGACGG1140GGAGCGCAAAACCTACGACAAGGATGAGAAGAAGGAAGACGGCAAGCAGGCTGAGAATGA1200CAGTTCTAATGATGACAAAACAAAGAAGTCGGAGGGTGATGGGGACAAGGAAGAGAAGAA1260AGAAGACTCCGAGAAGGAAGCCAAAAAGAGTAGCAAGAAGCGGAACCGGAAGCACAGTGG1320TGACGACAGCTTTGACGAGGGCAGCGTGTCAGAGTCTGAGTCGGAGTCAGAGAGCGGCCA1380GGCTGAGGAGGAGAAGGAGGAGGCCGAAGAAGCGCTCAAGGAGAAGGAGAAGCCCAAGGA1440AGAAGAATGGGAGAAGCCCAAGGACGCCGCGGGGCTGGAGTGCAAGCCGCGGCCGCTGCA1500TAAGACCTGCTCCCTCTTCATGCGCAACATCGCGCCCAACATCTCCCGGGCCGAGATCAT1560CTCCCTTTGTAAAAGGTACCCAGGCTTTATGCGGGTGGCGCTCTCAGAGCCCCAGCCAGA1620GAGGAGGTTTTTCCGTCGTGGCTGGGTGACCTTCGACCGCAGTGTTAACATTAAAGAGAT1680CTGTTGGAACCTGCAGAACATCCGTCTCCGGGAGTGTGAGCTGAGCCCTGGTGTGAACAG1740GGACCTGACCCGGCGCGTTCGCAACATCAACGGCATCACCCAGCACAAGCAGATTGTGCG1800CAACGACATCAAGCTGGCGGCCAAGCTGATCCACACGCTGGATGACAGGACACAGCTTTG1860GGCCTCAGAACCAGGGACGCCTCCCCTGCCCACGAGCCTGCCCTCGCAAAACCCGATCTT1920GAAGAATATCACCGACTACCTGATCGAGGAAGTAAGCGCCGAGGAGGAGGAGCTGCTGGG1980GAGCAGCGGGGGCGCTCCTCCTGAGGAGCCTCCTAAGGAAGGGAACCCGGCAGAGATCAA2040CGTGGAGCGGGATGAGAAGTTGATTAAGGTCTTGGACAAGCTCCTCCTTTACCTGCGCAT2100CGTGCATTCCTTGGATTATTACAACACCTGTGAGTACCCCAACGAGGACGAGATGCCCAA2160TCGCTGTGGGATCATCCACGTTCGGGGGCCCATGCCACCCAACCGCATCAGTCACGGGGA2220AGTGCTGGAGTGGCAGAAGACTTTTGAGGAGAAGCTCACGCCGTTGCTGAGTGTGCGGGA2280GTCACTCTCAGAGGAAGAGGCCCAGAAGATGGGGCGCAAAGACCCAGAGCAGGAAGTGGA2340GAAGTTCGTCACCTCCAACACGCAGGAACTGGGCAAGGATAAGTGGCTGTGTCCTCTCAG2400TGGCAAGAAATTCAAGGGTCCTGAGTTTGTGCGCAAACATATCTTCAACAAGCATGCAGA2460GAAAATTGAGGAAGTGAAAAAGGAAGTCGCGTTTTTTAACAACTTCCTCACTGATGCTAA2520GCGCCCAGCTCTGCCTGAGATCAAGCCAGCCCAGCCACCTGGCCCCGCCCAGAGTTTGAC2580CCCAGGACTCCCCTACCCACACCAGACTCCCCAGGGCCTGATGCCCTATGGTCAGCCCCG2640GCCCCCGATCTTGGGCTATGGAGCTGGTGCTGTCCGCCCTGCAGTCCCCACAGGAGGCCC2700TCCATACCCCCATGCCCCGTATGGTGCTGGTCGAGGGAACTATGATGCCTTCCGAGGCCA2760GGGAGGTTATCCTGGGAAACCTCGCAACAGGATGGTTCGTGGAGACCCAAGGGCCATTGT2820GGAATATCGGGACCTGGATGCCCCAGACGATGTTGATTTCTTTTGAGCCGTCCCCCGTTC2880CTCAGTCCTGTATCATCCATACTTGTACTACCTTGTCCTATGAAGCTCTGAGAATTTTTT2940GTACGATCAGCCTTACTGCTAATAAAAGCACTTCCACAGGGAAAAAAAAAAAAAAAAAA2999(2)SEQIDNO:2的信息(ⅰ)序列特征(A)长度788个氨基酸((B)类型氨基酸(D)拓扑结构线性(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQIDNO:2:MSTALTHTTVAMRCPMLGGGGGPTYGPPQPWGHPEVHIMQHHVLPIQARL50GSIAEIDLGVPPPVMKTFKEFLLSLDDSVDETEAVKRYNDYKLDFRRQQM100QDFFLAHKDEEWFRSKYHPDEVGKRRQEARGALQNRLRVFLSLMETGWFD150NLLLDIDKADAIVKMLDAAVIKMEGGTENDLRILEQEEEEEQAGKPGEPS200KKEEGRAGAGLGDGERKTYDKDEKKEDGKQAENDSSNDDKTKKSEGDGDK250EEKKEDSEKEAKKSSKKRNRKHSGDDSFDEGSVSESESESESGQAEEEKE300EAEEALKEKEKPKEEEWEKPKDAAGLECKPRPLHKTCSLFMRNIAPNISR350AEIISLCKRYPGFMRVALSEPQPERRFFRRGWVTFDRSVNIKEICWNLQN400IRLRECELSPGVNRDLTRRVRNINGITQHKQIVRNDIKLAAKLIHTLDDR450TQLWASEPGTPPLPTSLPSQNPILKNITDYLIEEVSAEEEELLGSSGGAP500PEEPPKEGNPAEINVERDEKLIKVLDKLLLYLRIVHSLDYYNTCEYPNED550EMPNRCGIIHVRGPMPPNRISHGEVLEWQKTFEEKLTPLLSVRESLSEEE600AQKMGRKDPEQEVEKFVTSNTQELGKDKWLCPLSGKKFKGPEFVRKHIFN650KHAEKIEEVKKEVAFFNNFLTDAKRPALPEIKPAQPPGPAQSLTPGLPYP700HQTPQGLMPYGQPRPPILGYGAGAVRPAVPTGGPPYPHAPYGAGRGNYDA750FRGQGGYPGKPRNRMVRGDPRAIVEYRDLDAPDDVDFF788(2)SEQIDNO:3的信息(ⅰ)序列特征(A)长度24碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQIDNO:3:GGCCATTATGGCCGGGGGGAGGCG24(2)SEQIDNO:4的信息(ⅰ)序列特征(A)长度26碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQIDNO:4:CCCTGTGGAAGTGCTTTTATTAGCAG26(2)SEQIDNO:5的信息(ⅰ)序列特征(A)长度25碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQIDNO:5:CGCGCATATGAGCACAGCTCTGACC25(2)SEQIDNO:6的信息(ⅱ)序列特征(A)长度28碱基(B)类型核酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型寡核苷酸(ⅹⅰ)序列描述SEQIDNO:6:CGCGAATTCCGGCTCAAAAGAAATCAAC28(2)SEQIDNO:7的信息(ⅰ)序列特征(A)长度15个氨基酸(B)类型氨基酸(C)链性单链(D)拓扑结构线性(ⅱ)分子类型多肽(ⅹⅰ)序列描述SEQIDNO:7:MetSerThrAlaLeuThrHisThrThrValAlaMetArgCysPro1权利要求1.一种分离的多肽-hARRG多肽,其特征在于,它包括含有SEQIDNO:2所示的氨基酸序列的多肽、或其多肽的片段、类似物或衍生物。2.如权利要求1所述的多肽,其特征在于,所述氨基酸、类似物或衍生物具有与SEQIDNO:2所示的氨基酸序列至少98.858%的相似性。3.如权利要求2所述的多肽,其特征在于,它是具有SEQIDNO:2所示的氨基酸序列的多肽。4.一种分离的多核苷酸,其特征在于,所述多核苷酸包括选自下组的核苷酸(a)编码具有SEQIDNO:2所示氨基酸序列的多肽或其片段、类似物、衍生物的多核苷酸;(b)与多核苷酸(a)互补的多核苷酸;或(c)与(a)或(b)有至少99.764%相同性的多核苷酸。5.如权利要求4所述的多核苷酸,其特征在于,所述多核苷酸包括编码具有SEQIDNO:2所示氨基酸序列的多核苷酸。6.如权利要求4所述的多核苷酸,其特征在于,所述多核苷酸的序列包含有SEQIDNO:1中500-2866位的序列或SEQIDNO:1中1-2999位的序列。7.一种含有外源多核苷酸的重组载体,其特征在于,它含有权利要求4所述的多寡核苷酸。8.一种含有外源多核苷酸的遗传工程化宿主细胞,其特征在于,它是选自于下列一种宿主细胞(a)用权利要求7所述的重组载体转化或转导的宿主细胞;(b)用权利要求要求4所述多核苷酸转化或转导的宿主细胞。9.一种具有hARRG多肽活性的多肽的制备方法,其特征在于,所述方法包括(a)在表达hARRG多肽条件下,培养权利要求8所述的工程化宿主细胞;(b)从培养物中分离出具有hARRG多肽活性的多肽。10.一种能与多肽结合的抗体,其特征在于,所述抗体是能与hARRG多肽特异性结合的抗体。11.一种药物组合物,其特征在于,它含有权利要求1所述的hARRG多肽和药学上可接受的载体。全文摘要本发明公开了一种新的多肽——hARRG多肽,编码此多肽的多核苷酸和经重组技术产生这种多肽的方法。hARRG多肽是一种抗砷相关蛋白。本发明还公开了此多肽用于治疗多种疾病的方法,尤其是因体内砷过多而导致的疾病,如砷中毒、恶性肿瘤、中毒性脑病、急性肾衰、急性溶血性贫血、心血管病、免疫性疾病等。本发明还公开了抗此多肽的激动剂、拮抗剂及其治疗作用。本发明还公开了编码这种新的hARRG多肽的多核苷酸的用途。文档编号C12N15/63GK1315342SQ0011507公开日2001年10月3日申请日期2000年3月23日优先权日2000年3月23日发明者毛裕民,谢毅,杨磊申请人:上海博道基因技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1