一个锌指蛋白家族的人类新基因znf329的制作方法

文档序号:3569360阅读:439来源:国知局
专利名称:一个锌指蛋白家族的人类新基因znf329的制作方法
技术领域
本发明涉及锌指蛋白家族的人类新基因ZNF329及其克隆、在成人各组织和人体胚胎发育的不同阶段的表达,以及该基因在不同物种间同源基因的同源程度,以探索利用该基因进行人类疾病的诊断及治疗。
背景技术
锌指蛋白家族一般具有该家族的特征性结构----锌指蛋白结构域,是最先在果蝇中被确立的、为中枢神经系统和肌肉等组织分化所必需的调控因子(POSTIGO AA,SHEPPARD A M,MUCENSKI M L,et al.EuropeanMolecular Biology Organization of Journal,1997,16(13)3924-3834)。已知zfh-1基因在早期果蝇胚胎的中胚层以及晚期胚胎的多种中胚层衍生结构中表达,其中包括背侧内脏、性腺支持细胞和成肌细胞等;此外还主要在发育时的中枢神经系统运动神经元中表达。研究表明,Zfh-1蛋白是果蝇中调节肌细胞和性腺细胞分化的转录抑制因子;zfh-1基因参与调节果蝇的尾部中胚层(CVM)的早期分化;参与调节表达eve基因的心脏前体细胞(EPC)的形成;还与tinman基因一同调节包括性腺中胚层在内的外侧中胚层的进一步分化(LAI Z C,FORTONI M E,RUBIN C M et al,Mechanism of Development,1991,34(1-2)123-124;POSTIGO AA,DEAN D C.Proceeding NationalAcademic Science USA.2000,1997(12)6391-6396;KUSCH T,REUTER R.Development,1999,126(18)3991-4003;SU M T,FUJIOKA M,GOTO T,etal,Development,1999,126(14)3241-3251).
zfh-1在脊椎动物中的同源基因也有相似的功能。如ZEB基因的表达产物ZEB-1和ZEB-2蛋白,在包括肌肉、中枢神经系统、T淋巴细胞等组织中均有表达,而最近发现ZEB蛋白包含两个独立的区域,分别调节哺乳动物肌细胞和淋巴细胞的分化(POSTIGO AA,DEAN D CDevelopment,1999,19(12)7961-7971)。
小鼠的zfp-35基因则是精子发生中粗线期精母细胞发育的上游调节基因(CUNLIFFE V,KOOPMAN P,MCLAREN A et al,European MolecularBiology Organization of Joural,1990,9(1)197-205)。而人类锌指基因ZNF家族已被发现参与调节某些肿瘤的形成(OGURI T,KATOHO,TAKAHASHI T et al,Gene,1998,222(1)61-67.)。

发明内容
本发明旨在提供一个锌指蛋白家族的人类新基因ZNF329全部cDNA序列,并分析它在人体各组织和胚胎不同发育阶段的表达,在染色体上的定位,以及不同物种间同源基因的同源度分析。
本发明利用果蝇zfh-1基因的cDNA序列在基因组序列数据库中检索,得到了该cDNA的各种人类同源序列所编码的氨基酸序列,在其中发现了一个新的蛋白质,由此得到了ZNF329的部分cDNA序列,以该序列为基础,利用RACE试剂盒和数据库检索,获得5’端和3’端序列,从而获得全长cDNA序列。
本发明根据该序列设计引物,以正常人胎盘组织cDNA为模板,通过PCR扩增获得该基因的开放阅读框序列,并将开放阅读框克隆到TOPO TA载体上并测序,测序结果与计算机检索结果完全吻合。以开放阅读框的酶切片段为探针,与正常成人组织的总RNA膜进行Nothern杂交,结果表明ZNF329mRNA全长2.9kb,且在大脑组织有较强表达。在开放阅读框5’端设计引物,利用TakaRa公司的5’端RACE试剂盒,以大脑组织的mRNA为模板,做5’端RACE,获得该基因的5’端序列。以胎盘组织cDNA为模板,利用获得的5’端序列设计5’引物,利用数据库检索得到的3’端同源EST序列设计3’端引物,PCR扩增得到ZNF329全长cDNA,克隆到TOPO TA cloning载体(由Invitroten公司提供)上并测序(图1)。该基因cDNA全长2918bp,其中5’端非翻译区为260bp,编码区为542bp,编码542个氨基酸组成的蛋白质,3’端非翻译区为1092bp(图2),其近5’端有一个起始密码子ATG,近3’端有一个终止密码子TGA以及末端的加尾信号ATAAA。
该基因位于第19染色体的BAC CTD2623H2上,共有5个外显子,跨越基因组24.6kb。用遗传学标记进行精确定位,发现该BAC定位于19q13.4区域。根据数据库最新资料,这一区域是缺失畸变易发区。目前已有结果表明,有一个与甲状腺癌相关的抑癌基因位于该区域。同时,这一区域还是锌指蛋白基因富集区,至少有6个以上的锌指蛋白基因位于该区域。
以ZNF329cDNA作探针,与成人免疫组织的mRNA膜杂交,发现该基因在肝脏、胸腺、淋巴结和脾脏中均有表达,而且在肝脏中的表达最强。说明该基因在免疫功能方面可能起着重要的作用。
另外,以开放阅读框的酶切片段为探针,同时与人体胚胎5个不同发育时期的总RNA模杂交,结果表明该基因在胚胎发育的不同阶段存在表达差异,从18周胚胎到26周胚胎,在大脑中都有较强的表达,在肝脏中只有第26周没有表达信号。在肠的表达是从25周开始的,26周也有表达,但是在此之前的18周、19周和2l周的胚胎中都没有表达。ZNF329在18周胚胎的肾中表达,但是在19周和2l周无表达,在25周有较弱表达,在6周又有较强表达(图3)。这些结果表明,ZNF329的表达存在空间和时间差异性,在人体发育的早期阶段的不同组织起着不同的作用。
用该基因编码的蛋白质检索蛋白质数据库,得到了该基因在不同物种中的同源基因。ZNF329与小鼠RIKEN基因具有最高的同源度,547个氨基酸中有75%的同源,与小鼠另一个基因也有较高的同源度,483个氨基酸中77%同源。与狗bc3基因的同源度为52%(477个氨基酸),人类的锌指蛋白家族的其他几个基因ZNF1111,ZNF180,ZNF,以及蛋白flj12586与ZNF329的同源度分别为55%(418),47%(554),100%(374),57%(382)(图5)。ZNF329具有锌指蛋白家族基因特征的结构域Cys2/His2结构(Tommerup N,VissingH,Genomics 1995 May 20;27(2)259-264.。研究表明,具有Cys2/His2结构的基因往往是转录调控因子,表明ZNF329也可能是一种转录因子。
本发明的优点1、提供了全新的ZNF329基因的全长cDNA序列,它的编码产物属于锌指蛋白。
2、ZNF329基因的蛋白序列具有锌指蛋白家族的特征Cys2/His2结构域,这种结构域是DNA的结合位点,具有该结构的基因往往参与转录调节,表明ZNF329的编码蛋白能够作为转录因子,在细胞的增殖和分化中起作用,有可能成为基因工程的产品。
3、ZNF329在正常人组织中广泛表达,显示该基因在细胞内具有重要的作用,也可以为疾病的诊断提供指标。
4、NF329在人体胚胎不同发育阶段有不同的表达,表明该基因参与人体的早期发育,为疾病的早期基因治疗提供了可能。
本发明通过以下附图和实施例作进一步阐述,但并不限制本发明的范围。


图1.ZNF329的cDNA序列图2.ZNF329的编码蛋白图3.在人体胚胎不同发育阶段的Northern杂交图3a 18周胚胎1肝2肠 3肾上腺 4心脏 5肺 6舌 7大脑8小脑9肾10肌肉11胃 12脾有阳性信号的组织1肝 5肺 7大脑 8小脑 9肾图3b 19周胚胎1肝 2肠 3心脏 4肺 5肾 6肌肉 7胃有阳性信号的组织 1肝 7大脑 8小脑图3c 21周胚胎1肝 2肠 3肾上腺 4心脏 5肺 6大脑 7小脑8肾 9肌肉 10胃有阳性信号的组织1肝 3肾上腺 5肺 6大脑 7小脑图3d 25周胚胎1肝 2肠 3心脏 4肺 5肾 6肌肉 7胃有阳性信号的组织1肝 2肠 3心脏 4肺 6肌肉图3e 26周胚胎1肝 2肠 3肾上腺 4心脏 5肺6舌 7大脑8肾9肌肉10胃有阳性信号的组织2肠 3肾上腺 5肺 6舌 7大脑 8肾图4.在人体免疫系统组织的Northern杂交1脾 2淋巴结 3胸腺 4外周血 5骨髓 6胎儿肝图5.ZNF329编码的蛋白在不同物种间的同源性比较实施例1 ZNF329全长cDNA的克隆与测序1、ZNF329开放阅读框的克隆以胎盘组织的cDNA为模板,利用部分cDNA序列设计引物,PCR扩增得到该基因开放阅读框序列,经T载体克隆并测序。
引物序列Z1S5-TGA ATG GAT CCC TCT GCC TTT C-3Z1AS5-ACC ATT ATG TTT CCA TGG GTT GCT C-32、利用TakaRa公司的5’端RACE试剂盒做ZNF329基因的5’端RACE以开放阅读框序列设计RACE引物5’端磷酸化RT primer5-TTG CCT CAA GTG TCC CTC C-3primer A15-TCG ATG GTT GCT GGA CAT T-3primer S15-TTA GGT GAT GGT TGG GAC TG-3primer A25-TGG TTG CTG GAC ATT AGC C-3primer S25-CCA GGA GGG ACA CTT GAG G-3上述引物均由上海生工公司合成。
本实验中取大脑组织mRNA 5ug为模板。具体操作按该公司protocol进行。
3、ZNF329全长cDNA的克隆以胎盘组织的cDNA为模板,利用5’端RACE获得的5’端序列设计5’引物,利用数据库检索得到的3’端同源EST序列设计3’端引物,PCR扩增得到ZNF329全长cDNA,T载体克隆并测序(图1)。该基因cDNA全长2918bp,其中5’端非翻译区为260bp,编码区为542bp,编码542个氨基酸组成的蛋白质,3’端非翻译区为1092bp(图2),其近5’端有一个起始密码子ATG,近3’端有一个终止密码子TGA以及末端的加尾信号ATAAA。
引物序列5’端引物(Z2S)5-TAA ATG CCT GCG CGT CCG CCC-3
3’端引物(Z2AS)5-CCA GTC CCC AAA GAA AAC C-3实施例2 Northern杂交1组织总RNA的提取(按王雁云等,一种快速的总RNA提取方法,生命科学研究,5(1)88-90(2001)进行)。
2总RNA的电泳及转膜,均按《现代分子生物学实验技术》介绍的方法进行(卢圣栋主编,第二版)。
3Northern杂交将固定有人各种组织的总RNA的尼龙膜,放在杂交袋中,加入变性10ml68℃预热的快速杂交液(Clontech公司),68℃预杂交的30分钟,加入变性的同位素标记的ZNF329cDNA探针,42℃杂交过夜。2XSSC,0.05%SDS洗膜,42℃洗两次,15分钟/次。0.1XSSC,0.1%SDS 42℃洗两次,15分钟/次。
4.-80℃曝光12小时,洗出X光片即得图3.4。
权利要求
1.一个锌指蛋白家族的人类新基因ZNF329,其特征在于该人类新基因ZNF329的cDNA核苷酸序列与氨基酸序列如下>znf329的cDNA序列exon1TAA 34 AAT GCC TGC GCG TCC GCC CCG AGG CAA GTC CAC GCC AGG GTA ATG4849AAT AAC CCG GTA CCC GCG GCC GCC CCA GCG TTG GGC GGG GGA AGC9394TCG GGG ACT CCG CGC ACG CGC ACA TCC TTG TCC CGG CAG CCG CGC138exon2139 AAG CGC AAT CGC CCG GAA CAT GGC TGC CGC CGG CCG CCA ACC/ GAT 183184 GGC TGG AGC CGT GTG GAT GGG CAT AAA TGG CTA ATG TCC AGC AAC228229 CAT CGA TGT CAA GTA TCC ACA CAC CTG GCC TGA ATG GAT CCC TCT273exon3274 GCC TTT CAG A/GA GTT TGG GAT ATG AGA TTG AAA ATG ACG ACT CGG 318319 AAT TTT CCT GAG AGA GAA GTA CCC TGT GAT GTA GAA GTG GAA AGA363364 TTC ACA AGG GAA GTT CCC TGC TTG TCC AGT TTA GGT GAT GGT TGG408409 GAC TGT GAG AAC CAG GAG GGA CAC TTG AGG CAA TCA GCT TTA ACT453454 CTG GAG AAA CCA GGG ACT CAG GAA GCA ATT TGT GAA TAT CCT GGT498499 TTT GGG GAG CAT TTG ATT GCA AGC TCA GAC CTT CCA CCG TCT CAG543544 AGA GTT CTG GCA ACA AAT GGT TTC CAT GCA CCT GAC TCA AAT GTT588589 AGT GGT CTG GAT TGT GAC CCC GCC TTA CCC AGC TAT CCT AAA AGT633634 TAT GCA GAT AAG AGA ACT GGT GAC AGT GAT GCC TGT GGA AAA GGC678679 TTC AAC CAT TCC ATG GAA GTT ATT CAT GGA AGA AAT CCA GTG AGA723exon4724 GAG AAG CCC T/AT CAT TTT ACC TCT CTT GGT CAT CAG AAA ATA ATG 768769 AAA AGA GGC AAG AAA TCG TAT GAA GGT AAG AAT TTT GAG AAC ATC813814 TTT ACT CTG AGC TCA TCG CTT AAT GAA AAC CAG AGA AAT CTC CCT858859 GGA GAG AAA CAA TAT AGA TGT ACT GAA TGT GGC AAA TGC TTC AAA903904 CGG AAC TCT TCT CTT GTT TTG CAT CAC CGA ACT CAC ACC GGA GAG948949 AAG CCT TAT ACT TGT AAT GAG TGT GGA AAG TCC TTC TCC AAG AAC993(后续)994 TAC AAC CTG ATT GTG CAT CAA AGA ATC CAC ACA GGA GAG AAG CCC 10381039 TAT GAA TGC AGT AAA TGT GGG AAA GCT TTC AGT GAT GGC TCA GCT 10831084 CTG ACA CAG CAC CAG AGA ATT CAC ACA GGC GAG AAA CCT TAT GAA 11281129 TGC CTA GAG TGT GGA AAA ACC TTC AAC CGA AAT TCA TCC TTA ATT 11731174 TTG CAC CAA AGA ACT CAT ACA GGG GAA AAA CCA TAT AGA TGT AAC 12181219 GAA TGT GGG AAA CCC TTC ACT GAC ATC TCC CAC CTT ACA GTG CAT 12631264 CTC AGA ATC CAC ACC GGT GAG AAG CCC TAT GAG TGT AGC AAA TGT 13081309 GGA AAG GCT TTC CGG GAC GGC TCG TAC CTC ACC CAG CAT GAG AGG 13531354 ACT CAC ACT GGA GAA AAG CCC TTT GAG TGT GCA GAG TGC GGG AAA 13981399 TCC TTC AAC AGA AAC TCT CAC CTC ATT GTG CAT CAA AAG ATC CAT 14431444 TCT GGG GAG AAA CCC TAT GAA TGT AAA GAA TGT GGC AAG ACT TTC 14881489 ATC GAG AGT GCG TAC CTC ATC AGG CAT CAG AGG ATT CAT ACT GGC 15331534 GAG AAG CCC TAT GGC TGC AAC CAG TGT CAG AAA CTT TTC AGG AAT 15781579 ATC GCT GGC CTC ATT AGG CAC CAG AGG ACT CAT ACT GGT GAG AAG 16231624 CCC TAT GAG TGT AAT CAG TGT GGC AAA GCC TTC AGG GAC AGC TCC 16681669 TGT CTG ACC AAG CAC CAG AGA ATT CAC ACT AAG GAG ACC CCA TAT 17131714 CAG TGT CCA GAA TGT GGG AAG TCC TTC AAG CAG AAC TCT CAC CTG 17581759 GCA GTA CAT CAG AGA CTC CAT AGC AGG GAG GGT CCC AGC CGG TGT 18031804 CCT CAG TGT GGA AAA ATG TTC CAA AAG AGC TCA TCC CTT GTT CGA 18481849 CAT CAA AGA GCA CAC CTG GGA GAG CAA CCC ATG GAA ACA TAA TGG 18931894 TTG GGG GCC ACA TGA GTC TTC CAG TTC ACT CTC ACT CCT GTG TTT 19381939 AGG AGG CGT GTC TTA GAT CTG ACT CCT CTC TGG TCA GTA GAA AAG 19831984 AAT CCT TTA AGC TAT CCA GTG AAT TGA TGA ATG TGA GAC ATT GCT 20282029 GAG CCA CAC TGT TAA GTC TGC TCA TTG GGG AAC TCC AGA GAC AAC 20732074 TTA GGA TGA GGG CAG AAA AGT CTT TGG GGA TGA TTC AGT CTG TAC 21182119 CAG ACA TGA CAA CAC ACA CAC TGG AAT GAA ATG TGC AAA CAT GGG 21632164 GGT GAC ACC ACA GAG AGA ACC TGT GAA TGC ATT CAG AAC ATG ATT 22082209 GGA ATG AAG AGC CCT GTA GTA GGG AGT TTC CAC CTT GTA CGT AAG 22532254 CAA ACA CTG AAT CAA CTT TTT TTT TTT TTT CGG ACA GAG TCT CAC 2298(后续)2299 TGT GCA GTG GCA TGA TCT CCA CTC ACA GCA ACC TCT GCC TCC CAG 2343exon52344 GTT CAA GCA GTT CTC CTG CC/T CAG CCT GGC CAG CAT GGT GAA ACC 23882389 CCA TCT CTA CCA AAA ATA CAG GAA ATT ATC TGG GCA TAG TAG TGT 24332434 GTG CCT GTA ATC CCA GCT ACT TGG GAA GCT GAG GCA GGA GAA TTG 24782479 CTT GAA CCT GGG AGG TGG AGG TTG CAG TGA GCT AAG ATC GCA CCA 25232524 CTG CAC TCC AGC CTG GGT GAC AGA GCG AGA CTC CAT TTC AAA AAA 25682569 AAA GAC TGA AAC AAG CTT GTG CTA AGA TGG AAA GGG CTG CTT CTA 26132614 ACA GAT GTG GTT TGT TGC TTT AGT TGT TGA AGC AAA AAT ACT GAG 26582659 TTG TTA TGT TTA TGT TAT CAC CCC ACC ACT ACC TCC ATG GTT GTT 27032704 CAT TTA GGA TGC TTC TAA TTC AGC CAC TGT GAA CCA TTA TAA AGG 27482749 TTT TAT TGC CAT GTT GAA AAT GTT TAT AAT ATG GCA AAA AGG GGC 27932794 ATC AAA TAG AAG ATT TAC TAT TAT TCC AGC CAT GTA AAA ATA TGT 28382839 GCA CAT ATG GAT GTA TGT TGA AAG TGG ATG ATG GAG AAA TAA AAT 28832884 GTG GTT TTC TTT GGG GAC TGG AAA AAA AAA AAA AAA 2919>znf329的编码蛋白1 Met Asp Pro Ser 45 Ala Phe Gln Arg Val Trp Asp Met Arg Leu Lys Met Thr Thr Arg 1920Asn Phe Pro Glu Arg Glu Val Pro Cys Asp Val Glu Val Glu Arg 3435Phe Thr Arg Glu Val Pro Cys Leu Ser Ser Leu Gly Asp Gly Trp 4950Asp Cys Glu Asn Gln Glu Gly His Leu Arg Gln Ser Ala Leu Thr 6465Leu Glu Lys Pro Gly Thr Gln Glu Ala Ile Cys Glu Tyr Pro Gly 7980Phe Gly Glu His Leu Ile Ala Ser Ser Asp Leu Pro Pro Ser Gln 9495Arg Val Leu Ala Thr Asn Gly Phe His Ala Pro Asp Ser Asn Val 109110 Ser Gly Leu Asp Cys Asp Pro Ala Leu Pro Ser Tyr Pro Lys Ser 124125 Tyr Ala Asp Lys Arg Thr Gly Asp Ser Asp Ala Cys Gly Lys Gly 139140 Phe Asn His Ser Met Glu Val Ile His Gly Arg Asn Pro Val Arg 154155 Glu Lys Pro Tyr His Phe Thr Ser Leu Gly His Gln Lys Ile Met 169(后续)170 Lys Arg Gly Lys Lys Ser Tyr Glu Gly Lys Asn Phe Glu Asn Ile 184185 Phe Thr Leu Ser Ser Ser Leu Asn Glu Asn Gln Arg Asn Leu Pro 199200 Gly Glu Lys Gln Tyr Arg Cys Thr Glu Cys Gly Lys Cys Phe Lys 214215 Arg Asn Ser Ser Leu Val Leu His His Arg Thr His Thr Gly Glu 229230 Lys Pro Tyr Thr Cys Asn Glu Cys Gly Lys Ser Phe Ser Lys Asn 244245 Tyr Asn Leu Ile Val His Gln Arg Ile His Thr Gly Glu Lys Pro 259260 Tyr Glu Cys Ser Lys Cys Gly Lys Ala Phe Ser Asp Gly Ser Ala 274275 Leu Thr Gln His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu 289290 Cys Leu Glu Cys Gly Lys Thr Phe Asn Arg Asn Ser Ser Leu Ile 304305 Leu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Asn 319320 Glu Cys Gly Lys Pro Phe Thr Asp Ile Ser His Leu Thr Val His 334335 Leu Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Ser Lys Cys 349350 Gly Lys Ala Phe Arg Asp Gly Ser Tyr Leu Thr Gln His Glu Arg 364365 Thr His Thr Gly Glu Lys Pro Phe Glu Cys Ala Glu Cys Gly Lys 379380 Ser Phe Asn Arg Asn Ser His Leu Ile Val His Gln Lys Ile His 394395 Ser Gly Glu Lys Pro Tyr Glu Cys Lys Glu Cys Gly Lys Thr Phe 409410 Ile Glu Ser Ala Tyr Leu Ile Arg His Gln Arg Ile His Thr Gly 424425 Glu Lys Pro Tyr Gly Cys Asn Gln Cys Gln Lys Leu Phe Arg Asn 439440 Ile Ala Gly Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 454455 Pro Tyr Glu Cys Asn Gln Cys Gly Lys Ala Phe Arg Asp Ser Ser 469470 Cys Leu Thr Lys His Gln Arg Ile His Thr Lys Glu Thr Pro Tyr 484485 Gln Cys Pro Glu Cys Gly Lys Ser Phe Lys Gln Asn Ser His Leu 499500 Ala Val His Gln Arg Leu His Ser Arg Glu Gly Pro Ser Arg Cys 514515 Pro Gln Cys Gly Lys Met Phe Gln Lys Ser Ser Ser Leu Val Arg 529530 His Gln Arg Ala His Leu Gly Glu Gln Pro Met Glu Thr
全文摘要
本发明涉及锌指蛋白家族基因。本发明的一个锌指蛋白家族的人类新基因ZNF329,它的cDNA全长2918bp,编码542个氨基酸组成的蛋白质;该基因位于第19染色体的BAC2623H
文档编号C07H21/04GK1341717SQ0112868
公开日2002年3月27日 申请日期2001年10月17日 优先权日2001年10月17日
发明者吴秀山, 朱传炳, 戴琦, 袁婺洲, 李永清, 王跃群, 罗开梅, 曾伟奇 申请人:湖南师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1