人的乳铁蛋基因全序列及其调控元件的制作方法

文档序号:571383阅读:490来源:国知局
专利名称:人的乳铁蛋基因全序列及其调控元件的制作方法
技术领域
本发明涉及DNA重组技术领域,具体地说涉及乳铁蛋白表达的调控,将通过不同表达水平的物种间的序列进行比较对乳蛋白基因的表达调控进行研究,为乳蛋白基因乃至真核生物基因的表达调控提供一个很好的实验素材,同时也为转基因动物的制作、基因治疗以及DNA疫苗的研制准备一个更为有效的表达调控元件。
乳铁蛋白(lactoferrin,Lf)是转铁蛋白基因家族非血红素类铁合糖蛋白的一员。主要存在于哺乳动物乳汁及嗜中性白细胞的二级颗粒中,具有广泛的生物学功能。乳铁蛋白在婴儿铁代谢,抗微生物,调节炎症反应,抗肿瘤,以及调节基因表达等方面发挥着重要的作用。
另外,乳铁蛋白具有着广泛的生物学活性,其主要表现在(1)促进婴儿的铁吸收(2)广谱抗微生物作用它对病原性的细菌,真菌,原生动物,病毒均有杀伤作用(3)通过多种途径调节炎症反应调节补体激活途径;限制活性氧自由基的产生,并进一步抑制了活性氧自由基对细胞的损害,阻止细胞膜脂类的过氧化;快速动员多形核单核细胞迁移至炎症部位;影响多种细胞因子的产生,如IL-1,IL-6和TNF-α,IL-1,GM-CSF,IL-8,这些细胞因子在炎症反应中发挥着极重要的作用;此外乳铁蛋白可以与脂多糖结合,起到调节炎症反应的作用。
(4)其它作用在患有帕金森氏综合症鼠的脑中,检测到乳铁蛋白的增强表达,说明乳铁蛋白在机体防御帕金森氏综合症中发挥一定的作用(Fillebeen et al.,1999)。此外在多自身免疫疾病病人身上检测了乳铁蛋白的抗体,如类风湿性关节炎、脉管炎、系统性狼疮、初级硬化脉管炎,说明乳铁蛋白在这些疾病的治疗和诊断中具有一定的作用。最近,有人还发现乳铁蛋白可以抑制肿瘤细胞的生长和转移(Lonnerdal et al.,1995)。最令人惊奇的是,1995年J.He等发现乳铁蛋白还可以与DNA结合,诱导报告基因的表达。这暗示乳铁蛋白可以作为调节因子调节基因的表达和细胞的生长分化。因此,乳铁蛋白可以作为营养保健品和药物的成分。
目前人、牛、鼠、猪的乳铁蛋白基因的cDNA序列均已得到克隆测序(Powell et al.,1990;Rey et al.,1990;Mead et al.,1990;Wang et al.,1997)。人乳铁蛋白cDNA序列与牛相比同源性为77%,与小鼠相比同源性为75%,与猪相比同源性为77%,与人转铁蛋白相比同源性为67%。人乳铁蛋白基因位于第三号染色体(3q21-q23),牛Lf基因位于第22号染色体,小鼠Lf基因位于第9号染色体(Schwerin etal.,1994)。人乳铁蛋白基因跨越基因组上约35kb的范围,牛乳铁蛋白在基因组上占约34.5kb的区域。
转铁蛋白基因家族有着共同的特征基因编码区分散于17个外显子,基因可被分为两个不等的部分,与已知蛋白质的结构域一致(即N-端叶片,C-端叶片)。牛乳铁蛋白基因组基因同样有17个外显子,其基因结构如表1(Seyfert et al.,1994)。包含所有外显子区域的序列都已知道。牛乳铁蛋白基因与转铁蛋白基因家族的其他成员相比,外显子的大小相似,但内含子的大小差别很大。外显子6、9、12的大小与转铁蛋白基因家族所有成员的情况相同,它与小鼠乳铁蛋白基因结构相比,有7个外显子大小相同。其mRNA的5′,3′非翻译区由两端的外显子编码。第一个外显子编码含19个氨基酸残基的前导肽的前14个氨基酸。外显子2~4和9~12编码每“叶”的第一个球状域,外显子4~7和12~15编码第二个球状域,外显子9的起始处编码铰链区的11个氨基酸残基。这些外显子的大小和编码区域的保守性进一步证明了乳铁蛋白是通过内部的序列复制产生的。 目前已知人的乳铁蛋白基因组基因3′端22kb序列,其中包括7-17外显子(Genebank,U95626)。5′端的部分序列也已知。在已知序列中,除第2、11、14、15、17外显子外,所有外显子的大小均与牛乳铁蛋白基因的外显子大小相同。但内含子大小差异很大。本实验室陈怡真同学也已得到了含有乳铁蛋白全基因5’端启动区序列15kb的亚克隆,并进行了部分测序工作(陈怡真,1998)。启动子序列相比较,牛乳铁蛋白与人序列的同源性要高于人和小鼠的同源性。
乳铁蛋白作为一种上皮细胞分泌的广泛存在的免疫蛋白和乳蛋白,其表达调控是一个很复杂的过程,对该基因的表达调控机制的了解也处于灰箱状态。
乳铁蛋白在小鼠子宫的表达受雌激素的诱导,在乳腺的表达则更大程度上受催乳素的影响。泌乳时,乳腺乳铁蛋白mRNA、乳铁蛋白量与循环中雌激素水平不相关;在妊娠中期,移植的小鼠乳腺乳铁蛋白的分泌受到催乳素的刺激(Teng et al.,1989)。在小鼠的胚胎发育过程中,在2-4细胞期时可检测到乳铁蛋白的表达,16细胞期后,乳铁蛋白mRNA由内细胞合成,然后被外细胞选择性地吸收。在囊胚期时乳铁蛋白不再表达。在怀孕期的后半程,即小鼠胚胎11.5天后,可以在中性粒细胞和呼吸、消化系统的上皮细胞中检测到乳铁蛋白。怀孕早期母体子宫内膜的乳铁蛋白表达与胚胎中乳铁蛋白的表达有很大的一致性,可能是由母体的雌激素和孕激素调节的(Ward et al.,1998)。
乳铁蛋白在乳腺中的表达调控应与乳蛋白的调控机制有关。但遗憾的是目前对乳铁蛋白表达调控的研究主要集中在乳铁蛋白在血细胞及子宫细胞中的表达,也有一些研究者报道了在其它组织中乳铁蛋白的表达调控情况。但在乳腺中各种因子是如何起作用的及蛋白-DNA的互作机制目前仍不清楚。
人、鼠、牛和猪的乳铁蛋白基因的启动子均已得到克隆和测序,并对其转录调节作用进行了深入的研究。下面对分别这几个物种乳铁蛋白基因的研究情况进行介绍。C.Teng等人对小鼠的乳铁蛋白基因进行了深入的研究。他们分离了小鼠的乳铁蛋白基因启动子,发现启动子区包括1个TATA框,2个CAAT框,3个GC框,1个AP2位点,7个PU框,1个B1系列(Liu et al.,1991)。进一步的深入研究发现了多个调控序列(Teng,1999)。包括一雌激素应答元件(estrogenresponse element,ERE)这一元件与另一种已知的转录调节元件—鸡乳清蛋白上游启动子(chicken ovalbumin upstream promoter,COUP)相重叠。最近还发现视黄酸也能诱导乳铁蛋白的表达(Geng etal.,1998)。其应答元件(retinoic acid response element,RERE)与ERE相重叠。除ERE外,在小鼠的乳铁蛋白基因启动子上还发现有一个上皮生长因子应答元件(epithelial growth factor response element,EGFRE)。它包括一个CAAT/GT框和一个cAMP应答元件(cAMPresponse element,CRE)。最近在小鼠中还发现髓样细胞的转录因子C/EBP∈(CCAAT enhancer binding protein)是乳铁蛋白基因转录的正向调节因子,与鼠的EGFRE相重叠(Verbeek et al.,1999)。此外,在-103/-81处还有一个富含GC序列,其中包含一个CAAT/GT框,是乳铁蛋白基因表达的抑制子。很多报道指出甲基化程度也影响基因的表达。
1992年,J.J.Johnston等克隆了人乳铁蛋白基因的启动子,发现TATA元件位于-30处,CCAAT元件位于-59处,一个CACCC元件位于-68,Sp1结合位点在-24处,一个与急性反应有关的六聚体,CTGGGA位于-280处,GATA-1结合位点位于-367,ERE位于-350,鼠-103/-81处的富含GC的抑制子序列位于-84。最近Nancy Berliner等人发现人乳铁蛋白-858/-810处有一个CCAAT替代蛋白(CCAATdisplacement protein,CDP)结合位点(Khanna-Gupta et al.,1997)。在非乳铁蛋白表达的细胞中CDP与其识别并结合,从而抑制了乳铁蛋白基因的转录;在乳铁蛋白表达的细胞中,则不与其结合。这一沉寂元件包括3个8bp的重复,其序列如下ATGTATTTACGAGATGTATTCTAGAAGCAGTATTCTAGCTTTTGAATTTTAAAA这一区域与小鼠乳铁蛋白基因启动子的同源性为82.5%,而从-950至转录起始位点的同源性为40%。
Seyfert等人于1994年对牛乳铁蛋白编码区基因和启动子进行了测序。分析发现,牛乳铁蛋白启动区有3个潜在的CAAT框(-967,-910,-713),3个Sp1结合位点(CCGCCC)分别位于-196,-63和+95。与鼠乳铁蛋白启动子的潜在的Sp1识别位点相似。在牛乳铁蛋白基因启动子内部没有找到GATA-1,Oct-1,COUP,AP-2,糖皮质激素应答元件和急相应答元件,也没有发现乳腺特异性转录因子MGF/STAT5(mammary-gland-specific transcription factor)的识别位点。与人启动区序列比较,同源性大于80%的10bp以上片段有10个。
1998年,Shih-Rong Wang等人克隆并分析了猪乳铁蛋白基因启动区。-156至转录起始位点对于基本的启动子活性已经足够了,但是要得到最大的转录活性则需要上游-780bp的序列。DNase I步迹和EMSA揭示了Sp1,AP2和MGF的结合位点。-130至-10序列与牛、鼠、人的同源性为65%。MGF或STAT5结合位点(TTCCTGGAA)位于-738/-730,一个1/2ERE(GGTCA)位于-43。此外,GATA-1,GATA-2及髓细胞锌指蛋白(MZF1)结合位点也被发现,揭示这些因子有可能调节猪乳铁蛋白基因的转录活性。
关于乳铁蛋白基因在翻译水平上调控的机制报道很少。Goodman等对人和牛的mRNA进行了分析。人乳铁蛋白mRNA结构与牛相比,在mRNA翻译起始区附近,形成2个小的茎环结构。牛mRNA在同一区域可形成强烈的二级结构一个包含了翻译起点和5′端的长茎结构。这个二级结构可阻遏翻译。相比之下,人乳铁蛋白mRNA可阻遏翻译的程度则弱。这可能就是两个物种乳铁蛋白表达差异的原因之一。另外,在翻译起始共有序列比较中发现,牛乳铁蛋白mRNA在翻译起始点AUG的上游-3处为C,与其它奶蛋白mRNA不同。由于在-3处有嘌呤存在,对有效俘获核糖体很重要。这可能也是牛乳铁蛋白表达量低的另一表现(Schanbacher et al.,1992)。
动物生物反应器是目前世界范围内转基因研究的热点之一,不仅各国政府投资,一些私人财团也不惜投入大量资金加以研究和开发。
用相似的转基因动物制作程序,从动物身上获取外源药用蛋白质最可能的途径有几条,主要有血浆、精液和乳汁。从转基因动物血浆中提取重组蛋白质,这是一种可行的办法,采血不需要杀死动物,这一方法的缺点一方面是采血量受到限制,另一方面一些具有生物活性的蛋白质分泌进血浆对动物健康有一定的影响。而精液中表达外源基因经常会给转基因动物的育性带来不良影响。相比之下,泌乳是动物的一种生理活动,对动物健康没有影响,加之乳腺摄取、合成、分泌蛋白质的能力很强,并且能对重组蛋白质进行多种翻译后加工,包括β-羟基化,糖基化,γ羟基化等,同时能将重组蛋白质折叠成有功能的构象。因此乳腺成为公认的生产重组蛋白质的理想器官。应用乳腺生产重组蛋白质,一般要求所使用的表达载体的启动子具有表达上的组织和器官以及发育时期的特异性。目前已有多种具有生物活性的人类蛋白质可以从转基因动物的乳汁中获得,这些动物包括小鼠,大鼠,兔、猪、绵羊、山羊等,获取的重组蛋白包括tPA,α1-AT,蛋白C,hSA,bGH,hAFP,LAtPA等,构建乳腺特异性表达载体使用较多的启动子有牛、绵羊、山羊的珠蛋白上游调空区,牛β-乳球蛋白基因启动子(bBLG),绵羊β-乳球蛋白基因启动子(oBLG),小鼠乳清酸性蛋白启动子(mWAP),大鼠乳清酸性蛋白启动子(rWAP)以及兔乳清酸性蛋白启动子(rWAP)。比较上述几种上游调空区,其特点为β-珠蛋白基因启动子驱动下游基因的表达与转基因插入位点无关、表达水平与整合的拷贝数正相关,但其调控的表达特异性地发生在红细胞内;bBLG、oBLG具有较强的驱动下游基因表达的能力,所驱动的表达似乎也不表现位置效应;小鼠、大鼠以及兔WAP基因具有很强的驱动下游基因表达的能力,每ml乳汁中的表达量可达数mg甚至十多mg,但其缺点是表达的特异性较差,除了乳汁外,血液中也有相当水平的表达,对动物可能会有某些不良的影响。转基因动物研究同时还存在着一个及其令人头痛的问题就是大部分转基因表达水平极低,而极少部分转基因表达水平过高。由于位置效应的影响,大部分转基因(尤其是cDNA)表达水平低得难以检测,而个别转基因的表达水平又太高。如Wright等(1991)制作的转hα1AT基因绵羊,其中一只转基因羊在产羔后泌乳时,乳汁中hα1AT的水平高达60g/L,泌乳中期乳汁的hα1AT水平仍维持在35g/L,外源基因的这种高水平表达是宿主动物难以承受的。
因此对乳蛋白基因的表达调控进行广泛深入的研究是非常必要的。对基因表达调控的研究方法很多,其中之一就是对具有不同表达效率的物种的基因表达的调控区成分进行对比分析,从中获取有用的信息。乳铁蛋白在不同物种的乳腺中表达水平差异很大,人乳腺中表达量最高(3-10mg/ml),牛乳腺中表达较少(100ug/ml)。大鼠的乳中基本检测不到乳铁蛋白的存在。一般来说,乳中高乳铁蛋白成分的物种转铁蛋白含量少,而乳中转铁蛋白含量高的物种则乳铁蛋白含量少。但也有例外,如狗的乳中两种蛋白含量都较低,而小鼠中两种蛋白的含量都很高(Lonnerdal et al.,1995)。因为大多数奶蛋白的乳腺特异性表达均需要基因的远上游序列,并且人乳铁蛋白基因的完整序列并不已知,因此对乳铁蛋白转录起始位点的远上游序列及基因组基因序列仍需作进一步的研究。并开展对不同物种的乳铁蛋白基因调控区序列的研究。
本发明的目的之一是克隆测定人乳铁蛋白基因全序列,为实现通过真核表达系统生产人乳铁蛋白等工作提供重要元件,也为与动物抗病性能相关的遗传标记的筛选提供了重要的参考信息。
本发明的另一个目的是通过不同表达水平的物种间的序列进行比较对乳蛋白基因的表达调控进行更为深入的研究,找出了该全序列上的各个调控元件,为乳蛋白基因乃至真核生物基因的表达调控提供一个很好的实验素材,同时也为转基因动物的制作、基因治疗以及DNA疫苗的研制准备一个更为有效的表达调控元件。
本发明通过如下所述实现我们得到了人乳铁蛋白基因的全长核苷酸序列。包括转录起始位点上游9.3kb和外显子1-17,内含子1-16的全部序列(附

图1)对启动区的分析发现了多个潜在的与乳蛋白产生有关的调控位点。两个潜在的糖皮质激素应答元件,分别位于-7790/-7777,-2068/-2055处;五个潜在的雌激素应答元件位于在-352/-340,-1437/-1425,-1411/-1400,-8216/-8202,-8190/-8176处;九个潜在的cAMP应答元件分别位于-9222/-9209,-9116/-9109,-9045/-9038,-7290/-7183,-3299/-3291,-782/-773,+231/+239,+3937/+3944,+4127/+4134;九个潜在的STAT结合位点分别位于-8942/-8934,-7016/-7007,-5404/-5412,-5349/-5341,-4465/-4457,-845/-833,+1211/+1219,+1958/+1966,+1988/+1996。其中除-352/-340处的雌激素应答元件外,其它元件为本实验首次发现。此外还发现多个AP1结合位点和Sp1结合位点。在转录起始位点上游-7650/-7585处还发现一个(TC)n(AC)n序列的的微卫星,也许可以作为人乳铁蛋白的一种分子标记。1997年D.Paul报道了一种乳铁蛋白mRNA的变形,ΔLf mRNA。这种mRNA在正常组织存在,而在肿瘤组织中检测不到。其编码的蛋白质缺少信号肽和成熟蛋白质N-端的25个氨基酸。此种蛋白的缺乏可能是肿瘤产生的原因之一。将此mRNA的序列与所得序列进行比较,发现此序列起始于内含子I中,其转录起始位点位于10599bp处,外显子I结束于10759处,大小为160bp。
进一步的分析表明,乳铁蛋白基因转录起始位点上游的9.3kb有两个区域调控元件比较集中。一个区域为-1至2.1kb,一个区域为-7.0kb至-9.3kb。第一个区域包括三个雌激素应答元件,一个糖皮质激素应答元件,一个cAMP应答元件和一个STAT结合位点。第二个区域包括两个雌激素应答元件,一个糖皮质激素应答元件,四个cAMP应答元件和两个STAT结合位点。这两个区域的调控元件如此集中,推测可能是乳铁蛋白在乳腺中表达的重要调控区域。令人感兴趣的是,-1437/-1425和-1411/-1400,-8216/-8202和-8190/-8176处的雌激素应答元件距离很近,可认为是两簇雌激素应答元件,而每簇500-600bp附近均有一个糖皮质激素应答元件。由于乳蛋白的产生需要这两种激素分泌的同时增加,因此我们推测糖皮质激素受体和雌激素受体以及雌激素受体之间可能存在相互作用,以共同启动奶蛋白的表达。在+954/+967处还发现一个热休克应答元件(heatshock response element,HRE)。
对乳铁蛋白全基因的分析表明人乳铁蛋白基因外显子1-17的大小分别为82,167,109,183,148,56,179,175,155,91,54,156,142,68,185,190,230bp。内含子1-16的序列也全部获得,内含子剪切都符合GT-AG规则。可以据此数据构建人乳铁蛋白基因的任意酶切图谱。
本发明进一步开展的乳蛋白基因表达调控的研究提供了很好的实验素材,其基因的5’调控区为转基因动物的制作、基因治疗以及DNA疫苗的研制提供了一个很好的表达调控元件。
乳铁蛋白在人体中具有重要作用,可以作为营养保健品和药物的成分。本发明所克隆测定的人乳铁蛋白基因全序列使乳铁蛋白基因的利用变为可能,可以据此绘制人乳铁蛋白基因的任意酶切图谱,为实现通过真核表达系统生产人乳铁蛋白等工作提供了重要元件。
再有该基因序列也为与动物抗病性能相关的遗传标记的筛选提供了重要的参考信息。
附图1是人乳铁蛋白基因序列及分析(tsp代表转录起始位点;潜在的调控元件及蛋白结合位点由下划线标出;黑体字为外显子序列;CRE,ERE,GRE,STAT分别表示cAMP,雌激素,糖皮质激素应答元件和STAT结合位点)。
附图2是人乳铁蛋白基因5’调控区的序列分析结果(CRE,ERE,GRE,STAT分别表示cAMP,雌激素,糖皮质激素应答元件和STAT结合位点,粗体线表示应答元件集中的两个区域)。
实施例乳铁蛋白基因组基因序列的测定一、实验材料1.1.菌株与载体
pGEM 7zf(+/-)vector Ampr购自Promega公司1.2.酶与试剂各种限制性内切酶和连接酶分别购自华美生物工程公司、Biolab公司、Boeringeman公司和Promega公司。Geneclean II回收试剂盒购自Bio101公司。Dye-Primer、BigDye-Terminator测序试剂盒购自Perkin-Elmer公司。引物由上海生工公司合成,所有引物均经PAGE纯化。其它常规试剂来自本校物资供应科。
1.3.DNA分析软件同源性分析软件GENETYX-MAC8.5,DNAMANPCR引物设计软件OLIGO4.0二、实验方法2.1.缓冲液与常用试剂的配制TE缓冲液10mM Tris·Cl,1mM EDTA,pH8.0,高压灭菌。
STE缓冲液0.1M NaCl,10mM Tris·Cl,1mMEDTA pH8.0,高压灭菌。
50X TAE缓冲液Tris碱242g,冰乙酸57.1ml,0.5MEDTA(pH8.0)100ml,加水至1L。
5XTBE缓冲液Tris碱54g,硼酸27.5g,0.5M EDTA(pH8.0)20ml,加水至1L。
1M Tris·Cl121.14g Tris碱溶于800ml双蒸水中,用盐酸调pH值至8.0,定容至1000ml,高压灭菌。
5M EDTAEDTA 186.1g溶于800ml双蒸水中,用NaOH调pH值至8.0,定容至1000ml,高压灭菌。
氨苄青霉素60mg/ml(溶于水),过滤灭菌,-20℃贮存。
氯霉素50mg/ml(溶于乙醇),-20℃保存。
质粒DNA提取溶液I50mM葡萄糖,2.5mM Tris·Cl(pH8.0),10mMEDTA(pH8.0)。
质粒DNA提取溶液II0.2M NaOH,1%SDS,现配现用。
质粒DNA提取溶液III5M乙酸钾溶液60ml,冰乙酸11.5ml,灭菌水28.5ml。
3M NaAcNaAc·3H2O 408.1g溶于800ml双蒸水中,用冰乙酸调pH至5.2,定容至1000ml,高压灭菌。
RNAseA溶液100mg/ml溶于10mM Tris·Cl(pH7.5),15mM NaCl中100℃煮沸10分钟,室温冷却后,贮存于-20℃。
X-gal贮存液20mg/ml溶于二甲基甲酰胺中,遮光贮存于-20℃。
IPTG溶液将2g IPTG溶于8ml水中,用水调节体积到10ml,过滤除菌。分装成1ml小份,贮存于-20℃2.2.BAC质粒的提取和纯化挑单克隆接种于1升含氯霉素(12.5μg/ml)的LB液体培养基中,37℃过夜培养。4000rpm离心15分钟以收获菌体。用50毫升TES充分的将细菌重新悬浮。加入50毫升新鲜配制的溶液II,轻柔但彻底地颠倒混匀。冰上放置5分钟,混合物应变清澈。加入50毫升溶液III,轻柔但彻底地颠倒混匀。冰上放置5分钟。10000rpm离心20分钟。上清用滤纸过滤至干净的管子中。加入等体积的异丙醇,颠倒混匀,10000rpm离心20分钟。小心去掉上清,加入8毫升70%乙醇,再离心。小心去掉上清,37℃烘干30分钟。沉淀用1.2毫升TE溶解,加入50μlRNase A(10mg/ml),37℃消化1小时。酚,酚∶氯仿(1∶1),氯仿各抽提一次。上清加含13%(w/v)PEG8000的1.6mol/L NaCl,充分混合,12000g离心5分钟,以回收DNA。吸出上清,加500μl TE,过夜溶解DNA沉淀。用酚,酚∶氯仿(1∶1),氯仿各抽提一次。上清加0.1倍体积的3mol/L乙酸钠,充分混匀,加2倍体积乙醇,于室温放置10分钟,于4℃以12000g离心5分钟,以回收沉淀的DNA。吸去上清,加200μl处于4摄氏度的70%乙醇。稍加振荡,于4℃以12000g离心5分钟。吸去上清,于37℃烘干30分钟,用400μl灭菌水过夜溶解沉淀。
2.3.脉冲凝胶电泳A.电泳条件琼脂糖凝胶浓度1%; 缓冲液0.5X TBE;起始切换时间1.0秒; 终止切换时间12秒;电压6V/cm; 切换角度120°;循环水温度14℃; 电泳时间14小时。
B.染色将凝胶浸在含溴化乙锭(0.5μg/ml)的电泳缓冲液或水中,于室温染色20-30分钟,在蒸馏水中脱色1-3小时,凝胶成像。
2.4.质粒提取与纯化(碱裂解法)本章节的内容参见《分子克隆》手册。
测序模板的制备见博大公司质粒提取试剂盒说明书进行,调节DNA浓度至200ng/ul。
2.5.DNA浓度与纯度的鉴定取一定量的DNA溶液稀释至100μl,在260nm和280nm波长下测定DNA溶液的OD值,OD260为1相当于50ng/ml双链DNA,可根据OD260/OD280的值估计核酸的纯度,DNA纯品的OD260/OD280值为1.8,如果样品中污染有蛋白质或酚,其OD260/OD280将明显低于此值,此时无法对样品中的DNA进行精确定量。
如果样品DNA含量很低或者含有显著量杂质,则可根据电泳时样品中溴化乙锭发射的荧光强度来估计DNA的含量。
2.6.DNA片段的回收玻璃奶回收按Bio101公司GeneCleanII试剂盒说明书进行。
2.7.感受态细胞的制备1.CaCl2法制备大肠杆菌感受态细胞见《分子克隆》手册2.电击法转化的感受态细胞的制备挑一个DH10B的单菌落接种于50ml液体LB中,过夜培养,1%接种于1升液体LB中,37℃摇菌2~3小时(OD550在0.6-0.7之间)将细菌细胞置于冰上,4000rpm,4℃离心15分钟,收集菌体,以下均需在冰上操作,用等体积的灭菌的由去离子水配制的10%的甘油彻底洗细菌沉淀,离心收集,重复上一步骤一次,加入20-30ml 10%的灭菌甘油洗细菌沉淀,离心收集,将细菌重悬于1-2ml 10%的甘油中,取5μl稀释至1ml,OD550应在0.7左右,用冰预冷的管分装,每管30μl,-70℃冻存,备用。
2.8.转化1.CaCl2法转化见《分子克隆》手册2.电击法转化电击转化条件18KV/cm,25μF,200Ω2.9.筛选重组子挑选白斑划线过夜培养,接菌于5ml氨苄青霉素抗性的LB液体培养基中。小规模提取质粒DNA,酶切分析。
2.10.DNA序列的测定(按PE公司的说明书)A.依据已有的人乳铁蛋白基因的序列信息设计并合成如下4对PCR引物引物I 引物II5’-CTG GGA CTA GAG GTG CTT GAC-3’5’-GGC AGA TGG TAG GAG GTA GGA-3’5’-GCA GTG TAG AGT AAG CGT CAG T-3’ 5’-CCT CGT GAC CTG GGA CTC GTG T-3’5’-GCC TGG GCA ACA AAG CGA GAC-3’5’-GCT ATG GCT CCT TCT CTA CTG-3’5’-GAG AAA GAA CAT CGC AGC AG-3’ 5’-AGC AGG ACG AGG AAG ACA AG-3’应用PCR筛选人基因组BAC文库,获得3个含有人的乳铁蛋白基因的BAC克隆,选择其中一个进行序列测定。
B.根据乳铁蛋白基因结构在物种之间的保守性和人乳铁蛋白已知的cDNA序列设计了如下引物
用PCR方法扩增人乳铁蛋白基因的内含子2-16序列并测序。
C.用酶切的方法对该BAC克隆进行亚克隆及亚克隆的序列测定首先根据已知的人乳铁蛋白cDNA序列设计如下引物5’-GAG AAA GAA CAT CGC AGC AG-3’;5’-AGC AGG ACG AGG AAG ACA AG-3’预计扩增片段为295bp。
用限制性内切酶HindIII酶切该BAC克隆,将其分割成若干大小不同的小片段。将所有片段随机克隆在3Zf载体上,蓝白筛选。挑出所得白斑,用PCR方法鉴定阳性克隆。阳性克隆酶切结果证实外源插入大小为15kb。对阳性克隆两端测序,证实所得克隆包含人乳铁蛋白基因5’端远上游序列。将此克隆命名为pH55。
用限制性内切酶EcoRI酶切pH55的外源片段,将所有片段克隆到载体上。对比较小的片段可以直接测序,而对比较大的片段可以进一步用限制性内切酶XbaI酶切消化,制备亚克隆后再测序。对于一次不能测通的序列,首先进行两端测序,再根据已知序列设计引物,用PE公司的BigDye-Terminator测序试剂盒将其完全测序。最后根据这些序列设计引物对pH55直接测序,以确定各个片段的方向并补齐可能存在的中断。
D.利用DNAman软件将所测的序列连接起来,得到完整的人乳铁蛋白基因序列。应用Http//www.rwcp.or.jp/lab/pdappl/papia.html网站的TFSEARCHDNA Transcription Factor Binding SitePrediction软件对人乳铁蛋白基因的5′调控区进行转录调控因子结合位点的预测,并可利用DNAman软件绘制人乳铁蛋白基因组基因的任意酶切图谱,见附图1和2。其中tsp为转录起始位点,GRE为两个潜在的糖皮质激素应答元件,分别位于-7790/-7777,-2068/-2055处;五个潜在的雌激素应答元件(ERE)位于在-352/-340,-1437/-1425,-1411/-1400,-8216/-8202,-8190/-8176处;九个潜在的cAMP应答元件(CRE)分别位于-9222/-9209,-9116/-9109,-9045/-9038,-7290/-7183,-3299/-3291,-782/-773,+231/+239,+3937/+3944,+4127/+4134;九个潜在的STAT结合位点分别位于-8942/-8934,-7016/-7007,-5404/-5412,-5349/-5341,-4465/-4457,-845/-833,+1211/+1219,+1958/+1966,+1988/+1996。其中除-352/-340处的雌激素应答元件外,其它元件为本实验首次发现。
乳铁蛋白基因转录起始位点上游的9.3kb有两个区域调控元件比较集中。一个区域为-1至2.1kb,一个区域为-7.0kb至-9.3kb。第一个区域包括三个雌激素应答元件,一个糖皮质激素应答元件,一个cAMP应答元件和一个STAT结合位点。第二个区域包括两个雌激素应答元件,一个糖皮质激素应答元件,四个cAMP应答元件和两个STAT结合位点。这两个区域的调控元件如此集中,推测可能是乳铁蛋白在乳腺中表达的重要调控区域。
令人感兴趣的是,-1437/-1425和-1411/-1400,-8216/-8202和-8190/-8176处的雌激素应答元件距离很近,可认为是两簇雌激素应答元件,而每簇500-600bp附近均有一个糖皮质激素应答元件。由于乳蛋白的产生需要这两种激素分泌的同时增加,因此我们推测糖皮质激素受体和雌激素受体以及雌激素受体之间可能存在相互作用,以共同启动奶蛋白的表达。在+954/+967处还发现一个热休克应答元件(heat shock response element,HRE)。
权利要求
1.人乳铁蛋白基因序列,它含有附图1所述的DNA序列,包含人乳铁蛋白基因的启动区、内含子与外显子序列及根据此序列得到的任何序列。
2.根据权利要求1所述序列为基础生产的作为营养和药用蛋白的乳铁蛋白。
3.根据权利要求1所述序列为基础研制的真核表达调控元件。
4.根据权利要求1所述序列为基础筛选的与动物抗病性能相关的遗传标记。
5.人乳铁蛋白基因的转录调控因子,分别是tsp为转录起始位点、糖皮质激素应答元件、雌激素应答元件、cAMP应答元件和STAT的结合位点。
6.根据权利要求5所述的人乳铁蛋白基因的转录调控因子,其中糖皮质激素应答元件的结合位点具有附图1所述序列的-7790/-7777或-2068/-2055处的序列。
7.根据权利要求5所述的人乳铁蛋白基因的转录调控因子,其中雌激素应答元件的结合位点具有附图1所述序列的-352/-340、-1437/-1425、-1411/-1400、-8216/-8202或-8190/-8176处的序列。
8.根据权利要求5所述的人乳铁蛋白基因的转录调控因子,其中糖皮质激素应答元件的结合位点具有附图1所述的cAMP应答元件的结合位点具有附图1所述序列的-9222/-9209、-9116/-9109、-9045/-9038、-7290/-7183、-3299/-3291、-782/-773、+231/+239、+3937/+3944和+4127/+4134位点之间的序列。
9.根据权利要求5所述的人乳铁蛋白基因的转录调控因子,其中STAT结合位点分别位于-8942/-8934、-7016/-7007、-5404/-5412、-5349/-5341、-4465/-4457或-845/-833的序列。
全文摘要
本发明提供了人乳铁蛋白基因全序列,找出了该基因调控区上的部分调控元件,和所有内含子、外显示序列。本发明为实现通过真核表达系统生产人乳铁蛋白等工作提供重要元件;为与动物抗病性能相关的遗传标记的筛选提供了重要的参考信息;为乳蛋白基因乃至真核生物基因的表达调控提供一个很好的实验素材;同时也为转基因动物的制作、基因治疗以及DNA疫苗的研制准备一个更为有效的表达调控元件。
文档编号C12N15/11GK1373215SQ0110907
公开日2002年10月9日 申请日期2001年2月28日 优先权日2001年2月28日
发明者李宁, 刘兆良, 吴常信 申请人:李宁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1