牦牛的七种乳蛋白基因序列的制作方法

文档序号:432026阅读:337来源:国知局
专利名称:牦牛的七种乳蛋白基因序列的制作方法
技术领域
本发明涉及生物工程领域,尤其是涉及牦牛的七种乳蛋白基因的全序列或部分序列。
动物生物反应器是目前世界范围内转基因研究的热点之一,不仅各国政府投资,一些私人财团也不惜投入大量资金加以研究和开发。
用相似的转基因动物制作程序,从动物身上获取外源药用蛋白质最可能的途径有几条,主要为血浆、精液和乳汁等。从转基因动物血浆中提取重组蛋白质,这是一种可行的办法,采血不需要杀死动物,这一方法的缺点一方面是采血量受到限制,另一方面一些具有生物活性的蛋白质分泌进血浆对动物健康有一定的影响。而精液中表达外源基因经常会给转基因动物的育性带来不良影响。相比之下,泌乳是动物的一种生理活动,对动物健康没有影响,加之乳腺摄取、合成、分泌蛋白质的能力很强,并且能对重组蛋白质进行多种翻译后加工,包括β-羟基化,糖基化,γ羟基化等,同时能将重组蛋白质折叠成有功能的构象。因此乳腺成为公认的生产重组蛋白质的理想器官。应用乳腺生产重组蛋白质,一般要求所使用的表达载体的启动子具有表达上的组织和器官以及发育时期的特异性。目前已有多种具有生物活性的人类蛋白质可以从转基因动物的乳汁中获得,这些动物包括小鼠,大鼠,兔、猪、绵羊、山羊等,获取的重组蛋白包括tPA,α1-AT,蛋白C,hSA,bGH,hAFP,LAtPA等,构建乳腺特异性表达载体使用较多的启动子有牛、绵羊、山羊的珠蛋白上游调空区,牛β-乳球蛋白基因启动子(bBLG),绵羊β-乳球蛋白基因启动子(oBLG),小鼠乳清酸性蛋白启动子(mWAP),大鼠乳清酸性蛋白启动子(rWAP)以及兔乳清酸性蛋白启动子(rWAP)。比较上述几种上游调空区,其特点为β-珠蛋白基因启动子驱动下游基因的表达与转基因插入位点无关、表达水平与整合的拷贝数正相关,但其调控的表达特异性地发生在红细胞内;bBLG、oBLG具有较强的驱动下游基因表达的能力,所驱动的表达似乎也不表现位置效应;小鼠、大鼠以及兔WAP基因具有很强的驱动下游基因表达的能力,每毫升乳汁中的表达量可达数毫克甚至十多毫克,但其缺点是表达的特异性较差,除了乳汁外,血液中也有相当水平的表达,对动物可能会有某些不良的影响。转基因动物研究同时还存在着一个及其令人头痛的问题就是大部分转基因表达水平极低,而极少部分转基因表达水平过高。由于位置效应的影响,大部分转基因(尤其是cDNA)表达水平低得难以检测,而个别转基因的表达水平又太高。如Wright等(1991)制作的转hα1AT基因绵羊,其中一只转基因羊在产羔后泌乳时,乳汁中hα1AT的水平高达60g/L,泌乳中期乳汁的hα1AT水平仍维持在35g/L,外源基因的这种高水平表达是宿主动物难以承受的。
因此对乳蛋白基因的表达调控进行广泛深入的研究是非常必要的。对基因表达调控的研究方法很多,其中之一就是对具有不同表达效率的物种的基因表达的调控区成分进行对比分析,从中获取有用的信息。已有文献报道牦牛奶蛋白含量约5.5克/100克干物质,其中酪蛋白与奶蛋白总量的61%α-乳清白蛋白约占6.08%,β-乳球蛋白占16.76%,其它蛋白约占16.16%(KattsinA,E.V.1993)而牛的奶蛋白含量约为3.7克/100克干物质,其中酪蛋白占总蛋白含量的80%,β-乳球蛋白约占总蛋白含量的4~5%,α-乳清白蛋白约占总蛋白含量的12%,其它蛋白约占3.5%。因此从奶蛋白的总含量奶蛋白的各成分所占的比例都是有很大差异别的。而牦牛的乳蛋白基因的调控区还没有人克隆分析过。克隆测定牦牛七种奶蛋白基因序列(全基因或部分序列),分析其调控区所包含的调控成分,并与牛的相应结构进行比较,可能能获得一些有用的信息。
另外,牦牛(Bos grunniens)是牛亚科牛属牛亚属中的一个物种,主要分布在中亚高原地区,一般认为它是由野牦牛驯化而来,是高寒地区的一种主要驮运工具,其品质优良的肉和奶是高原地区人民的主要食品来源,皮毛又是抵御风寒的极品。我国牦牛的数量占世界牦牛总数的90%以上,主要分布在青藏高原,是我国重要的物种资源,然而目前牦牛数量正以惊人的速度下降且有最终绝迹的危险,因此,为了加强牦牛资源的保护和开发利用,对牦牛进行广泛深入的研究已势在必行。
作为反刍动物,产乳性状是一个重要的经济性状,牦牛的乳汁具有一些普通牛所不及的特点,如其乳汁具有较高的抗菌活性,而且蛋白含量要比普通牛乳高,但牦牛的产奶量却很低,因此提高其奶产量同时又保持其优良的奶品质是牦牛育种的一个重要课题。要实现上述目标开发与牦牛产奶性能有关的遗传标记是一个重要的先决条件,而开发与牦牛产奶性能有关的遗传标记其首选的候选基因便是奶蛋白基因,然而由于牦牛所处的特殊地理位置和其他的一些原因对牦牛的研究还很有限,分子水平的研究更是如此,目前尚无关于牦牛奶蛋白基因研究的相关报道,因此我们克隆测定的牦牛的七种奶蛋白基因序列为与牦牛产奶性能有关的遗传标记的开发奠定了基础。
本发明的目的之一系统地开展了牦牛七种奶蛋白基因的克隆测序工作,获得了牦牛的七种乳蛋白基因全序列或部分序列。本发明又一目的是为转基因动物的研究与制作DNA疫苗的开发,基因治疗以及与牦牛产奶性能相关的遗传标记的开发与应用等方面的工作提供了一套全新的调控元件和DNA序列信息。
本发明是按照如下所述实现的本发明根据已发表的普通牛的七种奶蛋白基因相应序列设计并合成了15对引物其引物序列如下引物 扩增范围(注根据牛的已知序列设计并确定)α-乳白蛋白引物1号F15′TATTTAGTGGTATTGGTGGTTGG 3′ 从68nt到1292nt包括该基因的5′侧翼区698ntF25′TATTCTGTGCTGTCATTGTTTTG 3′ 及第一外显子,第一内含子和部分第二外显子。2号F35′TCGTCTTTCTTTCAGGGGTC 3 从1205nt到1655nt包括该基因第二外显子,部F45′AACTTCATCAACCAACTTAG 3′ 分第二内含子。3号F55′GACCAGAACCCTCACTCAAGC 3′ 从1332nt到2519nt包括该基因部分第二外显F65′CAGAAGCAGCAAAGACAGCAG 3′ 子,第二内含子,第二外显子,第三内含子,第四外显子。4号F75′CCATAAAGCACTCTGTTCTG 3′ 从2437nt到3070nt包括该基因的部分第四外F85′CCTTGTGGGCTACCGTCTAT 3′ 显子和包括加尾信号在内的3’侧翼区。β-乳球蛋白引物5号F95′TGTCCAGCCTCCCTCCCATAG 3′从14nt到1200nt位于基因5′侧翼区上游
F105′GGGTAGGGGAACAGGAGCAAG 3′6号 F115′CCCCGCTATCAGGAGACACC3′ 从1155nt到2182nt位于基因5′侧翼区C号引F125′AGGGAGTGGAGGGCTGAGAC3′ 物下游5′端与C片段重叠45碱基,3′端包括该基因第一外显子的前11个碱基7号 F135′CGGCTCTCCCTCCCCCACAG3′ 从6259nt到7355nt包括了部分第5内含子,F145′CCCCTTCCAACCGTGACCTC3′ 第6-7外显子及该基因3′侧翼区部分序列β-酪蛋白引物8号 F155′GCTTTCATTTTCTTTCTTCC3′ 从-991nt到-9nt为该基因的5′侧翼区F165′ATCTGATTTTGTGGTTGTTT3′ 序列9号 F175′AGAGGATTTCAATGTGAATGC 3′ 从7412nt到8578nt,包括了该基因第8外显子F185′ATGCCTAAGGGTTAATTTATT 3′,第8内含子及第9外显子全部序列。Kappa-酪蛋白引物10号 F195′ATTACTTCATACTCAGGTTCTT 3′ 从-397nt到41nt包括该基因的部分第F205′GCTTGGCAGTAGGTTCAGTTGG 3′ 一内含子和5′侧翼区序列。11号 F215′CGCTGTGAGAAAGATGAAAGATTC3′ 从1530nt到11310nt包括该基因的第4外显子F225′AGATTCAAGGAGTATACCAATTGTTG 3′ 和部分第4内含子序列α-S1酪蛋白引物12号 F235′ATGGAAAATCAGAGTTATGGTT 3′ 从-806nt到103nt包括了该基因的第一外显F245′ATGATGAGACAGAGGAAAAT3′ 子,部分第一内含子及5′侧翼区部分序列。13号 F255′GATTTTGTCTTTCTTCTTTTC 3′ 从19596nt到20577nt包括了该基因第19外F265′TTGTGTTTTCCTGATTCTTTG 3′ 显子43序列及3′侧翼部分序列。α-S2酪蛋白引物14号 F275′TAAGCAATAGAAGATAAACTGG 3′ 从-902nt到82nt包括了该基因部分第一内F285′AGGTACATAGAATAACAAAAAG 3′ 含子,全部第一外显子及5′侧翼部分序列。乳铁蛋白引物15号 F295′CACAAAACAACACAAGGGGTAG 3′ 从-707nt到66nt包括该基因部分第F305′CAGCAGGGCGGGGACGAAGAG 3′ 一外显子和部分5′侧翼序列。应用PCR的方法以牦牛的基因组DNA为模板进行PCR扩增,以获得各基因的5′侧翼序列。其PCR反应条件如下表1 PCR反应的循环参数94℃5分钟 1个循环94℃1分钟X℃(具体温度见附表2)1分钟30个循环72℃ 2分钟4℃ 20分钟 1个循环表2不同引物PCR反应的退火温度引物序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15退火温度(℃)61 60 68 61 72 68 68 61 61 61 58 61 61 61 68PCR反应体系1~14号引物PCR反应体系为2.5μl 10×Taq DNA聚合酶缓冲液(500mmol/L KCl,100mmol/L Tris·Cl,20mmol/L MgCl2,0.01%明胶),2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng,终反应体积为25μl。第15对引物的PCR反应体系为2.5μl 10×无镁离子Taq DNA聚合酶缓冲液(500mmol/L KCl,100mmol/L Tris·Cl,0.01%明胶),1.5μl MgCl2(25mol/μl)2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng,终反应体积为25μl。
将PCR产物克隆到Invitrogen公司生产的pCRTMII T-载体上,用ABI377 DNA测序仪进行序列分析,重复3次以确保所测序列的准确性。
用GENTYP-MAX8.5等序列分析软件进行序列分析用Http//www.rwcp.or.ip/lab/pdappl/papia.html网站的TFSEARCHDNA Transcription Factor Binding Site Prediction软件进行转录调控因子结合位点的预测。发明的效果本发明克隆测定了牦牛7种奶蛋白基因(α-乳清蛋白基因全序列、beta-乳球蛋白基因5′及3′端序列、αS1-酪蛋白基因5′及3′端序列、αS2-酪蛋白基因5′及序列、β-酪蛋白基因5′端序列及其第8到第9外显子的一段序列、kappa-酪蛋白基因5′侧翼序列及其第四外显子和第四内含子序列和乳铁蛋白基因5′端序列等)的序列,并对这些基因的调控区序列的转录调控因子的结合位点进行了预测,证明我们所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白基因的5′侧翼序列包含了乳腺高效特异性表达所需要的大部分转录调控因子结合位点序列可直接用于转基因动物的研究和制作,我们所克隆的kappa-酪蛋白和乳铁蛋白基因的5′侧翼序列包含了该基因完整的启动子区序列可和其他基因的组织特异性相关序列融合形成嵌合5′调控序列用于转基因动物的制作、基因治疗以及DNA疫苗的研究与开发,而我们所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、kappa-酪蛋白和β-酪蛋白等基因的3′端序列能够为哺乳动物表达载体的构建提供很好的PolyA加尾信号结构。
另外我们所克隆的上述牦牛奶蛋白基因的所有序列,为开发与牦牛产奶性能相关的分子标记提供了必备的参考信息。
附图的简要说明


图1.为牦牛α-乳清白蛋白基因5′侧翼序列,经扫描发现它有两个潜在功能的TATA盒分别位于-25~-33和-239~-247的位置,契合序列分别为CAAATAAAA和TAAATAAA。其乳腺组织特异性转录因子(MGF)的结合位点可能位于-454~-467的位置,核苷酸序列为CACTTCTTTTGTTT,这段序列几乎在所有的奶蛋白基因中都是保守的(Maritien a.M.1993),另一种乳腺特异性转录因子叫做奶蛋白结合因子(MPBF),首先从乳球蛋白基因启动区中发现,这种因子的结合位点,可能位于-267~-279的位置。另外在-263~-635的位置有一个比较典型的PMF(怀孕特异性核因子)的结合位点(Maritien a.M.1993),在-583~-588的位置上有一个糖皮质激素受体的结合位点(岳军明,1995),在-55~-67的位置上的这段序列,与溶菌酶基因序列中TGGCA结合蛋白的识别位点的序列有85%的同源性,可能与α-乳清白蛋白的转录调控有关。该位点在溶菌酶中起着转录调控的作用(Jean Lac Vilotte,1987)。
上述分析结果表明我们所克隆的牦牛的α-乳清白蛋白的这段调控区序列,基本具备了在乳腺中特异性高效表达的各种调控区成分,可它做为外源基因的调控区进行转基因动物的实验研究。与牛的相应的调控因子识别位点进行比较,只有AGF识别位点稍有些变化,即比较结果列于此牦牛 CACTTCTTTTGTTT(-454~-467)***** ********牛CACTTGTTTTGTTT(-454~-467)模式序列-RNTTCYTRGAAYY与1993年Martien A.M.等所总结出的MPBF/MGF的模式识别序列相比牦牛的序列似乎比牛的更好一些,当然究竟这种差异有没有意义,还需进一步的实验证实。
图2.为牦牛β-乳球蛋白5′侧翼序列,经扫描发现,它有两潜在的TATA框,分别位于-25~-29和-690~696,它们的序列分别为TATAA和TTTAAAA在-75区附近没能找到较为典型的CAAT结构,而在-915~-922的位置有一个比较典型的CAAT结构其序列为GTCAATTG。同时我们还找到了5个比较典型的MPBF识别位点,它们分别位于-193~205,-653~664,-1300~-1312,-1967~-1979和-2045~-2056,其序列分别为CCTACCAGGAACC,GGGTCCTGTAGG,TGTTGCAAGAATT,GCAGCTTGGACGT,GTTCCTGGAAGT。有两个MGF识别位点分别位于-205~-216和-923~-935。它们的序列为CACTTCTGGGGC和AGTTGCTTAGAAT。在-1956~-1964的位置上有一个因子识别位点因子是一种反式调控子,它的抑制基因表达的作用通过激素的作用被解除(岳军明等1998),在-582~-597的位置上有一个TRE(甲状腺素受体)识别位点,其序列为CGCAGGGTCAGGTCA。在-1870~-1875处有一个糖皮质激素受体结合位点。与牛的相应序列进行比较(下面仅列出了有差异的序列比较结果)牦牛 MPBF1 GCAGCTTGGACT-1967~-1979牛 MPBF1 GCAGCTCGGACGT -1967~-1979牦牛 MPBF2 CCTACCAGGAACC -193~-205牛 MPBF2 CGTACCAGGAACC -193~205牦牛 MGF AGTTGCTTAGAAT -923~-935牛 MGF ACTTGCTTAGAAT -923~-935模式序列 RNTTCYTRGAAYY (李宁,1997)注R表示嘌呤Y表示嘧啶比较结果表明它们与模式序列的符合度相同,因此它们可能在功能没有差异。
图3.为牦牛αS1-酪蛋白5′侧翼序列,经扫描可以看出,它具有两个具有潜在功能的TATA盒分别位于-23~29和-83~-89。其序列都为TTTAAAT。其乳腺组织特异性转录因子(MGF)的结合位点位于-87~-100的位置,核苷酸序列为AATTCTTAGAATT另一种乳腺特异性转录因子一奶蛋白结合因子(MPBF),基可能的结合位点有两个分别位于-11~-24和-333~-346的位置,其序列分别为ATAGCTTGGAAGCA和TTGTCCCAAGAATT。但其-139~-158的位置上的序列TCTCCTTAGAATTTCTTGGG,叫做“奶盒”(milk box),是一种类似于CTF/NF-1活性的一般性核转录因子的结合位点。而另一种一般性核转录因子oct-1在牦牛αS1酪蛋白基因序列上的核心结合位点可能位于-47~-54的位置,序列则是AATTAGCA。因此牦牛αS1酪蛋白基因的乳腺特异性转录因子结合位点及其他一些重要调控元件均位于-400~-10之间,在-109~-125处一段钙敏感蛋白共有序列。其序列为AGAACATTGATTTCCTA与牛的相应的调控元件相比较,没有发现任何差异。
图4.为牦牛αS2-酪蛋白基因5′侧翼序列,经扫描发现,在-24~-30位置上为一个TATA盒。其序列为TATAAT。在-46~-66位置上钙敏感酪蛋白的共有序列,它可分类为两部分,前一部分序列CAAACCAC是与SV40增强电子出版系统很相似的一段序列,后部分为AATTACCATAT是一个Occ1因子识别因子。另一个一般性核转录因子Oct1还有三个识别位点,分别位于-208~-218,-257~267和-469~-478的位置。在-87~-100的位置有一个乳腺特异性转录因子(MGF)的识别位点,在-330~-344的位置有一个另一种乳腺特异情转录因子的识别序列,其序列为TCGTGACTAGAAGAG。在-232~-246的位置上有一段序列与鸡的卵黄生成素基因II以上雌激素受体结合位点的序列同源性很高。其序列为GAGCTACACAAACAT。可能与雌激素对奶蛋白的表达调控有关。在-176~-181位置上的TGTTCT是糖皮质激素受体的一部分,可能与糖皮质激素对奶蛋白表达调控有关。在-109~-123的位置上,有一个三种钙敏感蛋白的共有序列,其序列为AGAAAA GCAATTCTAA,与牛相应的转录因子识别位点进行比较,两个乳腺特异性转录识别位点有一些差异兹列如下Yak MPBF TCGTGAC-TAGAACattle MPBF TCGTGACGTAGAAYak MPBF2 CCTACCAGGAACCYak MGFGACTTCTTAGGATCattle MGFGACTTCTTAGGAT图5.为牦牛β-酪蛋白基因5′侧翼序列,经扫描发现,在-26~-35为一个具潜在功能的TATA盒,β-酪蛋白5′侧翼区缺乏典型的CCAAT盒。在-45~-65区是αS1、αS2,β-酪蛋白的一段共有序列,其序列为CAAACCACAAAATTAGCATGC,它可被分为两个部分,其5′端部分CAAACCAC与SV40的增强子结构很相似,而3′端部分ATTAGCAT是一个0ct-1的结合位点。在-90~-103的位置有一个MGF的结合位点其序列为GATTTCTAGGAATT。在-111~-127的位置上,还有另外一个αS1、αS2和β-酪蛋白的共有的一段序列,具体功能还不清楚,其序列为AAGAATTCATTTTCTAA。在-142~-160的位置有一个“奶盒”结构,其序列为GCTCCCCAGAATTTTTGGG。此序列的前半部分即GCTCCCCAGAATT为MPBF的一个结合位点。与牛的相应的转录因子契合序列进行比较,没有发现任何差异。
图6.为牦牛κ-酪蛋白基因5′侧翼序列,由于所克隆的片段太短没能找到更多的转录因子结合位点,在-47~-53处有一个激活蛋白(AP-1)的结合位点,其序列为TGACGCA,在-268~-275的位置上有一个反式调控因子D的结合位点。TATA盒位于-25~-32的位置,其序列为TTTAATTA。在-75~-78的位置上有一个CAAT盒。由此可见牦牛κ酪蛋白基因的转录调控因子主要分布在5′侧翼区的远端,因此我们所克隆的此段序列,不适合用作调控区,来表达外源基因。
图7.为牦牛乳铁蛋白5′侧翼序列,通过扫描我们仅找到两SP-1蛋白结合位点分别位于-57~-64和-191~-196的位置上,未能找到乳腺特异性转录因子的结合位点。其TATA盒位于-24~-28的位置,而一个互补的CAAT盒位于-71~-75的位置。由此可见我们所克隆这一片段不适合于用作调控元件来表达外源基因。
综上所述,我们所克隆测定了牦牛7种奶蛋白基因(α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白、kappa-酪蛋白和乳铁蛋白基因等)的5′侧翼序列,并对这些序列的转录调控因子的结合位点进行了预测,证明我们所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白基因的5′侧翼序列包含了乳腺高效特异性表达所需要的大部分转录调控因子结合位点序列可直接用于转基因动物的研究和制作,我们所克隆的kappa-酪蛋白和乳铁蛋白基因的5′侧翼序列包含了该基因完整的启动子区序列可和其他基因的组织特异性相关序列融合形成嵌合5′调控序列用于转基因动物的制作、基因治疗以及DNA疫苗的研究与开发。
图8.牦牛α-乳清蛋白基因序列及预测的氨基酸序列注图中大写不加边框的序列为外显子序列,字母小写序列为侧翼序列或内含子序列,大写斜体加边匡的序列为各种表达调控因子识别位点序列,斜体下划线序列为在牛的序列中为回文结构,但在牦牛的序列中被碱基突变(突变碱基以黑体书写)打断而不再是回文结构,印刷体下划线序列在牦牛和普通牛的序列中都为回文结构,图中小写黑体序列为内含子剪切识别位点。
序列分析结果表明牦牛的α-乳清蛋白基因具有与普通牛相似的基因结构即都是由5′侧翼区、四个外显子、三个内含子和3′侧翼区构成,通过与牛(Vilotte J.L.et al.1987)的相应序列比较表明牦牛α-乳清蛋白基因全序列与牛的该基因全序列同源性为98%,其中5′侧翼序列、外显子的编码区和3′侧翼区同源性为99%,其所编码的氨基酸序列同源性也为99%,内含子和3′非编码区的同源性为98%,5′非编码区的同源性为93%。
详细的序列比较结果显示,在牛的该基因非编码序列中,存在的一些5至10碱基的回文结构在牦牛的序列中因碱基突变而消失(如图4所示)。尤其是其中的-1~-10和+16~+25的序列在牛的序列中为回文结构,而在牦牛的序列中因两个碱基的变异而被破坏,由于基因结构中非编码序列的回文结构对基因的表达调控有一定的作用,而牦牛乳中的α-乳清白蛋白占总奶蛋白的6.08%(王永等,1998;汪玉松等,1995),在普通牛却只占3.6%(汪玉松等,1995),因此可以推断这些回文结构的破坏是该基因在牦牛中有较高水平表达的原因。
图9牦牛αS1-酪蛋白基因3′端序列其包括的外显子部分为黑体大写部分,下划线部分为PolyA加尾信号结构。
图10牦牛β-乳球蛋白基因3′端序列字母小写部分为内含子序列或3′侧翼序列,大写部分为外显子序列,下划线部分为PolyA加尾信号。
图11牦牛kappa-酪蛋白基因3′端序列大写字母部分为第四外显子部分,大写字母并斜体部分为编码区部分,非斜体部分为3′非编码区,小写字母部分为3′侧翼序列,下划线部分为PolyA加尾信号部分。
图12牦牛β-酪蛋白基因3′端序列大写字母部分为外显子部分,小写字母部分为内含子序列部分,下划线部分为PolyA加尾信号结构部分从图8-12可以看出我们所克隆测定的牦牛α-乳清蛋白基因、β-乳球蛋白基因、αS1-酪蛋白基因、kappa-酪蛋白基因以及β-酪蛋白基因的3′端序列都具备了制作哺乳动物表达载体所需要的PolyA加尾信号结构,可用与哺乳动物表达载体的构建,从而用于转基因动物的制作、基因治疗以及DNA疫苗等。
实施例材料与方法一、材料1.①奶牛血样中国Holstein奶牛血样采用北京市双桥农场双桥牛场。②牦牛血样青海高原型牦牛,采自青海省大通牛场。牦牛组织样其中30头采自青海省西宁市,由青海海北畜牧科学研究所何成基先生负责采集。另外30头由青海畜牧兽医研究所的罗晓林先生提供这60头牦牛均属于青海高原型。2.菌种大肠杆菌DH5α、大肠杆菌JM101及大肠杆菌JM109均为本室保存。3.质粒pCRTMII购自Invertrogen公司。4.酶及试剂各种限制性内切酶、RNase、蛋白酶K、IPTG、X Gal、碱性磷酸酶、T 4 DNA连接酶等购自华美生物工程公司和美国Promega公司。Taq酶为本室提供。其余化学试剂为国产、进口分装或进口。5.试剂盒GENECLEANII Kit为美国Bio 101公司产品。Dyeprimer sequencing Kit购自PE公司二、溶液配制培养基、试剂的配制若无特别要求,均以重蒸水为溶剂,高压灭菌条件为15lbf/in 2(1.034×105Pa)蒸气灭菌20分钟。1.培养基配制(1)LB液体培养基蛋白胨10g,酵母粉5g,NaCl 10g,溶于800ml水中,调节pH值至7.5,定容至1000ml,高压灭菌。(2)LB固体培养基蛋白胨10g,酵母粉5g,NaCl 10g,溶于800ml水中,加琼脂粉15g,调节pH值至7.5,定容至1000ml,高压灭菌。2.STE缓冲液0.1mol/L NaCl,10mmol/L Tris·Cl(pH8.0),1mmol/L EDTA(pH8.0),高压灭菌。3.质粒提取溶液I50mmol/L葡萄糖,25mmol/L Tris·Cl(pH8.0),10mmol/L EDTApH8.0),10 lbf/in 2(6.895×104Pa)高压下蒸气灭菌15分钟。4.质粒提取溶液II0.2mmol/L NaOH,1%SDS,现用现配。5.质粒提取溶液III5mol/L乙酸钾60ml,冰乙酸11.5ml,水28.5ml,4℃保存。6.4N NaOH80g NaOH溶于400ml水中,定容至500ml。7.10%SDS100g SDS溶于90ml水中,加热至68℃助溶,用HCl调pH值至7.2,定容至1000ml。8.1mol/L Tris·Cl(pH8.0)121.1g Tris碱,溶于800ml水中,用HCl调节pH值至8.0,定容至1000ml。高压灭菌。9.0.5mol/L EDTA(pH8.0)186.1g二水乙二胺四乙酸二钠加入800ml水中,加NaOH调pH值至8.0,定容至1000ml。高压灭菌。10.10mol/L乙酸铵770g乙酸铵溶解于800ml水中,加水定容到1000ml后过滤除菌。11.13%(w/v)PEG800将0.13g PEG8000溶于1ml 1.6mol/L NaCl中(现用现配)。12.溶菌酶溶液10mg/ml,溶于10mol/L Tris·Cl(pH8.0)中。13.RNase溶液将RNase溶于10mol/L Tris·Cl(pH8.0)中,15mmol/LNaCl中,配成10mg/ml的浓度,于100℃,煮沸15分钟。14.TE缓冲液(pH8.0)10mmol/L NaCl,10mmol/L Tris·Cl(pH8.0),1mmol/L EDTA(pH8.0),高压灭菌。15.5mol/L LiClLiCl·2H2O 302.05g完全溶于800ml水后定容至1000ml,高压灭菌。16.50×TAE242g Tris碱,57.1ml冰乙酸,100ml 0.5mol/L EDTA(pH8.0),溶解后定容至1000ml。17.氨苄青霉素(Amp)贮存液100mg/ml氨苄青霉素钠,保存于-20℃。18.5mol/L NaCl292.2g NaCl溶于800ml水中,定容至1000ml,高压灭菌。19.IPTG溶液1g IPTG溶于5ml水中,过滤除菌分装成1ml/份,贮存于-20℃。20.x-gal用二甲基甲酰胺溶解5-溴-4-氯-3-吲哚-β-D-半乳糖苷配成20mg/ml贮存液,避光保存于-20℃。21.3mol/L NaAc(pH5.2)24.604g无水乙酸钠溶于80ml水中,用冰乙酸调节pH值至5.2,定容至100ml,高压灭菌。22.1mol/L CaCl2在200ml水中溶解54g CaCl2·6H2O,过滤除菌,分装成10ml每份,贮于-20℃,制备感受态时取出一份稀释至100ml,过滤除菌,预冷备用。23.溴化乙锭贮存液在100ml水中加入1g溴化乙锭,溶解后于4℃棕色瓶内保存。24.6×凝胶加样缓冲液0.25%溴酚蓝,0.25%二甲苯青FF,30%甘油水溶液,4℃保存。25.ACD抗凝剂0.48g柠檬酸,1.32g柠檬酸钠,1.47g葡萄糖,溶于100ml水中;高压灭菌。26.DNA提取抽提缓冲液1mmol/L Tris·Cl(pH8.0),0.1mol/L EDTA(pH8.0),20μg/ml胰RNase,0.5%SDS。27.2×Cracking buffer0.2N NaOH,0.5%SDS,20%蔗糖。28.饱和酚新蒸苯酚,加入羟基喹啉至终浓度0.1%,加入等体积0.5mol/L Tris·Cl(pH8.0)混合搅拌15分钟,两相分开后移去上层,用等体积0.1mol/L Tris·Cl(pH8.0)重复抽提至酚相pH值大于7.8,保存于4℃棕色瓶中并处于10mmol/L Tris·Cl(pH8.0)覆盖之下。29.酚∶仿(1∶1)等体积苯酚、氯仿混合,保存于4℃,棕色瓶中。30.蛋白酶(K溶液)用水配成20mg/ml,-20℃保存。31.磷酸缓冲液(PBS)在800ml蒸馏水中溶解8g NaCl,0.2g KCl,1.44g Na2HPO4和0.24g KH2PO4,用于HCl调节pH值至7.4,加水定容到1000ml,高压灭菌。32.10×Taq酶buffer100mmol/L Tris·Cl(pH8.0),500mmol/L KCl,20mmol/L MgCl2,0.1%明胶。三、实验步骤1.哺乳动物基因组DNA提取(血样)(1)冻存血样(20ml)室温(或55℃水浴)融化,加入等体积磷酸缓冲液,混匀,3500g离心15分钟,弃上清,加入15ml抽提液重悬沉淀。(2)37℃保温1小时。(3)加蛋白酶K至终浓度为100μg/ml,混匀。(4)55℃水浴中消化,时间视溶液变粘稠至透亮为止,消化过程中不时轻轻摇匀反应液。(5)加入等体积的苯酚、酚∶氯仿各抽提一次。抽提时,温和转动离心管,混合两相,然后室温5000g,离心15分钟,吸出上层水相,移至另一干净离心管中。(6)加入0.2倍体积的10mol/L乙酸铵和2倍体积的无水乙醇,室温下轻轻摇匀。(7)DNA量多时,挑出乳白色絮状沉淀。无明显沉淀形成时,可放于-20℃过夜,5000g离心15分钟,收集沉淀。70%醇洗。(8)真空抽干,但不能将DNA抽得太干,不见管底与管壁上的酒精即可。(9)加适量TE溶解。(10)检测DNA质量与浓度。2.组织中基因组DNA的提取(高盐法)风干组织后取少量剪碎后直接按下进行,70%酒精浸泡过的组织剪碎后,真空抽干后再按下步进行。(1)加入1ml DNA抽提液,10μl蛋白酶K(10mg/ml),于55℃消化24小时,中间补加1次等量蛋白酶K。(2)分装为400μl管,每管加预热5M NaCl 170μl,使NaCl终浓度为1.5M,混匀。(3)加570μl苯酚∶氯仿(1∶1)抽提1次。(4)12000rpm离心15分钟,界面上可见一深色蛋白层,取上清液,加2倍体积无水乙醇沉淀DNA,70%乙醇洗2次,稍抽干,溶于TE中,4℃或-20℃长期保存。3.基因组DNA的纯化(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)。4.PCR引物的设计引物 扩增范围(注根据牛的已知序列设计并确定)α-乳白蛋白引物1号 F15′ TATTTAGTGGTATTGGTGGTTGG 3′ 从68nt到1292nt包括该基因的5′侧翼区698ntF25′ TATTCTGTGCTGTCATTGTTTTG 3′ 及第一外显子,第一内含子和部分第二外显子。2号 F35′ TCGTCTTTCTTTCAGGGGTC 3′ 从1205nt到1655nt包括该基因第二外显子,部F45′ AACTTCATCAACCAACTTAG 3′ 分第二内含子。3号 F55′ GACCAGAACCCTCACTCAAGC 3′ 从1332nt到2519nt包括该基因部分第二外显F65’ CAGAAGCAGCAAAGACAGCAG 3′ 子,第二内含子,第二外显子,第三内含子,第四外显子。4号 F75′ CCATAAAGCACTCTGTTCTG 3′ 从2437nt到3070nt包括该基因的部分第四外F85′ CCTTGTGGGCTACCGTCTAT 3′ 显子和包括加尾信号在内的3’侧翼区。β-乳球蛋白引物5号 F95′ TGTCCAGCCTTCCCTCCCATAG3′ 从14nt到1200nt位于基因5′侧翼区上游F105′GGGTAGGGGAACAGGAGCAAG 3′6号 F115′CCCCGCTATCAGGAGACACC 3′ 从1155nt到2182nt位于基因5′侧翼区C号引F125′AGGGAGTGGAGGGCTGAGAC 3′ 物下游,5′端与C片段重叠45碱基,3′端包括该基因第一外显子的前11个碱基7号 F135′CGGCTCTCCCTCCCCCACAG3′从6259nt到7355nt包括了部分第5内含子,F145′CCCCTTCCAACCGTGACCTC3′第6-7外显子及该基因3′侧翼区部分序列β-酪蛋白引物8号 F155′GCTTTCATTTTCTTTCTTCC3′从-991nt到-9nt为该基因的5′侧翼区F165′ATCTGATTTTGTGGTTGTTT3′序列9号 F175′AGAGGATTTCAATGTGAATGC 3′从7412nt到8578nt,包括了该基因第8外显子F185′ATGCCTAAGGGTTAATTTATT 3′,第8内含子及第9外显子全部序列。Kappa-酪蛋白引物10号F195′ATTACTTCATACTCAGGTTCTT 3′从-397nt到41nt包括该基因的部分第F205′GCTTGGCAGTAGGTTCAGTTGG 3′一内含子和5′侧翼区序列。11号F215′CGCTGTGAGAAAGATGAAAGATTC3′从1530nt到11310nt包括该基因的第4外显子F225′AGATTCAAGGAGTATACCAATTGTTG 3′和部分第4内含子序列α-S1酪蛋白引物12号F235′ATGGAAAATCAGAGTTATGGTT 3′从-806nt到103nt包括了该基因的第一外显F245′ATGATGAGACAGAGGAAAAT3′子,部分第一内含子及5′侧翼区部分序列。13号F255′GATTTTGTCTTTCTTCTTTTC 3′从19596nt到20577nt包括了该基因第19外F265′TTGTGTTTTCCTGATTCTTTG 3′显子43序列及3′侧翼部分序列。α-S2酪蛋白引物14号F275′TAAGCAATAGAAGATAAACTGG 3′从-902nt到82nt包括了该基因部分第一内F285′AGGTACATAGAATAACAAAAAG 3′含子,全部第一外显子及5′侧翼部分序列。乳铁蛋白引物15号F295′CACAAAACAACACAAGGGGTAG 3′从-707nt到66nt包括该基因部分第F305′CAGCAGGGCGGGGACGAAGAG 3′一外显子和部分5′侧翼序列。5.引物浓度的测定分光光度计测OD260值,引物浓度按下式计算C(μM)=OD260×100×稀释倍数/1.54×NA+0.74×NC+0.87×NT+0.74×NGN代表各碱基的数目。根据测定结果,将部分引物稀释到50pmol/μl。6.PCR反应条件此次所用引物其PCR反应条件中除退火条件外,其它可完全相同,故为简便起见,下面先列出一个模板程序见表3,然后再将各引物的退火温度列出见表4表3 PCR反应的循环参数94℃5分钟 1个循环94℃1分钟X℃(具体温度见附表2)1分钟30个循环72℃2分钟4℃ 20分钟 1个循环表4不同引物PCR反应的退火温度引物序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15退火温度(℃)61 60 68 61 72 68 68 61 61 61 58 61 61 61 68PCR反应体系1~14号引物PCR反应体系为2.5μl 10×Taq DNA聚合酶缓冲液(500mmol/L KCl,100mmol/L Tris·Cl,20mmol/L MgCl2,0.01%明胶),2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng。第15对引物的PCR反应体系为2.5μl 10×无镁离子Taq DNA聚合酶缓冲液(500mmol/L KCl,100mmol/L Tris·Cl,0.01%明胶),1.5μl MgCl2(25mol/μl)2μl dNTPs(2.5mmol/L for each),1μl引物I(50pmol/μl),引物II(50pmol/μl),1U Taq DNA聚合酶,模板DNA 200ng。7.连接反应(1)计算外源片段与载体的量插入DNA(ng)=载体(ng)×插入DNA的大小(kb)/载体的大小(kb)×插入片段与载体的分子比。一般插入片段分子∶载体分子=3~8∶1(2)连接反应体系(10μl)50ng 载体DNA适量 外源DNA1μl T4DNA连接酶10×buffer1~2U T4DNA连接酶补加水至10μl(3)14~16℃温育8~12小时。(4)取5μl连接液转化,其余-20℃冻存。8.感受态细胞的制备(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)9.DNA转化(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)10.重组质粒快速初步鉴定(1)取一加有X gal,IPTG和Amp的LB平板。(2)挑取转化白斑划线,同时挑一蓝斑划线为对照。(3)37℃培养12小时。(4)挑取培养好的菌体悬浮于50μl预冷STET溶液离心管中。(5)100℃水浴中煮费40秒。(6)12000rpm,离心5分钟。(7)用枪头将离管中底部沉淀挑出。(8)取上清10μl点样电泳。(9)紫外灯下比较来自白色菌落及蓝色菌落的DNA迁移速率,条带明显滞后的质粒可能含有插入片段,为重组质粒。11.质粒DNA的小规模提取(碱裂解法)(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)12.质粒DNA的大规模提取(碱裂解法)(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)13.质粒DNA纯化方法(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)14.DNA的酶切(用于制备外源片段、鉴定阳性克隆)(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节等)(1)取一定量载体pGEM 5zf(+)用Sca I酶切完全。(2)酚∶仿抽提。(3)乙醇沉淀。(4)离心弃上清,真空抽干,适当水溶解。(5)测定DNA的浓度及纯度。15.DNA片段电泳(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)16.DNA片段的回收(参见《分子克隆实验指南》,第二版〖美国〗J.萨姆布鲁克等编,全冬雁等译的相关章节)17.测序测序反应按Dyeprimer Sequencing试剂盒(PE公司)说明书进行,核苷酸顺序确定在ABI377全自动序列仪(ABI公司)上进行。每一克隆的序列测定需经三次重复以确保所测序列的准确性。18.序列分析用GENTYP-MAX8.5等序列分析软件进行序列分析用Http//www.rwcp.or.ip/lab/pdappl/papia.html网站的TFSEARCHDNA Transcription Factor Binding Site Prediction软件进行转录调控因子结合位点的预测。
通过上述步骤我们克隆测定了牦牛7种奶蛋白基因(α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白、kappa-酪蛋白和乳铁蛋白基因等)的序列(全序列或部分序列),并对这些序列调控区部分的转录调控因子的结合位点进行了预测,证明我们所克隆的α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白基因的5′侧翼序列包含了乳腺高效特异性表达所需要的大部分转录调控因子结合位点序列可直接用于转基因动物的研究和制作,我们所克隆的kappa-酪蛋白和乳铁蛋白基因的5′侧翼序列包含了该基因完整的启动子区序列可和其他基因的组织特异性相关序列融合形成嵌合5′调控序列用于转基因动物的制作、基因治疗以及DNA疫苗的研究与开发。我们所克隆测定的牦牛α-乳清蛋白、β-乳球蛋白、αS1-酪蛋白、kappa-酪蛋白和β-酪蛋白等基因的3′端序列具备了构建哺乳动物表达载体所需要的PolyA加尾信号结构,可用于哺乳动物表达载体的构建。这些表达载体可用于转基因动物的制作、DNA疫苗的研制、基因治疗等方面。同时我们所克隆得到的牦牛七种奶蛋白基因序列有为与牦牛奶产量相关的遗传标记的开发提供了必备的参考信息。
权利要求
1.牦牛α-乳清蛋白基因序列,它是附图8所述的序列。
2.牦牛α-乳清白蛋白基因5′侧翼序列,它是附
图1所述的序列。
3.牦牛β-乳球蛋白5′侧翼序列,它是附图2所述的序列。
4.牦牛α S1-酪蛋白5′侧翼序列,它是附图3所述的序列。
5.牦牛α S2-酪蛋白基因5′侧翼序列,它是附图4所述的序列。
6.牦牛β-酪蛋白基因5′侧翼序列,它是附图5所述的序列。
7牦牛κ-酪蛋白基因5′侧翼序列,它是附图6所述的序列。
8.牦牛乳铁蛋白5′侧翼序列,它是附图7所述的序列。
9.牦牛αS1-酪蛋白基因3′端序列,它是附图9所述的序列。
10.牦牛β-乳球蛋白基因3′端序列,它是附
图10所述的序列。
11.牦牛kappa-酪蛋白基因3′端序列,它是附
图11所述的序列。
12.牦牛β-酪蛋白基因3′端序列,它是附
图12所述的序列。
全文摘要
本发明公开了牦牛的7种乳蛋白基因全序列和部分序列:α-乳清蛋白基因全序列,α-乳清白蛋白基因5′侧翼序列,β-乳球蛋白基因5′侧翼和3′端序列,αS1-酪蛋白基因5′侧翼和3′端序列,αS2-酪蛋白基因5′侧翼序列,β-酪蛋白基因5′侧翼和3′端序列,kappa-酪蛋白基因5′侧翼和3′端序列,和乳铁蛋白基因5′侧翼序列。
文档编号C12N15/12GK1357627SQ00134189
公开日2002年7月10日 申请日期2000年12月8日 优先权日2000年12月8日
发明者李宁, 樊宝良, 吴常信 申请人:李宁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1