鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建的制作方法

文档序号:428870阅读:307来源:国知局
专利名称:鱼类肌肉生长抑素mstn基因克隆及其基因打靶载体构建的制作方法
技术领域
本发明属于生物技术领域中的鱼类基因工程技术,是一种能在鱼类遗传改良中应用的鱼类肌肉生长抑制基因及其基因打靶载体。
背景技术
肌肉生长抑素基因(myostatin,MSTN)是1997年发现的转录生长因子(TGF-β)家族的一个成员(McPherron,等,1997,美国Johns Hopkins大学),对骨骼肌的发育和生长具有负调控作用,该基因缺失会导致骨骼肌增生(McPherron,等,1997;Grobet等,2003,比利时Liège大学)。在小鼠上研究发现,通过基因敲除使MSTN基因C端生物活性区缺失的小鼠骨骼肌比普通野生小鼠增加了2-3倍。随后,McPherron等(1997)发现双肌牛中该基因发生突变,导致双肌牛肌肉产量比普通牛增加了30%。由于MSTN基因对肌肉生长具有负调控作用,因此受到广泛关注,大量的哺乳动物特别是家畜的MSTN基因已被克隆出来,MSTN基因的功能及应用研究也在大量进行,目前,MSTN基因相关研究已成为分子生物学领域的研究热点。
在鱼类,到目前为止,仅有少数几种鱼类的MSTN基因被克隆,包括沟鲶(Kocabas等,2002,美国奥本大学);金鲷(Maccatrozzo等,2001,意大利Padova大学);罗非鱼(Rodgers等,2001,美国JohnsHopkins大学)和虹鳟(Rescan等,2001法国鱼类生理实验室)。研究表明,鱼类MSTN基因的结构和哺乳动物MSTN结构相似,都是由3个外显子和2个内含子所组成,外显子和内含子的边界处通过严格的AT-GC连接,C末端是该基因的功能区,具有高度的保守性,在此蛋白生物活性区域有一个4个氨基酸组成的RXXR的蛋白水解酶加工位点,MSTN基因成熟区通过其中9个保守的半胱氨基酸形成二硫键,C末端的“半胱氨酸”结构在所有TGF-β超家族中是保守的,对于MSTN基因的功能活性具有重要作用。体外表达分析显示鱼类的MSTN基因表达不同于哺乳类MSTN基因。目前在斑马鱼上通过反义核酸技术MSTN1转录本表明,敲除的胚胎发育明显加快,通过表型观察发现MSTN1敲除的斑马鱼身体尺寸增加,受精后20小时的敲除MSTN1胚胎在尺寸上和对照组受精后30小时的胚胎大小相似。通过双链RNA干涉技术沉默MSTN转录本,表型观察发现,沉默MSTN基因的斑马鱼成体肌肉含量增加了39%-45%,导致了过度生长。尽管反义核酸技术和双链RNA干涉技术都证实了MSTN基因的功能,但反义核酸技术和双链RNA干涉技术都无法产生稳定突变的鱼类品系,如果通过基因打靶技术将某种鱼类的MSTN基因定点突变,产生稳定遗传的敲除MSTN的转基因鱼,将会提高鱼的肌肉产量和品质。但有关鱼类MSTN基因同源重组载体构建及其定点突变方面,目前国内外未见报道。

发明内容
本发明的目的是为了克隆鱼类MSTN基因组基因、弄清鱼类MSTN基因的结构以及构建鱼类MSTN基因打靶载体,为鱼类MSTN基因的功能分析及通过基因打靶途径提高鱼的肌肉含量和品质提供基因材料和技术方法。本发明其技术内容如下一、花鲈生长抑素(MSTN)基因的克隆包括1、基因组DNA序列的获得,2、蛋白氨基酸序列推测和分析,3、基因组结构的分析;二、MSTN基因打靶载体的构建包括1、同源长片段和短片段的扩增和连接,2、正选择标记基因neo片段的连接,3、负选择标记基因SVTK-tk基因的连接。
一、鱼类生长抑素(MSTN)全长基因的克隆鱼类生长抑素(MSTN)基因的克隆包括基因组DNA序列的获得、蛋白氨基酸序列的推测和分析、基因组结构的分析。
1.基因组DNA序列的获得用DNAStar软件对GenBank中其它几种鱼类的cDNA序列和DNA序列比对,根据其保守性很高的区域设计了三对简并引物,扩增并获得了整个MSTN基因组编码区序列,再通过已获得的花鲈MSTN序列,设计特异引物,通过基因组步移技术扩增出花鲈MSTN基因的5’和3’非编码序列,得到了全长的基因组序列。
2.蛋白氨基酸序列的推测和分析根据外显子和内含子交界处的特征GT…AG,分析基因各外显子和内含子位置,用EditSeq软件分析ORF阅读框和推测蛋白质序列,用BioEdit软件对蛋白质序列进行比对分析。将推测的蛋白质序列与美国GENBANK序列数据库中其他物种的MSTN蛋白序列进行比对,用BLASTX程序算出同源性。
3、基因组结构的分析将基因组DNA序列和蛋白序列与美国GENBANK序列数据库中已存的DNA序列进行比对,结构分析表明该基因组DNA全长4873bp,包括三个外显子(分别为378bp、366bp、381bp),二个内含子(454bp、758bp)及1170bp的5’非翻译区,1366bp的3’非翻译区。在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
二、MSTN基因打靶载体的构建MSTN基因打靶载体的构建采用正-负选择策略设计同源重组打靶载体。包括长片段和短片段的扩增、长片段和短片段的连接;正选择基因neo的连接;负选择基因tk基因的连接。最终成功的构建了花鲈MSTN同源重组基因打靶载体。
1.同源长片段和短片段的扩增和连接根据测定出的花鲈MSTN全长基因组的序列,设计一对含有适当酶切位点(XbaI和BamHI)的特异引物,扩增得到一个3.2KB的长片段;再设计一对含有酶切位点(BamHI和SalI)的特异引物,扩增得到一个1.5KB的短片段。这两个片段用相应的酶切,纯化后,依次连接到相应酶切的pBSII+KS载体上,经筛选、酶切鉴定获得重组载体p+MSTN3.2+MSTN1.5,进一步经测序证实为正确连接。
2.正选择标记基因neo片段的连接应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即将neo基因通过BamHI酶切,连接插入到长片段和短片段之间,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo的重组载体。
3.负选择标记基因SVTK-tk基因的连接应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即将tk基因通过XbaI酶切,连接插入到长片段的侧翼,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo+tk的重组载体,如图2所示。
本发明与已有技术对比其特点是本发明克隆了鱼类MSTN全长基因,包括5‘端调控序列和3’端序列;弄清了该基因的全部序列及结构特征,并首次构建了鱼类MSTN基因打靶载体。可以用于鱼类基因打靶实验。本发明的技术方法可在其它鱼类上进行应用。


图1花鲈MSTN基因和推导的氨基酸序列其中5’和3’非翻译区以及内含子序列用小写字母表示;外显子和推定的氨基酸用大写字母表示,氨基酸位于相应的密码子下面,下划线部分为微卫星重复序列,TATA框和肌肉特异性E-框用黑体加下划线表示。
图2花鲈MSTN基因打靶载体
具体实施例方式下面以花鲈MSTN基因的克隆和基因打靶载体构建为例,结合附图,对本发明的技术内容进行详细说明。
本发明其技术内容如下一、花鲈生长抑素(MSTN)基因的克隆基因组DNA序列的扩增、蛋白氨基酸序列的推测及比对、基因组结构的分析。二、MSTN基因打靶载体的构建包括MSTN基因的结构分析、同源长片段和短片段的克隆和连接;正选择标记基因neo片段的连接;负选择标记基因tk基因的连接。
一、花鲈生长抑素(MSTN)基因的克隆1.DNA序列的扩增和克隆用设计的三对引物(SP-MSTN15’-AATCCAAACCCAGTCCAGTCGC-3’,5’-ATCAGGCGGGAGATTTGCAGGA-3’;SP-MSTN25’-CTGCAAATCTCCCGCCTGATGCC-3’,5’-TCTTGCCGTAGATGATCTGCTC-3;SP-MSTN 35’-TGAAGACTTTGGCTGGGACTGGAT-3’,5’-CTTGAGGATTCCTGGTTTCACT-3’)特异扩增出了花鲈MSTN基因的3个扩增片段,回收纯化后,连接测序,通过3个片段的重叠部分,将3个片段拼接起来,获得了整个编码区的序列,再根据已测序的序列,设计了一对特异性的引物AP15’-CGCCTCTTGGTCGCTCAAAACTACTG-3’和AP25’-CCACATCCTTGTTGTCATCTCCCAGCACG-3’,通过基因组步移技术扩出5’非翻译区,另一对特异性的引物S15’-TGGACCGTTGTGGATGCTCTTGAGTTG-3’和S25’-CAGAACACGGTGCAATAGAACCAGAGTAG-3’扩出了3’非翻译区,获得了一个全长为4873bp的花鲈基因组序列(图1),具有完整的编码阅读框,起始密码子和终止密码子。
2.蛋白氨基酸序列的推测及比对根据已经扩增的基因组序列,设计一对引物SPMSTN-5’5’-GCATCTGTCTCAGATTGTGCTGTATC-3’和SPMSTN-3’5’-TCAAGAGCATCCACAACGGTCCAC-3’,扩增并测序了花鲈整个编码的cDNA序列,推测出MSTN编码的蛋白氨基酸序列,同时也证实了以上克隆的基因组序列的正确性。将cDNA和基因组DNA的序列与美国GENBANK序列数据库中已存的DNA序列进行比对,用BLASTN和BLASTX程序计算我们获得的cDNA克隆片段与GENBANK序列数据库中已存的DNA序列的同源性。通过分析蛋白氨基酸序列,在C末端发现了9个保守的半胱氨基酸残基和一个RVRR(与RXXR相匹配)的蛋白酶解加工位点。这9个保守的半胱氨基酸残基提供二硫键形成位点,对于MSTN蛋白活性功能的形成具有重要的作用。
3.DNA序列分析通过外显子和内含子交界处的特征GT…AG,以及GenBank中其他物种MSTN基因序列的特征,分析花鲈MSTN基因,结构分析表明该基因组DNA全长4873bp,包括三个外显子(分别为378bp、366bp、381bp),二个内含子(454bp、758bp)及1170bp的5’非翻译区,1366bp的3’非翻译区。在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
二、MSTN基因打靶载体的构建1、同源长片段和短片段的克隆和连接设计了二对引物,MSTN-N15`-ATCGGATCCATCATTGGCGGTTCATCAGTCCCT和MSTN-C15`-ATC GGTGGGTGTGCGGGTACTTCTG扩增了一个3.2KB的长片段,并在5’端引入BamHI酶切位点,在3’末端引入XbaI酶切位点和一段终止序列。基因打靶载体引物设计另一对引物MSTN-N25`-ATCGTCGACGTCTCCCATCAACATGCTCTAC和MSTN-C25`-ATC CTCCTAATGGAAACAATGGCAT-3’扩增了一个1.5KB的长片段,在其5’端引入SalI酶切位点,在3’末端引入BamHI酶切位点和一段终止序列(引入的酶切位点用单横线表示,终止序列用双横线表示)。克隆获得了预期大小的长片段和短片段,通过相应的酶切长片段和短片段以及pBSII+KS,将长片段和短片段依次连接到载体上,形成了p+MSTN3.2+MSTN1.5质粒载体,并测序证实了MSTN长片段和短片段为正确的连接。
2、正选择标记基因neo片段的连接应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即用BamHI酶切正选择基因NEO基因以及已构建p+MSTN3.2+MSTN1.5质粒载体,将neo基因连接到p+MSTN3.2+MSTN1.5质粒载体上,形成了p+MSTN3.2+MSTN1.5+neo的质粒载体,经酶切鉴定为正确插入的载体,体外扩增,提取质粒。
3、负选择标记基因SVTK-TK基因的连接应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即用XbaI酶切负选择基因tk基因以及已构建p+MSTN3.2+MSTN1.5+neo质粒载体,将tk基因连接到p+MSTN3.2+MSTN1.5+neo的质粒载体上,最终形成了完整的MSTN正-负选择同源重组基因打靶载体p+MSTN3.2+MSTN1.5+neo+tk的质粒,经酶切鉴定为正确插入的载体,体外扩增,提取质粒。经纯化并用适合的酶将质粒线性化后即可用于基因打靶实验。
序列表<110>中国水产科学院黄海水产研究所<120>鱼类肌肉生长抑素(MSTN)基因<130>PatentIn version 3.1<160>1<170>PatentIn version 3.1<210>1<211>4873<212>DNA<213>sea perch<221>5′UTR<222>(1)..(1170)<221>exon 1<222>(1171)..(1548)<221>Intron 1<222>(1549)..(2002)<221>exon 2<222>(2003)..(2368)<221>Intron 2<222>(2369)..(3126)<221>exon 3<222>(3127)..(3507)<221>3′UTR<222>(3508)..(4873)<400>1gattactata gggcacgcgt ggtcgacggc ccgggctggt ctgtttgtcc agatgtctgt 60ctgtctggcc tttgatcatt ggcggttcat cagtccctgt gtgggctgct gtcaccggtg120ttttcagact gccacgcgtg gacgtcacac gtgggggagg taaaataaaa aaaaataaaa180ataaacgggc tctgtaaaat gatccaactt gtcaggttca gggtcactaa catgactctt240ggctgactgg aaagtgtttg atttttccca gtcttcagat cgtcaggtcg ccatgtcgcc300gctgtgctgc aggtgatggc ctccctgacg agagtgatgt cagcttacca cacgatggca360ctgtcttctc atgtgctaca accagatttg accagcaagg atttggacaa gtcctggaat420aaggactttt ctttattttt gctgtttttt gaataataat tatttccagt tttgactgat480cagcttctca gaggggaacc tggtctgacg ggacgacacc tccagaagga cttgacttca540ctgaataaaa ctgtaactct tagggttttt ttccctcaag gattaaatgt atttccacaa600
ccatgcagac acagttgcat ccatgtacct gtcaccacag acagttcatg tttggtgggc 660tgcctgcagt ctcattttaa agtgtattct ttattcacag cacaaagtat acatgacacc 720gcctatctat agcttttatt tcctaatacg caggataaat gctacattgt ttggttttaa 780taagttgcta taaattgaag cccatcagac tgttccatag gacagacagt ctggtctgcg 840cctctgcgct cattgcgcga tcactgtaag aaaagtgaat ttctccatct gtggacacgc 900tcagcacatg ctcacagcct ctaccccttt atggtttgac aacgagaaaa agttttcatg 960tcagtcggtt aaaattcatt gttccctgtc cagccaatca tagtttttga cgacacaaaa1020gaggctaaag ttggagtata aaaaggtgtg cgctaataaa gtatgatgcc tatcagtgtg1080ggacattaat ccaaacccag ttcagccgcg cacaggtcca gcacacacca agggatcttt1140tttcaaacca aacttcacac cttagagaca atg cgt ctg tct cag att gtg ctg 1194Met Arg Leu Ser Gln Ile Val Leu1 5tat ctg agc ttg ctg att gct ttg ggt cca gta gtt ttg agc gac caa 1242Tyr Leu Ser Leu Leu Ile Ala Leu Gly Pro Val Val Leu Ser Asp Gln10 15 20gag gcg cac cag cag ccg tcc gcc tcc agc ccc gtg gac acg gag cag 1290Glu Ala His Gln Gln Pro Ser Ala Ser Ser pro Val Asp Thr Glu Gln25 30 35 40tgc gcc acc tgc gag gtc cgg cag cag atc aaa acc atg cga tta aac 1338Cys Ala Thr Cys Glu Val Arg Gln Gln Ile Lys Thr Met Arg Leu Asn45 50 55gcg atc aaa tct cag att ctg agc aaa ctg cgg atg aaa gaa gct ccc 1386Ala Ile Lys Ser Gln Ile Leu Ser Lys Leu Arg Met Lys Glu Ala Pro60 65 70aat atc agc cga gat atc gtg aag cag ctc ctg ccc aag gcg ccg ccg 1434Asn Ile Ser Arg Asp Ile Val Lys Gln Leu Leu Pro Lys Ala Pro Pro75 80 85ctg cag cag ctt ctc gac cag tac gac gtg ctg gga gat gac aac aag 1482Leu Gln Gln Leu Leu Asp Gln Tyr Asp Val Leu Gly Asp Asp Asn Lys90 95 100gat gtg gtc atg gag gag gac gac gag cac gcc atc acg gag aca ata 1530Asp Val Val Met Glu Glu Asp Asp Glu His Ala Ile Thr Glu Thr Ile105 110 115 120atg atg atg gcc act gaa gtaagttttt atttcgcttt gttttctgga1578Met Met Met Ala Thr Glu125cgacgaaaag gaagcgctca gacgtctcca aactaggctt ttacgcacgg ggcagagcgc1638acgagagggg agggaggtgg gggggggcgc tttattttga caacatgtag ctttaccagc1698tcttgatatt ggaaatgtag atataccaac atcaccaaca tgtatacggt gtatgtgtgg1758gtcggtgcat ttcggcagat cagcgcgcct ggtgattacg cgcacggttt gtaaggtttt1818ctaaacgtta ttagcccact tccagagatc aaatgtcgtg tcagggatgt ttaatgacac1878cagtttattt cggtctgtaa atttcaatcg cacatggtca gtatacggag aacatagaga1938accttctctc tctctctctc tctctccctc tctctctctc cctctctctc tctctccagc1998cgag tcc gtc gtc cag qtg gat ggg gaa cca agc tgc tgc ttc ttc tcg 2047
Ser Val Val Gln Val Asp Gly Glu Pro Ser Cys Cys Phe Phe Ser130 135 140ttc act caa aag ttc cag gcc agt cgc ata gtc cgg gct cag ctc tgg 2095Phe Thr Gln Lys Phe Gln Ala Ser Arg Ile Val Arg Ala Gln Leu Trp145 150 155gtg cat ctg cgc ccg tcg gag gag gcg acc acg gtg ttc ctg caa atc 2143Val His Leu Arg Pro Ser Glu Glu Ala Thr Thr Val Phe Leu Gln Ile160 165 170tcc cgc ctg atg ccg gtc aca gac ggg agc ggg cac ata cgc atc cgc 2191Ser Arg Leu Met Pro Val Thr Asp Gly Ser Gly His Ile Arg Ile Arg175 180 185tcc ctg aag atc gac gtg aat gcc ggg gtc agc tct tgg caa agt ata 2239Ser Leu Lys Ile Asp Val Asn Ala Gly Val Ser Ser Trp Gln Ser Ile190 195 200 205gac gtc aag caa gtg ttg act gtg tgg ctg cgg cag ccg gag acc aac 2287Asp Val Lys Gln Val Leu Thr Val Trp Leu Arg Gln Pro Glu Thr Asn210 215 220tgg ggc atc gag att aac gcc ttc gat tcg agg gga aat gac ttg gcc 2335Trp Gly Ile Glu Ile Asn Ala Phe Asp Ser Arg Gly Asn Asp Leu Ala225 230 235gtg acc tcc gcg gag cca gga gag gaa gga ctg gtgagctgaa cctttatttt 2388Val Thr Ser Ala Glu Pro Gly Glu Glu Gly Leu240 245acattaaacc gaaaccttgt ggtcttaggg ttagttcatt atccgggact cctgtcctaa 2448tcaatatgac tgtaagtata agatgattat aagaactgga ccatcctgta agaaacaaaa 2508aatattttca cacccccagt gtctaattag gtttaaaaca gtattttgga ttatctgctg 2568tactgtactg gagccttcca gaggttttag tgtgcagaga ggctttgcag agtcagcagg 2628tggttaaaca ttcctgcaat caagatttaa gacttttgaa agcgattaat caacacagac 2688tccatgtagg cgcacacctg catttggagc aatgcccagt ctacaataac cccaaatcaa 2748actgcttgat tacataaaag ttcacctgcc ccacattcct taaagtattc tgtgtgactg 2808tgcaaatcag agtaattgcc tgcacacaca cacatacaca cacactgcta ctatcaatga 2868caagcactta tcatgcggct caaatactgg cactgggctc tgaggcaatt agaataccta 2928gatggctgtg gttaaccaac cgtcagatga ttcaatttct gtaaaactca aagtttcata 2988atattatcgt gccatgtttg aaaaccagct gccacaaggt cgagggcacc ggagatgtaa 3048accgaatgct gtcatccgcc tcctttttgc aaaaccagct atttctccaa agtgttcaca 3108cgctgtttgt cattgcag caa gcg ttc atg gag gtg aag gtc tcg gag ggc 3159Gln Ala Phe Met Glu Val Lys Val Ser Glu Gly250 255ccc aag cgt gcc agg aga gac tcg ggc ctg gac tgt gac gag aac tct 3207Pro Lys Arg Ala Arg Arg Asp Ser Gly Leu Asp Cys Asp Glu Asn Ser260 265 270 275cca gag tcc cgg tgc tgc cgc tat ccg ctc act gtg gac ttt gaa act 3255Pro Glu Ser Arg Cys Cys Arg Tyr Pro Leu Thr Val Asp Phe Glu Thr280 285 290ttg gct ggg act gga tta ttg ccc caa agc ggc tac aag gcc aac tat 3303Leu Ala Gly Thr Gly Leu Leu Pro Gln Ser Gly Tyr Lys Ala Asn Tyr295 300 305
tgc tcc ggg gag tgt gag tac atg cac ttg cag aag tac ccg cac acc 3351Cys Ser Gly Glu Cys Glu Tyr Met His Leu Gln Lys Tyr Pro His Thr310 315 320cac ctg gtg aac aag gcc aac ccc aga ggg acc gcg ggc ccc tgc tgt 3399His Leu Val Asn Lys Ala Asn Pro Arg Gly Thr Ala Gly Pro Cys Cys325 330 335acc cct acc aag atg tct ccc atc aac atg ctc tac ttt aac cga aaa 3447Thr Pro Thr Lys Met Ser Pro Ile Asn Met Leu Tyr Phe Asn Arg Lys340 345 350 355gag cag atc atc tac ggc aag atc ccc tcc atg gtg gtg gac cgt tgt 3495Glu Gln Ile Ile Tyr Gly Lys Ile Pro Ser Met Val Val Asp Arg Cys360 365 370gga tgc tct tga gtt gggtcgg agaccctggc gagggagagg ggaggacgga3547Gly Cys Serggggctgcgg cccagtccgg cctccaactt cagacttttt gacacaacca atccaccagt 3607tccagtgctt tcctgcagaa cacggtgcaa tagaaccaga gtagaggcca caaacagccc 3667gaccttcccg cagggcagcg ctttcacaac cggcatagca cttttttttt tctctcctcc 3727agtgaaatct tagccaaaga ggcttgaagt cagatggatg caggaacaca catacacaca 3787catgctggac cttggagtga atgtagacag aaattatcaa agttatccaa aaactttctt 3847tctccttttg tctcggtgtt ctgtgctctg tccatttata caaacatgcc gacagattat 3907actcgtacgc catctactcc actccactcc attcgtagcc aacatacaag ctattacact 3967ttctgctaag ctatatgttt gtgataatca tttttcaaga tatgttttca gagtgaaacc 4027aggaatcctc atggactttt tgaaagggct tggaaaaaca cagctggaga ctctttggag 4087tgatacatca cactggtgga acatgcgtta gtacacataa atttcatagg aggcgatgag 4147gagatgaaat ctggctgcac ggggaacccc ttagtcaccg ccacttcact actgcaattt 4207ataaaaccca gctgaaattt gcaacattaa ttcatttgga aaatctgaca cacgtcgtta 4267tctttcctgt atcagatcaa actttaagtg ctaatttgtg gggttttttt attaacaatt 4327ctgagagcgt gggagtaaaa tcctacatgc aggtggtgac gtggtagtcg atcactccgg 4387agatcccatg gaggcacaaa tgttccgcca gggcgaagta ccactttagg tcttgacagg 4447tctccatgta ctacatgcca tacattcacg caacaacata cccaaactga ggagcacttc 4507gtgcttggtc ataatctcca ctatccaaca aaaacagcct gacctgcccg atacacttga 4567attattctga ttgtaaattc acattactgg acagaaggac ttgaactgaa ggcacaatga 4627atgcagccta caaatgaaaa atgtgtttaa gacagaggaa actggattgt cgaggtgaat 4687gaatgttgag atcatgctta aactctgtct tacaaacaac acagtttgca ctatggcaca 4747ccaatagaaa gaattggttg ctacaaaagt tgtaaaaact gattttgata tgtttgctaa 4807tttgtattgt atacatatgc cattgtttcc attaggagtt gcctttctaa accactgttg 4867gtaata 487权利要求
1.一种鱼类肌肉生长抑素MSTN基因的克隆,其特征在于它的克隆方法,包括1、基因组DNA序列的获得,2、蛋白氨基酸序列推测和分析,3、基因组结构的分析;1)、基因组DNA序列的获得用DNAStar软件对GenBank中其它几种鱼类的cDNA序列和DNA序列比对,根据其保守性很高的区域设计了三对简并引物,扩增并获得了花鲈整个MSTN基因组编码区序列,再通过已获得的花鲈MSTN序列,设计特异引物,通过基因组步移技术扩增出花鲈MSTN基因的5’和3’非编码序列,得到了全长的基因组序列;2)、蛋白氨基酸序列的推测和分析根据外显子和内含子交界处的特征GT...AG,分析基因各外显子和内含子位置,用Ed it Seq软件分析ORF阅读框和推测蛋白质序列,用BioEdit软件对蛋白质序列进行比对分析;将推测的蛋白质序列与美国GENBANK序列数据库中其他物种的MSTN蛋白序列进行比对,用BLASTX程序算出同源性;3)、基因组结构的分析将基因组DNA序列和蛋白序列与美国GENBANK序列数据库中已存的DNA序列进行比对,结构分析表明该基因组DNA全长4873bp,包括长度分别为378bp、366bp、381bp的三个外显子,长度分别为454bp和758bp的二个内含子及1170bp的5’非翻译区和1366bp的3’非翻译区;在5’非翻译区上发现了一个TATA框和7个肌肉特异性的E框。
2.根据权利要求1所述的鱼类肌肉生长抑素MSTN基因的克隆,其特征在于所述的鱼类花鲈DNA全长基因组序列为gattactatagggcacgcgtggtcgacggcccgggctggtctgtttgtccagatgtctgtctgtctggcctttgatcattggcggttcatcagtccctgt100E-boxgtgggctgctgtcaccggtgttttcagactgccacgcgtggacgtcacacgtgggggaggtaaaataaaaaaaaataaaaataaacgggctctgtaaaat200E-boxgatccaacttgtcaggttcagggtcactaacatgactcttggctgactggaaagtgtttgatttttcccagtcttcagatcgtcaggtcgccatgtcgcc 300gctgtgctgcaggtgatggcctccctgacgagagtgatgtcagcttaccacacgatggcactgtcttctcatgtgctacaaccagatttgaccagcaagg 400E-box E-boxatttggacaagtcctggaataaggacttttctttatttttgctgttttttgaataataattatttccagttttgactgatcagcttctcagaggggaacc 500tggtctgacgggacgacacctccagaaggacttgacttcactgaataaaactgtaactcttagggtttttttccctcaaggattaaatgtatttccacaa 600ccatgcagacacagttgcatccatgtacctgtcaccacagacagttcatgtttggtgggctgcctgcagtctcattttaaagtgtattctttattcacag700E-boxcacaaagtatacatgacaccgcctatctatagcttttatttcctaatacgcaggataaatgctacattgtttggttttaataagttgctataaattgaag 800cccatcagactgttccataggacagacagtctggtctgcgcctctgcgctcattgcgcgatcactgtaagaaaagtgaatttctccatctgtggacacgc900E-boxtcagcacatgctcacagcctctacccctttatggtttgacaacgagaaaaagttttcatgtcagtcggttaaaattcattgttccctgtccagccaatca1000E-boxtagtttttgacgacacaaaagaggctaaagttggagtataaaaaggtgtgcgctaataaagtatgatgcctatcagtgtgggacattaatccaaacccag1100TATA boxttcagccgcgcacaggtccagcacacaccaagggatcttttttcaaaccaaacttcacaccttagagacaATGCATCTGTCTCAGATTGTGCTGTATCTG 1200M H L S Q I V L Y L 10AGCTTGCTGATTGCTTTGGGTCCAGTAGTTTTGAGCGACCAAGAGGCGCACCAGCAGCCGTCCGCCTCCAGCCCCGTGGACACGGAGCAGTGCGCCACCT 1300S L L I A L G P V V L S D Q E A H Q Q P S A S S P V D T E Q C A T43GCGAGGTCCGGCAGCAGATCAAAACCATGCGATTAAACGCGATCAAATCTCAGATTCTGAGCAAACTGCGGATGAAAGAAGCTCCCAATATCAGCCGAGA 1400C E V R Q Q I K T M R L N A I K S Q I L S K L R M K E A P N I S R D 77TATCGTGAAGCAGCTCCTGCCCAAGGCGCCGCCGCTGCAGCAGCTTCTCGACCAGTACGACGTGCTGGGAGATGACAACAAGGATGTGGTCATGGAGGAG 1500I V K Q L L P K A P P L Q Q L L D Q Y D V L G D D N K D V V M E E 110GACGACGAGCACGCCATCACGGAGACAATAATGATGATGGCCACTGAAgtaagtttttatttcgctttgttttctggacgacgaaaaggaagcgctcaga 1600D D E H A I T E T I M M M A T E 126cgtctccaaactaggcttttacgcacggggcagagcgcacgagaggggagggaggtgggggggggcgctttattttgacaacatgtagctttaccagctc 1700ttgatattggaaatgtagatataccaacatcaccaacatgtatacggtgtatgtgtgggtcggtgcatttcggcagatcagcgcgcctggtgaLtacgcg 1800cacggtttgtaaggttttctaaacgttattagcccacttccagagatcaaatgtcgtgtcagggatgtttaatgacaccagtttatttcggtctgtaaat 1900ttcaatcgcacatggtcagtatacggagaacatagagaaccttctctctctctctctctctctccctctctctctctccctctctctctctctccagccg2000agTCCGTCGTCCAGGTGGATGGGGAACCAAGCTGCTGCTTCTTCTCGTTCACTCAAAAGTTCCAGGCCAGTCGCATAGTCCGGGCTCAGCTCTGGGTGCA 2100S V V Q V D G E P S C C F F S F T Q K F Q A S R I V R A Q L W V H 159TCTGCGCCCGTCGGAGGAGGCGACCACGGTGTTCCTGCAAATCTCCCGCCTGATGCCGGTCACAGACGGGAGCGGGCACATACGCATCCGCTCCCTGAAG 2200L R P S E E A T T V F L Q I S R L M P V T D G S G H I R I R S L K 192ATCGACGTGAATGCCGGGGTCAGCTCTTGGCAAAGTATAGACGTCAAGCAAGTGTTGACTGTGTGGCTGCGGCAGCCGGAGACCAACTGGGGCATCGAGA 2300I D V N A G V S S W Q S I D V K Q V L T V W L R Q P E T N W G I E225TTAACGCCTTCGATTCGAGGGGAAATGACTTGGCCGTGACCTCCGCGGAGCCAGGAGAGGAAGGACTGgtgagctgaacctttattttacattaaaccga 2400I N A F D S R G N D L A V T S A E P G E E G L 248aaccttgtggtcttagggttagttcattatccgggactcctgtcctaatcaatatgactgtaagtataagatgattataagaactggaccatcctgtaag 2500aaacaaaaaatattttcacacccccagtgtctaattaggtttaaaacagtattttggattatctgctgtactgtactggagccttccagaggttttagtg 2600tgcagagaggctttgcagagtcagcaggtggttaaacattcctgcaatcaagatttaagacttttgaaagcgattaatcaacacagactccatgtaggcg 2700cacacctgcatttggagcaatgcccagtctacaataaccccaaatcaaactgcttgattacataaaagttcacctgccccacattccttaaagtattctg 2800tgtgactgtgcaaatcagagtaattgcctgcacacacacacatacacacacactgctactatcaatgacaagcacttatcatgcggctcaaatatggtta2900ctggcactgggctctgaggcaattagaatacctagatggctgaccaaccgtcagatgattcaatttctgtaaaactcaaagtttcataatattatcgtgc 3000catgtttgaaaaccagctgccacaaggtcgagggcaccggagatgtaaaccgaatgctgtcatccgcctcctttttgcaaaaccagctatttctccaaag 3100tgttcacacgctgtttgtcattgcagCAAGCGTTCATGGAGGTGAAGGTCTCGGAGGGCCCCAAGCGTGCCAGGAGAGACTCGGGCCTGGACTGTGACGA 3200Q A F M E V K V S E G P K R A R R D S G L D C D E 273GAACTCTCCAGAGTCCCGGTGCTGCCGCTATCCGCTCACTGTGGACTTTGAAACTTTGGCTGGGACTGGATTATTGCCCCAAAGCGGCTACAAGGCCAAC 3300N S P E S R C C R Y P L T V D F E T L A G T G L L P Q S G Y K A N 306TATTGCTCCGGGGAGTGTGAGTACATGCACTTGCAGAAGTACCCGCACACCCACCTGGTGAACAAGGCCAACCCCAGAGGGACCGCGGGCCCCTGCTGTA 3400Y C S G E C E Y M H L Q K Y P H T H L V N K A N P R G T A G P C C339CCCCTACCAAGATGTCTCCCATCAACATGCTCTACTTTAACCGAAAAGAGCAGATCATCTACGGCAAGATCCCCTCCATGGTGGTGGACCGTTGTGGATG 3500T P T K M S P I N M L Y F N R K E Q I I Y G K I P S M V V D R C G C 373CTCTTGAgttgggtcggagaccctggcgagggagaggggaggacggaggggctgcggcccagtccggcctccaacttcagactttttgacacaaccaatc 3600S ★ 374caccagttccagtgctttcctgcagaacacggtgcaatagaaccagagtagaggccacaaacagcccgaccttcccgcagggcagcgctttcacaaccgg 3700catagcacttttttttttctctcctccagtgaaatcttagccaaagaggcttgaagtcagatggatgcaggaacacacatacacacacatgctggacctt3800ggagtgaatgtagacagaaattatcaaagttatccaaaaactttctttctccttttgtctcggtgttctgtgctctgtccatttatacaaacatgccgac 3900agattatactcgtacgccatctactccactccactccattcgtagccaacatacaagctattacactttctgctaagctatatgtttgtgataatcattt 4000ttcaagatatgttttcagagtgaaaccaggaatcctcatggactttttgaaagggcttggaaaaacacagctggagactctttggagtgatacatcacac 4100tggtggaacatgcgttagtacacataaatttcataggaggcgatgaggagatgaaatctggctgcacggggaaccccttagtcaccgccacttcactact 4200gcaatttataaaacccagctgaaatttgcaacattaattcatttggaaaatctgacacacgtcgttatctttcctgtatcagatcaaactttaagtgcta 4300atttgtggggtttttttattaacaattctgagagcgtgggagtaaaatcctacatgcaggtggtgacgtggtagtcgatcactccggagatcccatggag 4400gcacaaatgttccgccagggcgaagtaccactttaggtcttgacaggtctccatgtactacatgccatacattcacgcaacaacatacccaaactgagga 4500gcacttcgtgcttggtcataatctccactatccaacaaaaacagcctgacctgcccgatacacttgaattattctgattgtaaattcacattactggaca 4600gaaggacttgaactgaaggcacaatgaatgcagcctacaaatgaaaaatgtgtttaagacagaggaaactggattgtcgaggtgaatgaatgttgagatc 4700atgcttaaactctgtcttacaaacaacacagtttgcactatggcacaccaatagaaagaattggttgctacaaaagttgtaaaaactgattttgatatgt 4800ttgctaatttgtattgtatacatatgccattgtttccattaggagttgcctttctaaaccactgttggtaata 4873。
3.一种鱼类肌肉生长抑素MSTN基因打靶载体的构建,其特征在于它的方法,包括1、同源长片段和短片段的扩增和连接,2、正选择标记基因neo片段的连接,3、负选择标记基因SVTK-tk基因的连接;1)、同源长片段和短片段的扩增和连接根据测定出的花鲈MSTN全长基因组的序列,设计一对含有适当酶切位点(XbaI和BamHI)的特异引物,扩增得到一个3.2KB的长片段;再设计一对含有酶切位点(BamHI和SalI)的特异引物,扩增得到一个1.5KB的短片段。这两个片段用相应的酶切,纯化后,依次连接到相应酶切的pBSII+KS载体上,经筛选、酶切鉴定获得重组载体p+MSTN3.2+MSTN1.5,进一步经测序证实为正确连接;2)、正选择标记基因neo片段的连接应用SVTK-neo基因表达盒作为正选择基因引入打靶载体,即将neo基因通过BamHI酶切,连接插入到长片段和短片段之间,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo的重组载体;3)、负选择标记基因SVTK-tk基因的连接应用SVTK-tk基因表达盒作为负选择基因引入打靶载体,即将tk基因通过XbaI酶切,连接插入到长片段的侧翼,经筛选、酶切鉴定获得p+MSTN3.2+MSTN1.5+neo+tk的重组载体。
全文摘要
一种鱼类肌肉生长抑素MSTN基因及其基因打靶载体,它的方法是分离克隆了花鲈MSTN基因,其全长为4873bp,包括3个外显子,2个内含子,5’调控序列和非翻译区以及3’非翻译区。根据测定出的花鲈MSTN基因序列,设计引物,扩增得到该基因的一个3.2KB的长片段和一个1.5KB的短片段,将这两个片段依次连接到pBSII
文档编号C12Q1/68GK1831136SQ200510104768
公开日2006年9月13日 申请日期2005年12月30日 优先权日2005年12月30日
发明者陈松林, 叶寒青, 沙珍霞 申请人:中国水产科学研究院黄海水产研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1