一种从林木基因组中高通量开发ssr标记的方法

文档序号:395832阅读:583来源:国知局
专利名称:一种从林木基因组中高通量开发ssr标记的方法
技术领域
本发明涉及基因工程技术领域,具体涉及一种从林木基因组中高通量开发SSR标记的方法。
背景技术
■ Ι·歹IjM(simple sequence repeat, SSR), iii^itJlM(microsatellite), 是指以广6个核苷酸为单位在基因组中多次串联重复的DNA序列(Alikaya M, Bhagwata A, Cregan B. 1992. Length polymorphisms of simple repeat DNA in soybean. Genetics. 132: 1131-1139)。SSR标记与其它分子标记技术相比,具有易检测、共显性遗传、重复性好、 数量丰富和多态性高以及遍布整个基因组等优点,因此在植物遗传研究的众多方面受到重视(Schlotterer C .2004. The evolution of molecular markers- just a matter of fashion. Nat Rev Genet. 5: 63-69)。SSR可分为基因组 SSR和 EST-SSR。传统的基因组 SSR标记开发一般是经过基因组DNA文库构建、重复序列克隆的识别和筛选以及测序等实验流程获得,开发过程繁琐、时间长、成本高,而且效率低(Roder MS, Korzun V,Wendehake K, Plaschke J, Tixier ΜΗ, Leroy P, Ganal MW. 1998. A microsatellite map of wheat. Genetics. 149: 2007-2023)。此外,传统方法开发的基因组SSR不但数量较少,而且重复基序也限制在2 3个核苷酸,极大地限制了基因组SSR的应用范围(林元震,郭海,黄少伟, 刘纯鑫,刘天颐,陈晓阳.2009. EST-SSR标记在木本植物中的开发和应用.植物生理学通讯.45 (1 : 1221-1225)。近些年来,随着植物基因组与功能基因组研究的发展,大规模植物基因组的测序,产生了大量的基因组序列,并上传到核酸公共数据库,已成为高通量开发基因组SSR的一种资源。目前,有许多软件可以预测SSR标记,比如SSRIT、MISA, SSR Finder和R印eat Masker等(林元震,郭海,黄少伟,刘纯鑫,刘天颐,陈晓阳.2009. EST-SSR标记在木本植物中的开发和应用.植物生理学通讯.45(12) :1221-1225),但上述软件均主要用于EST-SSR 的搜索,对于基因组,尤其是林木基因组,因其数据比较庞大,还没有一种高通量开发林木基因组SSR标记方法的相关报道。

发明内容
本发明的目的在于根据现有技术中存在的不足,提供一种高通量开发SSR标记的方法。本发明另一目的在于提供一种桉树基因组SSR标记。本发明还有一个目的在于提供利用上述桉树基因组SSR标记得到桉树SSR多态性图谱的方法。本发明上述目的通过以下技术方案予以实现
本发明所提供高通量开发林木基因组SSR标记的方法,包括以下步骤 1)从公共序列库中获取林木基因组序列;2)利用perl语言开发SSR标记预测程序htmSSR;
3)采用步骤2)得到的htmSSR程序对步骤1)的林木基因组进行SSR标记搜索;
4)根据步骤3)中SSR序列,采用生物信息学软件primerf.O,进行引物设计,再进行引物多态性检测,得到多态性引物,即为基因组SSR标记。上述方法中,在步骤2)中的程序htmSSR是利用perl语言开发的,同时该程序也属于本发明的保护范围。上述方法中,在步骤3)中检索基因组SSR标记的同时也进行其上下游序列各 200bp,以供步骤4)设计引物所用。上述方法中,在步骤3)后,包括以下步骤根据步骤3)中的SSR序列,采用生物信息学软件primerf.O,进行引物设计,再进行引物多态性检测,得到多态性引物,即为基因组 SSR标记。 上述方法中,所述基因组为林木基因组。上述方法中,所述植物为桉树。在可获得林木基因组、叶绿体基因组或一定数量DNA序列的基础上,本发明的方法适用于所有林木物种基因组SSR标记的开发,具体如桉树;基因组或DNA序列越丰富,利用本方法开发标记的效果越好。本发明的另一个目的是提供一种基因组SSR标记,其中的一条序列如SEQ ID N0:1 所示。上述基因组SSR在构建SSR多态性图谱中的应用也属于本发明的保护范围。本发明的最后一个目的是提供一种桉树SSR多态性图谱。本发明所提供的桉树SSR多态性图谱,是按照包括以下步骤的方法得到的 提取桉树的基因组DNA ;
以基因组DNA为模板,利用权利要求6中所述的SSR标记进行PCR扩增; 将PCR扩增产物进行聚丙烯酰胺凝胶电泳检测,得到桉树SSR多态性图谱。与现有技术相比,本发明具有如下有益效果
在海量且巨大的桉树基因组序列(691,297,852 bp)中高通量开发SSR多态性标记, 采用通过htmSSR程序检索SSR位点的同时也获得其两侧各200bp的序列,用以设计引物序列,这样的策略对于开发效率是一个很关键的环节。以往SSRIT、MISA、SSR Finder和 Repeat Masker等软件,搜索SSR时,一般会有序列长度限制,对于基因组如此庞大的序列, 基本运行不了。另外,它们搜索到SSR后,仍然保留SSR所在的原序列,对于EST来说,长度一般在IOOObp左右,可以直接进行引物设计,但如果是基因组序列,尤其是林木基因组, 染色体或scaffold的序列往往超过100Mb,要用于引物设计几乎不可能。本发明针对林木染色体或scaffold的序列比较庞大,改变了 SSRIT等SSR常用预测软件的检索模式,编写 htmSSR程序,先从基因组中搜索SSR位点,同时截取其两侧各200bp的序列,获得序列长度约为400bp,降低了过长序列难以或无法设计引物的难度,从而提高了从基因组数据资源中开发SSR标记的效率。
本发明所提供的标记可用于构建林木的SSR多态性图谱,进而用于林木的QTL精细定位,寻找与其对应的性状;标记也可用于研究林木系统进化关系;此外标记还可用来鉴定品种。本发明的方法没有林木物种限制性,只要有其基因组序列即可,因此,将有广阔的应用前景。


图1为桉树基因组SSR标记序列;
图2为桉树SSR多态性图谱(图中泳道编号分别与表1中品种编号对应)。
具体实施例方式以下结合实施例来进一步解释本发明,但实施例并不对本发明做任何形式的限定。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。实施例1、高通量获得桉树基因组的SSR标记一、SSR标记的搜索与引物的设计
1、获取桉树基因组序列从 EucalyptusDB 资源数据库(http //eucalyptusdb. bi. up. ac. za/)中下载桉树基因组序列,版本为V1.0 8X,更新时间为2010年7月30日。2、编写SSR检索程序htmSSR
计算机配置为windows XP, CPU为E2180,内存2G,硬盘200G。程序采用perl语言编写,perl语言版本为ActivePerl V5. 8. 8. 822。SSR检索程序htmSSR的代码如下所示 #!/usr/bin/perl
#Author: YZ Lin, et al.
#Time: 18th 12, 2010
#Program name: htmSSR. pi open (IN, "<$ARGV
"); open (OUT, ">$ARGV
· SSR");
print OUT 〃SSR_No\tID\tSSR nr. \tSSR type\tSSR\tsize\tstart\tend\n"; open (0UT2, ">$ARGV
· SSRseq"); open (SPECS, 〃 htmSSR. ini〃); my %typrep; my $amb = 0;
while SPECS
{
%typrep = $1 /(\d+)/gi if (厂def\S*\s+(· *)/i);
if (/"int\S*\s+(\d+)/i) {$amb = $1} };
my @typ = sort { $a <=> $b } keys %typrep; $/ =">";
my $max—repeats = 1; #count repeats my $min—repeats = 1000; #count repeats
权利要求
1.一种从林木基因组中高通量开发SSR标记的方法,其特征在于包括如下步骤(1)从公共序列库中获取林木基因组序列;(2)开发SSR标记预测程序htmSSR;(3)将htmSSR程序对步骤(1)的林木基因组进行SSR搜索;(4)根据搜索到的SSR序列进行引物设计,经引物多态性检测,得到多态性引物,即为基因组SSR标记。
2.根据权利要求1所述的从林木基因组中高通量开发SSR标记的方法,其特征在于步骤(2)中所述程序htmSSR是利用perl语言开发的,perl语言版本为ActivePerl V5. 8. 8. 822。
3.根据权利要求1所述的从林木基因组中高通量开发SSR标记的方法,其特征在于步骤(3)中所述SSR搜索的同时也对序列的上下游各200bp进行搜索,供设计引物用。
4.根据权利要求1所述的从林木基因组中高通量开发SSR标记的方法,其特征在于步骤(4)中所述涉及引物是根据SSR序列,采用生物信息学软件primerf. 0进行引物设计。
5.根据权利要求1所述的从林木基因组中高通量开发SSR标记的方法,其特征在于所述林木为桉树。
6.一种桉树基因组SSR标记,其序列如SEQ ID NO: 1所示。
7.权利要求6所述基因组SSR标记在构建SSR多态性图谱中的应用。
8.—种桉树SSR多态性图谱,其特征在于按照如下方法得到(1)提取桉树的基因组DNA;(2)以步骤(1)所述基因组DNA为模板,利用权利要求6所述SSR标记进行PCR扩增;(3)将扩增产物进行聚丙烯酰胺凝胶电泳检测,得到桉树SSR多态性图谱。
全文摘要
本发明公开了一种从林木基因组中高通量开发SSR标记的方法,具体包括如下步骤(1)从公共序列库中获取林木基因组序列;(2)开发SSR标记预测程序htmSSR;(3)将htmSSR程序对步骤(1)的林木基因组进行SSR搜索;(4)根据搜索到的SSR序列进行引物设计,经引物多态性检测,得到多态性引物,即为基因组SSR标记。本发明所述方法与传统方法相比,开发效率提高4~6倍,极大减少了工作量和财力消耗,缩短了研发时间,降低了开发成本,同时可为林木高精度的遗传连锁图、精确的品种鉴定等研究提供了大量的有效SSR标记。本发明方法对林木没有特异性,只要该物种基因组已经测序,即可采用本发明方法,故具有广泛的适用性。
文档编号C12Q1/68GK102226178SQ201110123288
公开日2011年10月26日 申请日期2011年5月13日 优先权日2011年5月13日
发明者刘纯鑫, 林元震, 莫晓勇, 陈晓阳 申请人:华南农业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1