本发明涉及分子遗传学技术领域,尤其是一种基于est序列开发epics引物的方法。
背景技术:
现有的关于大刺鳅群体分析的方法主要是ssr和issr两种方法,这两种方法在遗传多样性,谱系地理学上应用得比较多。ssr(simplesequencerepeats)标记是近年来发展起来的一种以特异引物pcr为基础的分子标记技术,也称为微卫星dna(microsatellitedna),是一类由几个核苷酸(一般为1~6个)为重复单位组成的长达几十个核苷酸的串联重复序列。由于每个ssr两侧的序列一般是相对保守的单拷贝序列。
issr标记是一种在简单重复序yu(ssr)基础上发展起来的新型的分子标记,由加拿大蒙特利尔大学的zietkiewicz等(1994)提出。该技术以锚定的微卫星dna为引物,在ssr序列的3’或5’端加锚2.4个随机核苷酸,在pcr反应中,锚定引物可以引起特定位点退火,导致与锚定引物互补的间隔不太大的重复序列间dna片断进行pcr扩增。所扩增的inter.ssr区域的多个条带可通过聚丙烯酰胺凝胶电泳或者琼脂糖凝胶电泳得以分辨(周延清,2005)。它结合rapd标记技术和hssr标记技术的优点,能够提供更多的基因组dna信息。现己广泛应用于药用植物种质资源鉴定、进化与亲缘关系分析、遗传多样性与居群遗传结构检测、遗传作图、基因定位、分子标记辅助育种等方面的研究。
但是,上述两种方法不能满足对分化程度较高的群体进行溯源(分化时间,分布格局)和展望(分布区重建,未来动态预测)的研究。在开展对分化程度较高的群体进行溯源(分化时间,分布格局)和展望(分布区重建,未来动态预测)的研究时,需要采用核基因标记。
技术实现要素:
基于此,本发明的目的在于克服上述现有技术的不足之处而提供一种可简便地开发核基因的方法。
为实现上述目的,本发明采取的技术方案为:基于est(expressedsequencetag,表达序列标签)序列开发epics引物的方法,包括如下步骤:
(1)检索目标生物或其近缘生物的est序列,将所述est序列与ncbi的基因组序列进行比对;
(2)若所述est序列在所述ncbi的基因组内覆盖率小于25%,筛选出单拷贝内含子的长度在400~1600bp,相似度在85%以上的候选基因;
(3)针对所述候选基因设计引物,得到所述的epics引物;
其中,所述引物的参数包括:gc含量为40%~60%,退火温度为55~65℃,长度为18~27bp。
应当说明的是,“外显子引物-内含子通道”分子标记(exon-primedintron-crossingmarkers,epics),是一种匿名核基因标记,原理是在匿名外显子区设计引物对中间内含子进行扩增,使得该标记既具有外显子的保守特性,又具有内含子进化速率快的特点;est序列与基因组序列进行比对,当基因组内有两段或以上都与est序列相似(即一致)序列,其中一条或几条的比对序列长度的覆盖率小于20%,可以保证是单拷贝序列;如果大于或等于20%,存在可能不是比对的同一条基因,而只是其它相似基因。其中,覆盖率一般是指ncbi基因组内相似序列长度与est序列的长度的占比。在本申请中,覆盖率指ncbi基因组内,与est序列相似的其它基因序列长度与est序列长度的比例小于20%。核基因(gene,mendelianfactor)是指携带有遗传信息的dna(即核基因是具有遗传效应的dna),也称为遗传因子。
优选地,所述方法还包括步骤4):用步骤(3)的epics引物对所述目标生物的基因组dna进行pcr扩增,如果扩增出的dna序列长度与预期一致,则证明该epics引物准确有效,可作为分子标记,用于群体分析。
优选地,步骤(2)中所述est序列在所述ncbi的基因组内其它覆盖率小于20%,内含子的长度为750~850bp,相似度在90%以上。应当说明的是,基因组内可能出现比对计算得出内含子的长度范围为400-1600bp,即为合格,
800bp为最佳,依照以往引物开发长度为参考。est序列与基因组内候选基因序列相似度(即一致度)大于或等于85%,设计的引物的通用性更好,而相似度越大,保守性能越好,引物的通用性越高。
优选地,所述步骤3)中gc含量为40%~60%,退火温度为58~63℃,长度在20~24bp。
优选地,所述步骤(3)中引物采用primer软件设计。
优选地,所述步骤(3)中引物采用primer5.0软件设计,所述引物的得分为90分以上。更优选地,所述引物的得分为95分以上。
优选地,所述步骤(1)中检索黄鳝的est序列,所述目标生物为大刺鳅。
优选地,所述候选基因的epics引物如seqidno.1和2、seqidno.3和4、seqidno.5和6、seqidno.7和8、seqidno.9和10、seqidno.11和12或seqidno.13和14所示。更优选地,候选基因的epics引物序列为seqidno.1和2。
作为本发明的另一个方面,本发明提供上述的方法在群体分析中的应用。
优选地,所述群体分析为群体遗传多样性分析、群体结构分析、种内系统发育重建分析、系谱地理学分析、生态位模型研究或非模式生物进化选择压力的估计。
综上所述,本发明的有益效果为:
1)本申请的开发epics引物的方法操作简便,只需将目标生物基因组序列与est序列进行比对,挑选出合适的分子标记即可,适于某种生物或其近缘种具有表达序列标签的生物;
2)本申请的方法所得的核基因分子标记应用极广,可用于群体遗传多样性,群体结构分析,种内系统发育重建,系谱地理学及生态位模型研究,非模式生物进化选择压力的估计等方面;
3)本申请的方法适用于多种生物,只要某种生物或其近缘种具有表达序列标签,即可开发出适合的核基因分子标记。
附图说明
图1为est序列与基因组的比对结果示意图;
图2为epics标记开发原理示意图;
图3为引物epic-1的多样性示意图,其中,mean为平均值,population为群体。
具体实施方式
为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。
实施例1
本发明的基于est序列开发epics引物的方法的一种实施例,包括如下步骤:
(1)est序列的获得:登陆ncbi数据库(https://www.ncbi.nlm.nih.gov/),检索monopterusalbus(黄鳝)的est序列;
(2)将黄鳝的est序列与ncbi的基因组序列比对(如图1所示),找到覆盖率小于20%的单拷贝的候选基因,并且,候选基因与est序列的序列相似度大于或等于85%(如图2所示),候选基因内的内含子长度在400~1600bp内;
(3)针对大刺鳅的候选基因设计引物,引物的设计标准包括:gc含量为40%~60%,退火温度为55~65℃,长度为18~27bp,采用primer5.0设计,得分应在90分以上;之后由引物合成公司合成;
(4)用龙岩、百色、白沙三个群体的大刺鳅各3尾的基因组dna对合成的引物进行筛选。
其中,pcr扩增体系中采用通用的dna聚合酶和缓冲液即可。pcr反应条件为94℃预变性4min;94℃变性30s,退火45s,72℃延伸60s,30个循环;72℃延伸10min。
(5)1%琼脂糖凝胶,5ul反应物点样,120v电泳20min,紫外凝胶成像仪观察拍照,有清晰条带的pcr产物送生工生物工程(上海)股份有限公司测序。
(6)根据测序结果,得出表1的7对引物可作为大刺鳅的epics引物(分子标记),用于群体分析。7对引物扩增出的序列长度为445~1482bp,遗传距离0.250~1.222。由此,上述候选基因可以是表1中epic-1、2、3、4、5、6或7对应的引物通过pcr扩增得到的7条dna序列中的一条或多条。
表1核基因epics分子标记的筛选信息
实施例2实施例1的引物epic-1的遗传多样性指标
试验方法:用于引物epic-1分析的大刺鳅有9个群共237尾,其中福建龙岩(ly)30尾,广东五华(wh)30尾、增城(zc)30尾、潮州(cz)30尾、仁化(rh)25尾、恩平(ep)20尾,百色(bs)30尾,云南红河(hh)20尾,海南白沙(hnbs)22尾。进行pcr扩增,体系和反应条件参见实施例1。
试验结果:如表2所示。
表2引物epic-1遗传多样性指标
注:na=numberofalleles(等位基因数),ne=effectivenumberofallele(有效等位基因数),i=shannon'sinformationindex(香农指数),ho=observedheterozygosity(观测杂合度),he=expectedheterozygosity(期望杂合度)。
基于引物epic-1,9个群体267个个体的扩增出的dna序列长度为694bp(694bp包括内含子序列以及内含子前端和后端部分外显子序列),引物的遗传多样性指标如表2。由多样性指标综合来看,恩平(he=0.079,i=1.111)遗传多样性高(图3)。与申请的发明人用issr标记的方法比较,也是恩平(i=0.233)遗传多样性高,结果基本一致。
本实施例中,为了比较epics、ssr和issr三种标记用于群体进化分析的优劣,针对大刺鳅分别采用epics、ssr和issr三种标记进行了相应的试验,获得如下表3的结果。ssr标记多态性高,在个体鉴定,亲缘关系和基因流等方面有优势,结合表3,将三种方法进行比较可知,issr标记相比epics,使用比较方便(引物是通用的);如果要对分化群体较大的群体进行进化分析,应优先选择基于est序列的epics标记。
表3epics、ssr和issr三种标记的比较
注:-表示无数据,ndna指基于est序列的epics。
由上述结果可以看出,利用黄鳝的表达序列标签(est)序列与ncbi的基因组进行比对,开发出的核基因epics引物可以很好的用于大刺鳅不同群体的遗传多样性研究。
当从通用引物中,无法筛选到适合自己种内研究的核基因时,本研究方法可以快速找到适合种内研究的核基因,是一种新的开发方法。通过比对ncbi中的ests和基因组序列,识别外显子,设计引物扩增内含子,开发出的引物可广泛用于种内,甚至于种间。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
sequencelisting
<110>广州大学
<120>基于est序列开发epics引物的方法
<130>2018
<160>14
<170>patentinversion3.5
<210>1
<211>25
<212>dna
<213>人工序列
<400>1
gctgtataacggtcctctctccttg25
<210>2
<211>24
<212>dna
<213>人工序列
<400>2
ggttagcgatgtcagcctcaactg24
<210>3
<211>23
<212>dna
<213>人工序列
<400>3
cctctgtccatccagtatggcac23
<210>4
<211>24
<212>dna
<213>人工序列
<400>4
ccgacaatcagagaggtaccagtg24
<210>5
<211>24
<212>dna
<213>人工序列
<400>5
gccataaccaatcgattcgaccag24
<210>6
<211>22
<212>dna
<213>人工序列
<400>6
ctgagaattcaccaccatcagg22
<210>7
<211>24
<212>dna
<213>人工序列
<400>7
gctcaggcagagtctttgcgttac24
<210>8
<211>24
<212>dna
<213>人工序列
<400>8
ccgctctccatgataaacctcagc24
<210>9
<211>21
<212>dna
<213>人工序列
<400>9
gtcggtggagttgcagatcag21
<210>10
<211>21
<212>dna
<213>人工序列
<400>10
ggtgctcttgatgtagagggc21
<210>11
<211>22
<212>dna
<213>人工序列
<400>11
cgccaacctcagtgttctcaac22
<210>12
<211>23
<212>dna
<213>人工序列
<400>12
ctcctcacaacatactgcctgac23
<210>13
<211>23
<212>dna
<213>人工序列
<400>13
ccatcgggaagcatctggacaag23
<210>14
<211>23
<212>dna
<213>人工序列
<400>14
ctcacagtggccttgccttcttc23