一种筛选植物高多态性分子标记位点的方法与流程

文档序号:13978269阅读:402来源:国知局

本发明公开了一种筛选植物高多态性分子标记位点的方法,属于生物技术领域。



背景技术:

分子标记是指能反映生物个体或种群间基因组中某种差异的特异性dna片段,分子标记技术广泛应用于基因定位、遗传图谱分析、法医以及新品种的审定等领域,具有广泛的应用价值和理论研究意义。但是由于受到现有分子标记的开发方法的限制,目前可用的分子标记数量都非常少,甚至某些物种缺乏可用的分子标记位点。在实现本发明的过程中,发明人发现现有技术至少存在以下问题:传统高多态性分子标记的开发多是依赖于研究者的个人经验,通过大量验证试验来获得,其过程耗费巨大、周期漫长,且不一定能获得真正高多态性的标记位点。而且整个开发过程一次只能找出一个高多态性的分子标记位点,而对于基因组上存在的众多其潜在的高多态性分子标记位点则无能为力。传统的高多态性分子标记在应用中多是一个标记一个标记的的检测,无法大规模的高通量的检测多个分子标记位点。部分物种目前有丰富的变异位点信息,但是却不一定会适用于所有的品种。因而批量寻找合适的分子标记位点是目前分子标记的研究和应用的最大障碍。



技术实现要素:

针对现有技术中的上述缺陷,本发明的主要目的在于提供一种筛选植物高多态性分子标记位点的方法,可以一次性筛选出基因组上所有可用的高多态性分子标记位点,实现批量筛选。

为了达到上述目的,本发明采用如下技术方案:一种筛选植物高多态性分子标记位点的方法,包括如下步骤:

确定检测物种的子类,将所述各子类对应的材料混合后提取总核酸,构建高通量测序文库;

采用高通量测序的方法对所述高通量测序文库进行高覆盖度的测序,获得测序片段;并将测序结果比对到所述检测物种的参考基因组上;根据比对结果获取所有的突变位点;

按照窗口平移获得每个窗口的突变位点的组合数,并将每种组合的测序片段数量换算成所述窗口上所有测序片断的百分比;计算每个窗口的多态性,并评估该窗口是否处于单拷贝区域,得到候选位点;

寻找候选位点两侧的保守区域,在所述保守区域设计分子标记的多重扩增引物;

对所述多重扩增引物筛选,获得新的高多态性分子标记位点。

作为进一步的优选,所述物种选自动物、植物和微生物;所述物种至少有2个或2个以上的子类,所述子类选自小种,亚种或品种。

作为进一步的优选,所述各子类对应的材料混合,包括:所述各子类对应的材料等量混合均匀。

作为进一步的优选,所述子类之间的基因组摩尔数比例为(0.9-1):(1-1.2)。

作为进一步的优选,所述高覆盖度的测序包括:获得可覆盖基因组的核酸测序片段,且所述测序片段数量高于子类的数量。

作为进一步的优选,所述将测序结果比对到所述检测物种的参考基因组上,包括:以测序片段为单位展开,标记出每条测序片段上与参考基因组不同的每个碱基位点及其突变类型;把具有相同突变碱基位点和突变类型的reads定义为所述窗口内的一个基因型,获得所述窗口的所有候选基因型。

作为进一步的优选,所述窗口平移包括:窗口长度设为l;统计每类基因型的测序片段数量,并除以完整覆盖所述窗口的测序片段的总数量,获得所述基因型的频率,理论上每类基因型对应了一个子类在该位点的基因型信息。

作为进一步的优选,所述单拷贝区域为:基因组上其他位置不存在对单拷贝区域形成干扰的基因组片段。

作为进一步的优选,所述在保守区域设计分子标记的多重扩增引物,包括:对于长度为l的一个滑动窗口,窗口在基因组上的起始位置设为s,该窗口终止位置为e,则窗口左侧保守区定义为坐标位置小于s、在测序数据中以及已有的数据中均未发现变异的连续n个碱基位点,窗口左侧保守区定义为坐标位置大于e、在测序数据中以及已有的知识中均未发现变异的连续n个碱基位点。

作为进一步的优选,在所述保守区域内设计的引物3末端不含有低复杂序列,如连续多个a,连续的at重复片段。

作为进一步的优选,所述对所述多重扩增引物筛选包括:验证分子标记间的扩增均一性。

本发明的有益效果是:本发明方法包括将同一植物的不同品种混合后提取总核酸;构建高通量测序文库;寻找基因组上的变异位点;通过滑动平移筛选高多态性位点;在候选位点两侧设计多重扩增引物;对多重引物的筛选后即获得新的高多态性分子标记位点。理论上本发明可以一次性筛选出基因组上所有可用的高多态性分子标记位点,并且可以直接用于品种的高通量检测;由于开发过程中已经综合了多个品种的基因组信息,因而不需要传统筛选方法中针对每个样品的反复验证过程;在应用上本方法所筛选出的分子标记位点可以批量检测,不需要对每个分子标记位点一个一个的做分子扩增和检测,因而加快了检测速度,并提高了准确性;快速筛查最适用于目标类群的新的分子标记位点,不需要对基因组上的分子标记有任何的先验知识,筛选出的分子标记多态性高、分辨率好,且筛选过程简单、快速且流程规范。

具体实施方式

本发明通过提供一种筛选植物高多态性分子标记位点的方法,解决了现有技术中高多态性分子标记开发困难的问题。

为了解决上述缺陷,本发明实施例的主要思路是:

本发明实施例筛选植物高多态性分子标记位点的方法,包括如下步骤:

确定检测物种的子类,将所述各子类对应的材料混合后提取总核酸,构建高通量测序文库;

采用高通量测序的方法对所述高通量测序文库进行高覆盖度的测序,获得测序片段;并将测序结果比对到所述检测物种的参考基因组上;根据比对结果获取所有的突变位点;

按照窗口平移获得每个窗口的突变位点的组合数,并将每种组合的测序片段数量换算成所述窗口上所有测序片断的百分比;计算每个窗口的多态性,并评估该窗口是否处于单拷贝区域,得到候选位点;

寻找候选位点两侧的保守区域,在所述保守区域设计分子标记的多重扩增引物;

对所述多重扩增引物筛选,获得新的高多态性分子标记位点。

本发明实施例不需要目标物种的现有分子标记的信息,也无需传统的筛选过程中所需要的构建遗传群体信息,只需通过高通量测序可以一次性地检测基因组上所有高多态性的分子标记位点,筛查过程简单、快速且流程规范。

在应用上本方法开发出的高多态性分子标记位点的检查方法可以利用扩增子测序技术实现一次扩增和测序就能检查所有分子标记位点,检测方法快速、准确、通量高,普遍适用于各种基于分子标记开展的各项研究和应用。

为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施方式作进一步地详细描述。如未加特殊说明,本发明中所用试剂均为市场上常见试剂,大多数生物技术公司均有销售,且效果等同。

实施例一、水稻高多态性分子标记位点的筛选

本实施例中,选取30个已经获得授权的中国水稻保护品种为材料,本实施例的目的是批量筛选出一批具有高多态性的分子标记位点。

一、混合基因组dna的提取

20个水稻品种,每个品种取10粒种子发芽,幼苗长出10天后每株取出0.1g的新鲜叶片,将所有收集起的叶片混合后加入液氮并研磨成粉状,利用植物基因组dna提取试剂盒(货号:dp305,生产公司:天根生化科技(北京)有限公司)按其操作手册所述的方法提取获得的混合样品的核酸。本实施例所用水稻品种信息见表1。

表1.本实施例中所用水稻品种信息

二、高通量测序文库的构建及测序

利用紫外分光光度计(nanodroponec,赛默飞世尔科技(中国)有限公司)测定核酸的od260/280值为1.91。用qubit对提取核酸进行定量,确定提取的dna浓度达到文库构建的量。采用covarissystem超声波打断仪(covarism220),将待测dna打断成250bp大小,然后按照iontorrent的全基因组文库构建试剂盒构建面pcr扩增的高通量测序文库。采用iontorrents5高通量测序仪进行测序。

构建高通量测序文库时不同子类间要均匀混合,保证每个类的基因组摩尔数比例接近1:1。基于高通量测序获得足够可覆盖基因组的核酸片段,且片段数量高于子类的数量。

三、多态性分子标记位点的筛选方法

3.1测序片段与基因组序列比对

采用bowtie2(版本号2.1.0)把所有测序片段比对到水稻参考基因组上,水稻基因组的版本号为irgspbuild5,下载地址为:http://rgp.dna.affrc.go.jp/e/irgsp/build5/build5.html,比对参数全部采用默认值。

3.2变异位点分析

变异位点的分析以测序片段为单位展开,标记出每条测序片段上与参考基因组不同的每个碱基位点及其突变类型;把具有相同突变碱基位点和突变类型的reads定义为该窗口内的一个基因型。具体如下:

根据比对结果统计基因组上的变异位点,方法如下:设定滑动窗口的大小为100bp,窗口每次向前移动30bp;对于每一个窗口,首先统计每条reads的变异位点信息,如基因组上的碱基为a,测序片段上对应的位点为t,则将该位点记录为t;如与基因组上的碱基信息相同,则记录为r。将所有碱基位点的信息作为一个整体表示该测序片段在该窗口上的基因型。由于在测序过程中引入的插入、缺失的发生比例较高,尤其是在简单重复序列的位置发生测序错误的比例会更高,因此我们忽略掉所有的插入、缺失位点,以及出现在简单重复区的所有变异位点。

3.3计算每个窗口的多态性指数

统计每一个基因型的测序片段数量,并除以完全覆盖该窗口的测序片段的总数,则得到该基因型的百分比频率。该窗口的多态性指数计算公式如下:其中pi为第i个基因型的频率。若该窗口内的多态性指数小于0.2,则该位点舍弃;假设该窗口内第一个变异发生的位置为n,最后一个变异出现的位置为m,设l=200-(m-n),则在nbp到(n-l)bp的区域,以及mbp到(m+l)bp的区域检内查是否有一段长度超过50bp的保守区域存在,要求该区域内未检测到任何碱基变异,若两侧均存在符合要求的区域,则将该区域作为候选的多态性位点保留,否则舍弃该窗口。

在上述多态性指数计算公式中,在任意一个多态性位点上,十个绿豆品种理论上有20个基因型存在,但是有些品种的基因型是相同的,所以可能只出现了i种基因型,有些基因型的测序片段数量占该位点总片段数量多,有些占比少些,把i个基因型依次编号为1,2,3....i,其中第一个基因型的频率为p1,第二个为p2......第i个基因型为pi;某个基因型的频率定义该基因型的测序片段数量除以该位点所有测序片段的数量;1减去所有基因型的频率的总和,就是该位点多态性的一个值d。最后筛选高多态性位点就是依据计算到的d值排序得到的。

3.4分子标记位点的筛选

分子标记位点的筛选以窗口平移的方式进行,窗口长度设为l;在窗口平移的过程中仅仅考虑可以完整覆盖该窗口的测序片段,其他测序片段均不考虑;获得该窗口的所有候选基因型;统计每类基因型的测序片段数量,并除以完整覆盖该窗口的测序片段的总数量,从而获得该基因型的频率。具体如下:

窗口向前平移30bp,重复步骤3.1-3.3的步骤,从而得到每条染色体上的候选分子标记位点。然后按照多态性的高低选取前50个位点,然后去掉基因组上距离较近的位点,方法如下:设定一个长度为1,000,000bp的窗口检查该区域内是否有候选多态性位点,若无,则向前延伸500,000bp后重新寻找;若有一个位点,则将该位点保留;若存在多个位点,则选择多态性最高的一个位点保留。本实施例筛选出的高多态性分子标记位点见表2。

选取的分子标记位点在该物种中具有特有的特征片段,且在混合测序的样品中表现出很高的多态性。

选取的分子标记在基因组上处于单拷贝区域,基因组上其他位置不存在对该区域形成干扰的基因组片段。

表2.水稻高多态性分子标记位点

四、引物设计方法

登录lifetechnology公司多重扩增引物在线设计网页https://ampliseq.com,点击“myreferences”选项,在新跳出的页面中选择“addreference”选项,在跳出的页面中选中自己的参考基因组,并点击“save”,从而将所用的水稻参考基因组序列上传上去。然后点击”mydesign”选项下的”startanewdesign”选项,从而进入引物设计页面。在跳出的页面中,在“selectgenometouse”选项中选择“custom”,然后选择上述步骤上传的水稻参考基因组序列,然后在“applicationtype”选项选择“dnahotspotdesigns(single-pool)”。然后选择“addtargets”按钮,在新的界面中输入每个候选多态性分子标记位点的起止信息,然后点击”submittargets”选项开始引物设计。引物设计完成后,检测每个引物的3’末端是否有低复杂序列存在,包括连续多个a或者t或者c或者g,以及类似atatat这样的序列:如有,则需要在参考基因组上将此引物在基因组上的对应位点设为n后重新设计。本实施例获得分子标记位点的引物序列见表3。

分子标记两侧应有适合于引物设计的保守区域;对于长度为l的一个滑动窗口,窗口在基因组上的起始位置设为s,该窗口终止位置为e,则窗口左侧保守区定义为坐标位置小于s、在测序数据中以及已有的数据中均未发现变异的连续n个碱基位点,窗口左侧保守区定义为坐标位置大于e、在测序数据中以及已有的知识中均未发现变异的连续n个碱基位点;

在保守区内设计的引物3末端不含有低复杂序列,如连续多个a,连续的at重复片段。

表3.分子标记引物信息

五、验证分子标记位点的多态性

另外选取5个授权的水稻常规品种,每个品种选取10粒种子并提取总的核酸。然后利用由美国lifetechnology公司生产的扩增子测序文库构建试剂盒(货号为4475345)构建高通量测序文库。该试剂盒包括以下试剂:5×ionampliseqtmhifimix、fupa试剂、转换试剂、测序接头溶液和dna连接酶。文库构建的方法按该试剂盒的操作手册《ionampliseqtmlibrarypreparation》(出版号:man0006735,版本:a.0)进行。多重pcr的扩增体系如下:10×ionampliseqtmhifimix2μl、合成的混合多重扩增引物3μl、提取水稻品种的核酸8ng和无酶水15μl。多重pcr的扩增程序如下:95℃,2分钟;(95℃,10秒;55℃,45秒)×15个循环;10℃保温。利用fupa试剂消化掉多重pcr扩增产物中多余的引物后,再进行磷酸化。将磷酸化的扩增产物连接上测序接头,具体方法为:向扩增产物和测序接头的混合物中加入dna连接酶1.5μl、转换试剂2μl、测序接头溶液2μl,并将其均匀混合,然后将混合物在22℃环境下保温30分钟利用乙醇沉淀方法纯化后稀释至15ng/ml,从而得到浓度为100pm的的测序文库。并用iontorrents5进行高通量测序。

将测得的reads按照前述(三)的方法比对到参考基因组上,以每对引物在参考基因组上标定的区域为窗口,分析在该窗口内测序片段的基因型,分析方法如3.1-3.3;分析每个位点在五个品种上的差异。5个品种的每个分子标记位点的基因型见表4。由结果可知,本实施例筛选到的60个分子标记中共有28个标记在任意两个品种间都有差异,表现出了极高的多态性,仅有编号为19、40、46和50的4个分子标记位点在5个品种中无法提供足够高的分辨率,将5品种两两区分开。因此本实施例中获得的分子标记整体表现出了超高的多态性。

表4.各分子标记在5个品种中的基因型信息

本发明实施例可应用于各物种的高多态性分子标记的开发,在不同应用中本方法仅需在样品采集方法上稍加改动,因此,本发明通用性较强。本发明改变了已有方法中一次只能开发出一个高多态性位点,且开发出的位点在应用中无法通过一次扩增就可以检查多个分子标记位点的问题,为高多态性分子标记位点的高通量开发,以及在现实应用中实现高通量测序同时检测多个分子标记位点提供了一种新的方法,该方法简单、快速、便捷,创造性明显。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1