基于测序和bsa技术的性状相关的分子标记筛选方法

文档序号:584649阅读:506来源:国知局
专利名称:基于测序和bsa技术的性状相关的分子标记筛选方法
技术领域
本发明涉及基于测序和BSA技术的性状相关的分子标记筛选方法,具体地说,涉 及一种采用超级BSA和高通量测序技术结合,通过降低基因组复杂度,以对大群体进行深 度测序,并通过关联分析鉴定性状相关的DNA分子标记的方法。
背景技术
目前的分子标记主要分为三类第一类是以电泳和分子杂交技术为核心的如 RFLP技术,第二类是以电泳和PCR技术为核心的如AFLP技术,第三类是基于DNA芯片和测 序技术的分子标记如SNP。其中前两种方法检测的多态性通量小,第三类方法价格较为昂

贝o随着具有高通量,低成本,测序错误率低,测序读长短特点的新一代测序技术和生 物信息学的发展,使得应该测序技术进行高通量标记开发成为可能。随着越来越多物种,特 别是作物的基因组计划的完成测序,使我们对各个物种的基因组特点有了更深入的了解。 在此基础上,将生物信息学方法,测序方法,传统PCR技术为核心的分子标记技术法以及分 离群体分组分析法(BSA)结合起来,充分利用生物信息学方法对不同物种基因组或BAC数 据进行参数训练,根据基因组特性,找出最优简化基因组复杂度的参数具体包括的酶切组 合;最优扩增产物长度片段区间,实现减少重复序列干扰,保持特定长度片段均勻分布等属 性。根据分析得到的物种参数,对分离群体分组进行酶切扩增,选择特异长度片段进行测 序,测序结果再通过比较找出差异。该方法比较传统方法的优点在于基于高通量测序方法, 使通量大大增加,通过降低基因组复杂度到手段,使开发成本大大降低,可以对大群体进行 开发,关联分析的可靠性及准确性高。

发明内容
本发明的目的是提供基于测序和BSA技术的性状相关的分子标记筛选方法,旨在 解决现有分子标记筛选方法中通量低和价格高,标记与性状关联分析准确性不高的问题, 主要应用于作物分子育种等的标记开发和基因定位方面。为了实现本发明目的,本发明提供基于测序和BSA技术的性状相关的分子标记筛 选方法,其基于分离群体分组分析法和经过降低基因组复杂度后的高通量测序法,对分离 群体进行标记开发和性状关联分析,包括如下步骤1)分别制备两分离群体DNA样品,每个 群体中的个体样品DNA等比例混合;2)对分离群体基因组的复杂性进行降低处理,获得复 杂性降低的DNA样品;3)将复杂性降低后的分离群体DNA等比混合,利用高通量测序方式 进行测序;4)比较两组群体DNA样品测序结果,获得序列标记,根据序列标记丰度差异,检 测出与性状关联的标记。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述分离群体 可以是植物、动物或微生物。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述分离群体基因组DNA复杂性降低方法可以是任何有选择性的减少基因组复杂度的方法,包括限制性 内切酶酶切产物PCR扩增或酶切产物选择性吸附。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述分离群体 基因组DNA复杂性降低方法包括如下步骤1)分别制备两分离群体DNA样品和两亲本DNA 样品,每个群体中的个体样品DNA等比例混合;2)相同酶分别酶切分离群体DNA样品和两 亲本DNA样品;3)用不同接头分别链接到四类样品的酶切产物上,分别进行PCR扩增纯化; 回收特异性长度片段样品,将四类样品按照比例混合,混合时满足以下条件:A两群体样品 比例按照1 1;B两亲本样品比例按照1 1;进行测序;4)比较两亲本测序结果,找出多 态性标记,比较两组群体DNA样品测序结果,找出性状相关的分子标记及其亲本中的来源。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述步骤2)使 用的限制性内切酶满足以下条件a)酶在基因组上的酶切位点分布尽可能均勻;b)选择特 定长度的酶切片段能够保证序列标签的数量;c)选择特定长度的酶切片段避免落在基因 组高度重复区。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述步骤2)使 用一种或者两种酶酶切。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述分离群体 为两个经鉴定的性状分离群体,如F2、BC1、DH等目标性状分离的群体,其通过父母本杂交 重组排除了父母本中和目标性状无关的差异。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述步骤4)还 包括将分子标记定位到基因组或BAC文库。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述步骤4)还 包括通过性状关联的高密度分子标记获得性状相关的候选功能基因。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述步骤4)还 包括确定序列标签来自父本或者母本。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述每个群体 样品测序深度为50倍以上,所述每亲本测序深度为3倍以上。前述的基于测序和BSA技术的性状相关的分子标记筛选方法,其中所述步骤4)比 较两组群体DNA样品测序结果包括特异性长度片段多态性和单核苷酸多态性分子标记。本发明所述的基于测序和BSA技术的性状相关的分子标记筛选方法,比传统方法 的优点在于使用高通量测序技术,使标记开发通量大大提高,现有的BSA方法群体数量不 能太大,主要原因是采用模拟信号,结果是“有”或“无”,本发明采用测序的方法结合BSA技 术获得的分子标记是数字信号,可直接根据分子标记在分离群体种的丰度进行关联分析, 因此可采用大量的样本进行分析,同时保证分子标记的数量。并且该方法只对基因组特异 性酶切长度片段进行测序,大大降低了基因组的复杂度,使开发成本大大降低,成本的降低 使大群体深度测序成为可能,和重测序相比,测序深度和测序成本都具有明显的不可比的 优势,大大提高了关联分析的稳定性和准确性,从而位精确定位基因提供基础。


图1为本发明较佳实施例1的流程示意图2为本发明较佳实施例1对父母本和两群体DNA样品测序后的分析流程示意 图;图3A为本发明较佳实施例2模拟Ecorl+Msel两种酶对白菜基因组参考序列进行 酶切后450-500长度酶切片段在染色体上的密度分布图;图3B为本发明较佳实施例2模拟Ecorl+Msel两种酶对白菜基因组参考序列进行 酶切后全基因组每100K内的450-500p长度酶切片段数量分布图;图4A为本发明较佳实施例2Ecorl+MSel双酶切白菜两亲本和两群体DNA后加接 头并进行扩增后的电泳图;其中,1-5分别代表1 群体1 ;2 群体2 ;3 亲本1 ;4 亲本2 ; 5 对照;M :100bp DNA ladder ;图4B为本发明较佳实施例2两亲本和两群体样品混合后的DNA电泳图;其中,M 为lOObp DNA ladder, 1为两群体和两亲本按照20 20 1 1比例进行混合;图4C为本发明较佳实施例2混合样品加测序接头后截取500bp_550bp长度片段 电泳图;其中,M为50bp DNA ladder ;1和2代表500bp_550bp长度片段;图5为本发明较佳实施例2多态性标记在白菜分离群体中的基因分型结果图。
具体实施例方式以下实施例用于说明本发明,但不用来限制本发明的范围。实施例1群体特异性长度扩增片段测序检测DNA分子标记请参阅图1所示,包括如下步骤(1)本实施例处理的对象是两亲本DNA样本及经过鉴定后的分离群体DNA样本; 每个分离群体中的个体样品要进行同比例混合。(2)本实施例对要研究物种的基因组或BAC参考序列进行分析,训练参数找出最 优的酶组合,选择最优的扩增产物长度片段,满足以下条件a酶在基因组上的酶切位点分布均勻;b选择特定长度的酶切片段能够保证序列标签的数量;c选择特定长度的酶切片段避免落在基因组高度重复区。(3)对两个群体DNA样品以及两个亲本DNA样品根据(2)中选择的酶进行酶切, 酶切后的四类样品分别加上不同的接头以区分不同样品,对四个样品分别进行PCR扩增纯 化;回收根据⑵中选择的特异性长度片段样品,将四类样品按照比例混合,混合时满足以 下条件A两群体比例按照1 1比例混合;B两亲本比例按照1 1比例混合;进行DNA测 序,获得高通量高测序深度的序列标签,使每个群体样品测序深度可达到50倍以上,每个 亲本的测序深度达到3倍以上。(4)比较两个样品的测序结果,进行性状关联分析,获得性状相关的多态性分子标 记以及多态性分子标记在参考基因组上的位置和深度图谱,最终精细定位性状相关的候选 功能基因。图2为对父母本和两群体DNA样品测序后的分析流程示意图,包括以下步骤(1)通过两亲本测序结果获得两亲本序列标签,统计两亲本之间的多态性,获得多 态性分子标记。(2)通过测序获得两个分离群体的序列标签,通过序列标签和目标性状的关联分析,找出性状相关的分子标记。(3)将性状相关标记定位回参考基因组上,生成全基因组多态性标记图谱,定义出 与目标性状紧密连锁的区域,获得区域内与特定性状相关的候选基因。不能定位到基因组 上的通过BAC克隆进行基因定位。在本发明实施例中样品选择是经鉴定后的分离群体,通过父母本杂交重组排除了 父母本中和性状无关的差异,使获得的标记更准确。对基因组序列酶切分析和长度选择过程如下(1)分析各类酶组合对参考基因组或参考BAC序列进行酶切的结果;(2)绘制酶切 片段长度分布图(选取合适的长度片段),绘制各长度酶切片段在基因组上各染色体上密 度分布图(看酶切片段的分布均勻性);(3)选取均勻分布并且数量满足标记密度的酶切组 合和酶切长度片段。实施例2基于高通量测序的白菜高密度标记开发和雄性不育性状基因快速定位包括如下步骤1、如图3A所示,为模拟Ecorl+Msel两种酶对白菜基因组参考序列进行酶切后 450-500bp长度酶切片段在染色体上的密度分布图。经分析后选择效率最高的450-500bp 的长度片段,该长度片段能够均勻分布在基因组所有染色体上。2、如图3B所示,为模拟Ecorl+Msel两种酶对白菜基因组参考序列进行酶切后全 基因组每100K内的450-500bp长度酶切片段数量分布图。该长度片段的密度也能够达到 设计的要求。3、通过上述分析,对白菜基因组酶切参数评估如下白菜基因组大小507M选择用于酶切的酶Ecorl+Msel选择的酶切片段大小450-500该长度片段大小在基因组上的数量23,932每100K有10个以上该长度片段标记的比率94. 21%密度平均每21,187bp有一个该长度片段测序深度501.47X该长度片段分布在基因间和内含子区的比率75. 89%该长度片段分布在外显子区的比率19. 61%该长度片段分布在重复区域的比率4. 49%改长度片段距离最近基因的平均距离1,973bp4、白菜父母本和群体的选择用雄性不育和可育植株构建白菜父母本和群体,以 白菜雄性不育植株作为父本,白菜可育植株作为母本,两亲本购自中国农科院蔬菜花卉研 究所,其中雄性不育植株编号为938A,可育植株编号为太NB ;群体为F2群体,对群体可育和 不可育植株进行分组,群体1为可育群体,群体2为不可育群体;父本、母本及群体1、群体2 各100株。5、如表1所示,为群体中200个个体浓度和稀释倍数,稀释后个体浓度相等,进行 等比例混合。表 1
6、如图4A所示,为Ecorl+Msel双酶切白菜两亲本和两群体DNA后加接头并进行 扩增后的电泳图;其中,1-5分别代表1 群体1 ;2 群体2 ;3 亲本1 ;4 亲本2 ;5 对照;M IOObp DNA ladder。连接所用接头为5' -GACGATGAGTCCTGAGTACTCAGGACTCAT-3‘;扩增 所用引物为亲本1 引物5 ‘ -GACAGATGAGTCCTGAGTAA-3 ‘亲本2 引物5 ‘ -GACGGATGAGTCCTGAGTAA-3 ‘
群体 1 引物5 ‘ -GTGG GATGAGTCCTGAGTAA-3 ‘群体2 引物5 ‘ -GTGCGATGAGTCCTGAGTAA-3 ‘7、如图4B所示,为将上述两亲本和两群体DNA扩增后的样品进行混合后的DNA电 泳图。M为IOObp DNA ladder,1为两群体和两亲本按照20 20 1 1比例进行混合。8、如图4C所示,为混合样品加So 1 exa标准测序接头(5 ‘ -pGATCGGAAGAGCGG TTCAGCAGGAATGCCGAG-3 ‘和 5 ‘ -ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3 ‘)后截取 500bp-550bp长度片段电泳图。M为50bp DNA ladder ; 1和2代表500bp_550bp长度片段。9、将截取的500bp_550bpDNA样品进行Solexa测序。10、如表2所示,对测序数据分析,获得的测序标签在分离群体中的数量分布。第 一列表示所获得的标记在两分离群体中数量的比率,第二列表示符合第一列条件的来自父 本的标记数量,第三列表示符合第一列条件来自母本的标记数量。表211、如图5所示,对测序数据进行分析,为多态性标记在白菜分离群体中的基因分 型结果图。分别显示在来自父本的多态性标记和来自母本的多态性标记,以及在基因组上 的位置信息。12、如表3所示,为对多态性标记的基因进行分析获得的性质相关候选基因及 interpro 注释。表3 表3描述了处在标签丰度差异集中区域的基因分部情况,选取表2中倍数大于5 的标签,且在基因组上连续出现5个标签以上的区域,定义为“目标性状相关候选区域”,然 后对该区域进行基因注释。其中,第一列为基因注释获得的基因名称,第二列为落在该基 因区域内的差异标签个数,第三列为相关标签的差异倍数,第四列为基因功能注释获得的 Interpro编号,第五列为对Interpro功能注释的描述。虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在 本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因 此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
权利要求
基于测序和BSA技术的性状相关的分子标记筛选方法,其基于分离群体分组分析法和经过降低基因组复杂度后的高通量测序法,对分离群体进行标记开发和性状关联分析,包括如下步骤1)分别制备两分离群体DNA样品,每个群体中的个体样品DNA等比例混合;2)对分离群体基因组的复杂性进行降低处理,获得复杂性降低的DNA样品;3)将复杂性降低后的分离群体DNA等比混合,利用高通量测序方式进行测序;4)比较两组群体DNA样品测序结果,获得序列标记,根据序列标记丰度差异,检测出与性状关联的标记。
2.如权利要求1所述的方法,其特征在于,该分离群体是植物、动物或微生物。
3.如权利要求1所述的方法,其特征在于,分离群体基因组DNA复杂性降低方法是任何 有选择性的减少基因组复杂度的方法,包括限制性内切酶酶切产物PCR扩增或酶切产物选 择性吸附。
4.如权利要求3所述的方法,其特征在于,分离群体基因组DNA复杂性降低方法包括如 下步骤1)分别制备两分离群体DNA样品和两亲本DNA样品,每个群体中的个体样品DNA等比 例混合;2)相同酶分别酶切分离群体DNA样品和两亲本DNA样品;3)用不同接头分别链接到四类样品的酶切产物上,分别进行PCR扩增纯化;回收特异 性长度片段样品,将四类样品按照比例混合,混合时满足以下条件A两群体样品比例按照 1 1;B两亲本样品比例按照1 1;进行测序;4)比较两亲本测序结果,找出多态性标记,比较两组群体DNA样品测序结果,找出性状 相关的分子标记及其亲本中的来源。
5.如权利要求4所述的方法,其特征在于,所述步骤2)使用的限制性内切酶满足以下 条件a)酶在基因组上的酶切位点分布尽可能均勻;b)选择特定长度的酶切片段能够保证序列标签的数量;c)选择特定长度的酶切片段避免落在基因组高度重复区。
6.如权利要求4所述的方法,其特征在于,所述步骤2)使用一种或者两种酶酶切。
7.如权利要求1 6任一项所述的方法,其特征在于,所述分离群体为两个经鉴定的性 状分离群体,包括F2、BCU DH目标性状分离的群体,其通过父母本杂交重组排除了父母本 中和目标性状无关的差异。
8.如权利要求1或4所述的方法,其特征在于,其中步骤4)还包括将分子标记定位到 基因组或BAC文库。
9.如权利要求1或4所述的方法,其特征在于,其中步骤4)还包括通过性状关联的高 密度分子标记获得性状相关的候选功能基因。
10.如权利要求4所述的方法,其特征在于,其中步骤4)还包括确定序列标签来自父本 或者母本。
11.如权利要求4所述的方法,其特征在于,所述每个群体样品测序深度为50倍以上, 所述每亲本测序深度为3倍以上。
12.如权利要求1或4所述的方法,其特征在于,所述步骤4)比较两组群体DNA样品测 序结果包括特异性长度片段多态性和单核苷酸多态性分子标记。
全文摘要
本发明提供一种性状紧密关联的DNA分子标记筛选方法,其核心技术是将超级分离群体分组分析法(BSA)和高通量测序技术相结合鉴定性状相关的DNA分子标记。利用生物信息学方法对不同物种基因组或BAC序列等数据进行参数训练,找出最优的标记测序方案,提高标记开发的效率。对分离群体分组测序结果进行关联分析,检测出和性状关联的分子标记并定位回基因组或BAC,通过高密度性状关联分子标记精细定位候选功能基因。该方法比较传统方法的优点在于通量大幅度提高,成本大幅度降低。可以对大群体进行标记定位,可直接确定标记与目标性状之间的连锁关系,关联分析的可靠性及准确性高,主要应用于作物分子育种等标记开发和基因定位方面。
文档编号C12Q1/68GK101886132SQ20101022540
公开日2010年11月17日 申请日期2010年7月12日 优先权日2009年7月15日
发明者王晓武, 郑洪坤 申请人:北京百迈客生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1