同时进行前景DNA分子标记和背景DNA分子标记检测的方法及其应用

文档序号:31995704发布日期:2022-11-02 04:17阅读:312来源:国知局
同时进行前景DNA分子标记和背景DNA分子标记检测的方法及其应用
同时进行前景dna分子标记和背景dna分子标记检测的方法及其应用
技术领域
1.本发明涉及基因工程的技术领域,具体涉及一种同时进行前景dna分子标记和背景dna分子标记检测(fbi-seq)的方法及其应用。


背景技术:

2.在科研、农业育种和临床检测等领域,常常需要对生物个体的个别基因或全基因组的基因型进行检测。例如在动植物育种研究中,通过分析个体的基因型分析遗传信息在亲代之间的传递,筛选有利的基因型并淘汰非目标的基因型;随着越来越多的控制不同农艺性状的qtl和基因的定位和克隆,基于这些qtl或基因的遗传连锁标记或功能标记在分子标记辅助选择育种中被广泛使用。pcr(polymerase chain reaction)是分子生物学研究中的常用技术,基于pcr的分子标记方法为目的基因的筛选(前景标记检测)提供了成熟的工具。为了评估育种材料的血统,常常还需要对其进行全基因组基因型检测(背景标记检测)。
3.全基因组基因型检测的方法主要有dna芯片(dna array)和各种基于新一代测序技术(next generation sequence,ngs)的方法,如基因组靶向富集(guo et al.,2019)、多重pcr(onda et al.,2018)以及不同类型的简化基因组测序(restriction site-associated dna sequencing,rad-seq)等。在这些方法中,除了简化基因组测序是对基因组中的一部分(一般为1%-10%)片段进行随机测序外,其它三种方法都可以有针对性的对基因组中的任意目标片段进行检测,理论上可以基于这些方法开发可以同时进行前景和背景标记筛选的工具。但是,不同的研究者和不同的育种项目需要筛选不同的前景基因,因此,为了满足这些需求,需要对dna芯片、基因组靶向探针或多重pcr引物进行重新设计和生产,其前期过高的成本使得这样的策略在实践中难以实现。此外,飞行时间质谱生物芯片系统(sequenom massarray)和竞争性等位基因特异性pcr(kompetitive allele specific pcr)(ertiro et al.,2015)也是基因型检测的常用方法,但这两种方法更适用于样品量大而检测位点数量为数十个的项目,不适合做全基因组分子标记检测。
4.因此,目前仍然缺少有效的工具可以同时对样品进行前景标记和全基因组范围的背景标记筛选。例如,华大基因在对y58s不育系进行粒型改良时,先利用一个indel标记筛选前景基因,然后再利用rad-seq来进行筛选背景(侯军亮等,2018)。因此,开发可以在不同生物中通用的、能够同时进行前景和背景筛选的新技术有重要的应用价值。


技术实现要素:

5.有鉴于此,本发明致力于研究引物-模板不完全匹配的pcr扩增在检测基因背景标记中的应用,开发了可以在不同生物中通用的,能够同时进行前景dna分子标记和背景dna分子标记检测的方法(fore-and background integrated genotyping by sequencing,简称fbi-seq)。
6.本发明第一方面提供了一种同时进行前景dna分子标记和背景dna分子标记检测
(fbi-seq)的方法,包括以下步骤:
7.(a)根据样品基因组序列设计目的基因的pcr引物(fbi-sp),并在引物的5’端添加用于高通量测序的dna元件;
8.(b)打断样品基因组dna,并在dna片段末端添加dna接头;
9.(c)利用fbi-sp引物进行pcr扩增,扩增过程中同时存在fbi-sp引物与模板完全匹配和不完全匹配引发的扩增产物;
10.(d)pcr产物测序后统计数据分析,数据分析包括引物-模板完全匹配和不完全匹配扩增得到的遗传信息。
11.步骤(a)中,对fbi-sp引物的5’端添加的dna元件不作具体限定,可以根据测序平台的不同选择不同的dna元件,例如可以根据illumina、华大基因、thermofisher等测序平台添加相应所需的dna元件。
12.在本发明一种优选实施方式中,fbi-sp引物的5’端添加用于illumina平台测序的dna元件。
13.步骤(b)中,打断样品基因组dna的方法不作具体限定。例如可以使用转座酶复合体打断dna、超声波打断dna、限制性内切酶酶切dna等方式。
14.dna片段末端添加dna接头可以根据打断dna的方法进行选择,例如利用转座酶复合体打断dna并连接dna接头;超声波打断dna,用连接酶连接dna接头;限制性内切酶酶切,用连接酶连接dna接头。
15.步骤(c)中,fbi-sp引物与模板的完全匹配为结合目标基因,扩增获得目标基因的pcr产物,用于检测前景基因。fbi-sp引物与模板的不完全匹配为结合基因组上与目标基因具有序列相似性的位点,扩增获得错配的pcr产物,用于检测背景基因。
16.进一步,在pcr扩增过程中不抑制和/或提高引物-模板不完全匹配。
17.进一步,在pcr扩增过程中增加引物浓度,和/或升高退火温度,和/或改变循环次数。
18.在本发明一种实施方式中,在pcr扩增过程中增加引物浓度至400nm,和/或利用60℃和65℃两种退火温度分别扩增,和/或改变第一轮pcr的循环次数为10个65℃退火+3个60℃退火,第二轮pcr的循环次数为8个60℃退火。
19.pcr反应过程中,引物在dna模板上退火/配对,然后dna聚合酶在引物的3’端开始新的dna链的合成。引物在dna模板上的退火/配对符合dna变性-复性的动力学,因此,在理论上和实际上,都会存在引物-模板的完全匹配(primer-template perfect annealing,ptpa)和引物-模板不完全匹配(primer-template mismatched annealing,ptma)。为了避免ptma引起的非特异性扩增对实验的干扰,研究者常用增加引物长度、提高pcr循环过程中的退火温度、优化pcr反应体系等方法降低由ptma引发的非特异性扩增。
20.本发明的申请人研究发现在lm-pcr过程中,引物在基因组模板上的不完全匹配(ptma)可以引发对基因组上数以万计位点的稳定、可重复的扩增,ptma扩增位点在染色体上分布较为均匀,因此可以做为全基因组的背景标记。
21.本发明克服了技术偏见,不但没有按照常规手段去降低由ptma引发的非特异性扩增,反而倾向于提高ptma出现的几率,并进一步验证了ptma引发的扩增是稳定且可重复的,将ptma引发的非特异性扩增作为全基因组背景标记,实现了同时检测基因前景标记和背景
标记,简化了实验流程,提高了标记检测的准确性,降低了成本,具有重要的应用价值。
22.本发明开发的fbi-seq利用ngs对lm-pcr过程中由ptpa和ptma引发的众多pcr扩增产物进行高通量测序,fbi-seq仅仅需要一条不需要特殊设计和优化的普通引物即可实现对前景标记和数万个位点的背景标记的同时检测,且能够很方便的转换到不同的前景基因和不同的物种,尤其是基因组信息积累较少的物种上,在全基因组基因型检测中具有重要的应用前景。
23.与dna芯片、基因组靶向富集和多重pcr相比,fbi-seq仅仅需要一条引物,没有昂贵的前期成本,也无需大批量样品来摊薄用户单个样品的成本,因此,fbi-seq可以非常方便地用于不同物种、任意样品数量的不同前景基因和全基因组背景基因筛选。
24.在本发明一种实施方式中,利用lm-pcr(ligation-mediated pcr,连接介导的pcr,也叫adaptor ligation pcr,接头连接pcr)中引物-模板不完全匹配的pcr扩增,结合ngs(next generation sequencing,第二代测序)同时检测样品前景标记和背景标记。
25.连接介导的pcr(ligation-mediated pcr,lm-pcr)是一种pcr方法的变体,常用于分离一段已知序列的旁侧序列(flanking sequence),在pcr过程中,研究者一般使用嵌套引物(nested primer)来降低非特异性扩增的干扰。
26.利用lm-pcr过程中的ptpa和ptma,将由ptpa引发的pcr扩增产物用于前景标记筛选,由ptma引发的pcr扩增产物用于背景标记筛选,并发挥ngs可以对众多产物同时进行测序的优势,同时对ptpa和ptma的pcr产物进行测序,实现了利用一条根据待检前景基因的序列设计的引物同时对样品进行前景和全基因组背景筛选。
27.进一步,所述fbi-seq方法包括以下步骤:
28.(1)打断样品基因组dna:利用转座酶复合体打断样品基因组dna,dna接头加在打断后的dna片段上;
29.(2)第一轮pcr反应:以primer 2与fbi-sp为引物进行扩增,扩增过程中同时存在fbi-sp引物与模板完全匹配和不完全匹配引发的扩增,不抑制和/或提高引物-模板不完全匹配;富集获得完全匹配的含有目标基因的dna片段,以及不完全匹配引发的扩增dna片段,得到第一轮pcr产物;
30.所述primer 2结合dna接头;所述fbi-sp引物与模板的完全匹配结合目标基因,其扩增产物用于检测前景基因;所述fbi-sp引物与模板的不完全匹配结合基因组上与目标基因具有序列相似性的位点,其扩增产物用于检测背景基因;
31.(3)第二轮pcr反应:以第一轮pcr产物为模板,利用引物primer 1和引物ppmi7进行pcr扩增,目的pcr产物片段的两端被加上测序平台测序时所需的接头序列;
32.所述primer 1结合fbi-sp引物的5’端;ppmi7结合primer 2的5’端。
33.(4)富集片段测序:富集的片段经片段选择后测序,数据分析获得引物-模板完全匹配和不完全匹配扩增产物的遗传信息。
34.在本发明一种具体实施方式中,所述fbi-seq基因检测方法,参照图1包括以下步骤:
35.(1)打断样品基因组dna:利用tn5转座酶复合体打断样品基因组dna,同时,tn5接头(adaptor1和adaptor2)作为tn5转座酶的反应底物,tn5接头在tn5切割dna的同时被连接到断点处,adaptor2将做为后续pcr反应时其中一个引物(primer 2)的结合位点;
36.所有打断后的dna片段分为含有目标基因的片段和不含目标基因的片段;
37.(2)第一轮pcr反应:第一轮pcr反应以引物primer 2与fbi-sp配对进行扩增,引物primer 2和fbi-sp在5’端都包含有illumina测序需要的dna元件序列;
38.fbi-sp在基因组模板中除了可以在引物完全匹配位点(ptpa)扩增外,还可以从数以万计的不完全匹配位点(ptma)扩增;
39.经过第一轮pcr,包含目标位点的dna片段通过pcr扩增被富集,pcr产物的一端为fbi-sp引物(ptpa扩增产物)或其一部分(ptma扩增产物),此端被加上illumina测序平台进行dna测序时所需要的p5端的部分接头序列,另外一端是illumina测序平台进行dna测序时所需要的p7端的接头序列;
40.富集获得fbi-sp引物完全匹配扩增的含有目标基因的dna片段,以及不完全匹配扩增的dna片段;
41.(3)第二轮pcr反应:以第一轮pcr产物为模板,利用引物primer 1(结合fbi-sp引物的5’端)和ppmi7引物(结合primer2的5’端)进行pcr扩增,目的pcr产物片段的两端被加上illumina测序平台进行dna测序时所需要的p5和p7端的全部接头序列;
42.(4)富集片段测序:经过两轮pcr扩增,fbi-sp引物的ptpa和ptma位点附近的序列得到富集,对所富集的dna选择长度为300-700bp的片段进行高通量测序,得到的扩增片段中包含的snp信息便反映基因组相应区域的dna多态性。
43.进一步,所述primer 2引物的5’端为ppmi7序列,中间为index序列(通常为6-10个随机碱基n),3’端为tn5接头的互补序列;和/或
44.所述primer 1的3’端为ppmi5序列,中间为index序列(通常为6-10个随机碱基n),5’端为tn5接头的互补序列。
45.上述fbi-seq基因检测方法将传统的lm-pcr技术与高通量测序技术相结合,简化了传统的lm-pcr技术的实验流程,而且巧妙地利用了引物与模板的不完全匹配引发的扩增,提高了lm-pcr的效率。该方法操作简单,仅仅需要一条前景标记的引物,非常方便地用于不同物种的不同前景基因筛选,也可以同时对不同样本进行前景和全基因组背景检测。
46.fbi-seq可以实现利用一条引物扩增出几万个基因位点,因此其它可以对几个到几万个位点进行基因型检测的技术可以做的,比如芯片、多重pcr,简化基因组测序、全基因组测序等,fbi-seq都可以做到。
47.进一步,在本发明提供的技术方案的基础上,所述步骤(c)中还包括文库构建引物的随机扩增产物。所述步骤(d)中数据分析还包括文库构建引物的随机扩增获得的遗传信息。
48.对于引物-模板不完全匹配的pcr扩增或随机扩增获得的遗传信息,通常情况下本领域技术人员都会舍弃该部分数据,但本发明恰好相反,在分析数据时把不完全匹配的pcr扩增和随机扩增获得的遗传信息作为全基因组背景标记,完全是出乎预料的,能够节省实验流程,无需额外单独筛选背景标记。
49.对于如何分析基因检测的数据,此处不作具体限定,可以根据具体使用的方法而定,但无论是何种分析数据的方法,均包括分析引物-模板不完全匹配的pcr扩增获得的遗传信息和/或随机扩增获得的遗传信息,所述遗传信息包括但不限于例如snp标记、rapd标记、ssr标记、sslp标记、aflp标记等。
50.本发明第二方面提供了上述fbi-seq方法在全基因组检测中的应用。
51.进一步,包括在生物基因型检测,和/或生物遗传病的诊断或辅助诊断,和/或扩增已知序列旁侧的未知序列中的应用。
52.示例性地,fbi-seq方法在生物基因型检测中的应用,可以包括检测动植物,或微生物等有生命且具有dna序列的所有生物的基因型,例如可以鉴定基因型的类型,或者鉴定基因型的纯合情况。
53.示例性地,fbi-seq方法在遗传病的诊断或辅助诊断中的应用,可以包括人类(或其它动植物)遗传病的诊断或辅助诊断,例如诊断基因突变、基因重组等原因造成的遗传病。
54.进一步,所述fbi-seq方法在遗传育种中的应用;优选包括选育优良品种、种子真假鉴定、种子纯度鉴定、亲本溯源。
55.引物-模板不完全匹配的pcr扩增产物测序获得的基因信息作为背景标记,可以用于与亲本的基因组数据进行比对,用于筛选具有优良性状且背景基因组符合预期的优良动植物品种;或者用于鉴定种子真假和纯度,降低农作物品种鉴定成本;或者用于亲本溯源,更直观的判断待测品种来源于哪种亲本。
56.进一步,在本发明提供的技术方案的基础上,还包括引物-模板不完全匹配的pcr扩增在亲子鉴定、司法鉴定、食品安全检测中的应用。
57.dna遗传标记的检测和分析是亲子鉴定的理论基础,在pcr扩增过程中,除某些特定完全匹配扩增的遗传标记位点比对外,引物-模板不完全匹配的pcr扩增反映出的背景遗传标记也可以用来直接与父母样品的基因组做比对,从而判断是否存在亲子关系。
58.司法鉴定中,对检材样品dna分子做出个体特征分析与判断能够作为法医鉴定物证,本发明能够同时进行前景dna分子标记和背景dna分子标记检测,因此能够更加准确全面地检测检材样品dna分子基因信息,更快速准确的获得dna信息。
59.食品安全检测领域中,涉及到一些转基因或细菌病毒污染性食品,可采用本发明同时进行前景dna分子标记和背景dna分子标记检测的方法,不仅能够检出不合格的食品,依据基因数据库还有可能能追溯食品来源背景。
60.本发明第三方面提供了试剂和/或试剂盒,其包括所述的fbi-seq方法中使用的组分;
61.进一步,所述组分包括包括fbi-sp、primer 1、primer 2、ppmi7引物,以及任选地dna元件和dna接头。
62.进一步,所述组分还包括pcr扩增中常用的试剂和/耗材,例如dna聚合酶及其缓冲液、n5xx、n7xx等。
63.本发明采用上述技术方案具有以下有益效果:
64.(1)本发明提供的fbi-seq方法,克服了技术偏见,将ptma引发的非特异性扩增作为全基因组背景标记筛选,在分析数据时把不完全匹配的pcr扩增获得的遗传信息作为全基因组背景标记,无需额外单独筛选背景标记,节省实验流程,实现了同时进行前景标记筛选和背景标记筛选,不仅提高了检测的效率,也提高了检测的准确性,简化了实验流程,降低了成本,具有重要的应用价值。
65.(2)本发明提供的fbi-seq检测方法,利用ngs对lm-pcr过程中由ptpa和ptma引发
的众多pcr扩增产物进行高通量测序,实现了利用一条特异性扩增待检前景基因的引物对样品进行前景和全基因组背景筛选的目的,可以非常方便地用于不同物种的不同前景基因和全基因组背景基因筛选。
66.(3)本发明提供了fbi-seq方法在全基因组检测中的应用,可以用于遗传育种、亲子鉴定、司法鉴定、食品安全检测等领域中,应用范围广,具有重要的应用价值。
附图说明
67.图1所示为本发明fbi-seq的实验流程示意图。
68.图2所示为实施例一中fbi-seq文库的测序数据在基因组浏览器上的分布图。
69.图3所示为实施例一中fbi-pi2-1引物在基因组上不同soft-clipped base的read数量,柱状图表示不同个数碱基的ptma的read数量。
70.图4所示为实施例一中fbi-pi2-1引物在基因组上ptma位点的碱基组成图(引物结合位点碱基构成图)。7soft-clipped bases代表fbi-pi2-1引物中,来自pi2基因的部分,其5’有7个碱基与基因组由于没有同源关系,而被ngs序列比对软件截掉(soft-clipped),统计了7、8、9、10、12五种情况的引物ptma位点的碱基组成。
71.图5所示为实施例二中fbi-qsh1、fbi-alk、fbi-qgl3不同引物的ptpa和ptma扩增情况。
72.图6所示为实施例三中5+n循环条件的两轮pcr的富集倍数。
73.图7所示为实施例三中10+n循环条件的两轮pcr的富集倍数。
74.图8所示为实施例三中不同循环条件与pcrfree数据比较图。
75.图9所示为实施例四中茄子的三次技术重复中的共有tag标签。
76.图10所示为实施例五中双引物(fbi-gw5和fbi-pstol1)fbi-seq中,两条引物的ptpa扩增片段在基因组浏览器上的分布图。
77.图11所示为实施例六中一个水稻回交育种材料的基因型检测图。
78.图12所示为实施例七中引物不同浓度的两轮循环富集倍数。
具体实施方式
79.除非另有定义,本发明中所使用的所有科学和技术术语具有与本发明涉及技术领域的技术人员通常理解的相同的含义。
80.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
81.下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
82.下面结合具体实施例详细描述本发明,这些实施例用于理解而不是限制本发明。
83.本发明专利实施例中,所用的测序平台为illumina,将相关引物序列替换后,也可以用于华大基因、thermofisher等其它测序平台。
84.实施例一验证fbi-seq能够同时检测基因前景标记和背景标记
85.实验目的:利用一条来自水稻抗稻瘟病基因pi2的引物,实现对pi2基因位点(前景
标记)和背景标记的同时扩增。
86.实验过程:利用水稻品种蜀恢498(已经有高质量的基因组序列,参见do1:10.1038,http://www.mbkbase.org/rice/help/download.html)为材料,利用一条来自水稻抗稻瘟病基因pi2的引物fbi-pi2-1,测试fbi-seq方法的可行性,参照图1的实验流程。
87.1.水稻材料的种植、dna提取和定量
88.将蜀恢498的种子按常规方法浸种、催芽后播种于铺有滤纸的培养皿中,置于光照培养室生长7天左右,然后取2厘米左右的叶片,利用ctab法提取dna,然后利用基于荧光染料的方法,如dsdna high sensitivity kit对dna进行准确的浓度测量。
89.2.利用转座酶复合体打断水稻基因组dna并在将dna接头加在打断后的dna上。本实施例中,使用南京诺唯赞生物科技有限公司的truepreptm dna library prep kit v2 for试剂盒中的tn5转座酶复合体tte mix v50。按表1成分在灭菌pcr管中配置反应体系,然后将反应管置于pcr仪中,运行表2反应程序。
90.表1.转座酶复合体反应体系
[0091][0092]
注:x依据dna的浓度而定,dna总量是固定的20ng。
[0093]
表2反应程序
[0094][0095]
3.反应结束后,加入1μl百分比浓度为1.3%的十二烷基硫酸钠终止反应。
[0096]
4.进行第一轮lm-pcr反应,扩增pi2基因位点及fbi-pi2-1引物的ptma位点。
[0097]
fbi-pi2-1引物序列如下:
[0098]
(seq id no.1),本实施例采用illumina测序,斜体部分为illumina测序所需dna元件,下划线部分为来自水稻pi2基因的序列,文中其它同类引物均采用这种描述方式。
[0099]
primer 2引物序列:2引物序列:(seq id no.2)(其中直线下划线部分为ppmi7序列,i7为8个随机碱基n组成的index序列,波浪下划线部分为dna接头的互补序列)。
[0100]
pcr反应操作如下:(1)将pcr管置于冰上,按表3体系配置如反应:
[0101]
表3第一轮pcr配置体系
[0102][0103]
*trueprep
tm index kit v2 for(vazyme#td202)中提供8种n5xx和12种n7xx,可根据样品数量和index搭配策略自行选择。
[0104]
(2)使用移液器轻轻吹打5次充分混匀;
[0105]
(3)样品放置pcr仪中,程序如表4所示:
[0106]
表4第一轮pcr的反应程序
[0107][0108]
6.利用南京诺唯赞生物科技有限公司的vahts dna clean beads,按其试剂说明书纯化pcr扩增的产物,溶于20μl超纯水中。
[0109]
7.对第一步pcr产物进行第二轮pcr扩增,进一步富集目标片段,并加上测序所需的dna序列元件和index。
[0110]
primer 1引物序列:1引物序列:(seq id no.3)(其中直线下划线部分为ppmi5序列,[i5]为8个随机碱基n组成的index序列,波浪下划线部分为dna接头的互补序列)。
[0111]
ppmi7引物序列:5
’‑
caagcagaagacggcatacgagat-3’(seq id no.4)。
[0112]
pcr反应操作如下:将pcr管置于冰上,按表5配置反应体系:
[0113]
表5第二轮pcr配置体系
[0114][0115]
使用移液器轻轻吹打充分混匀,样品放置pcr仪中,程序如表6所示:
[0116]
表6第二轮pcr的反应程序
[0117][0118]
8.将pcr扩增的产物进行纯化
[0119]
利用南京诺唯赞生物科技有限公司的vahts dna clean beads,按其试剂说明书纯化pcr扩增的产物,融于20μl超纯水中。
[0120]
9.片段选择
[0121]
fbi-seq的扩增产物为200-1000bp的dna片段,需要对适合测序范围的dna片段进行分选。本实施例利用sage science公司的sage elf仪器对fbi-seq文库进行片段选择,先将文库与6
×
loading buffer混合均匀,利用2%琼脂糖凝胶dna回收胶盒(cassette),选择时间模式,来回收约460~600bp大小的片段。
[0122]
10.文库质量检测
[0123]
本实施例利用agilent bioanalyzer 2100进行文库质控。
[0124]
12.测序
[0125]
根据所回收文库的浓度,按照illumina相关仪器的要求,上机测序。
[0126]
13.数据分析
[0127]
(1)利用二代测序数据比对软件bwa-mem将fbi-seq的250mb测序数据定位到水稻品种蜀恢498的参考基因组序列上后,结果发现fbi-seq文库的测序数据可以分为三类(图2):第一,包含与fbi-pi2-1引物完全匹配的read,这一部分dna片段由引物的ptpa引发的扩增产物,共有22条,总数据量约6.5kb,在250mb总的测序数据中的比例几乎可以忽略不记。第二,包含与fbi-pi2-1引物不完全匹配的read,这一部分dna片段是由引物的ptma引发的
扩增产物,占测序数据的32%;第三,其它不包含fbi-pi2-1引物序列,在fbi-seq文库构建过程中被随机扩增出来的read,占测序数据的68%。
[0128]
(2)ptpa扩增的确是由fbi-pi2-1引物在基因组上的完全匹配引发的。
[0129]
分析了本实施例中,fbi-pi2-1引物在其完全匹配位点扩增出的的read分布情况,发现该位点一共有19条read,全部起始于基因组上fbi-pi2-1引物的位置(图2),说明在fbi-seq文库制备过程中,fbi-pi2-1引物在基因组上的完全匹配可以引发目标位点的扩增。
[0130]
(3)ptma扩增的确是由fbi-pi2-1引物在基因组上的不完全匹配引发的。
[0131]
分析了本实施例中,满足以下三个条件的read的分布特点:i)某一位点有3条以上read;ii)这些read一端起始于同一位置;iii)这些read另外一端终止于不同的位置(转座酶随机打断dna且连接上了dna接头的位点),这些read在igv基因组浏览器上形成具有如图2中(b)所示的分布特点,形成一个序列标签(tag)。根据参考基因组的序列,提取了这些标签的起始位置的序列,统计不同碱基长度的soft-clipped的read的数量(图3),并统计了这些序列的碱基组成,发现它们具有5-15bp的序列与fbi-pi2-1引物序列具有同源性(图4),说明,这一类read是的确是由fbi-pi2-1引物在基因组上的不完全匹配引发的。我们一共得到了23,163个这样的tag,进一步分析表明,这些tag在全基因组水平上分布较为均匀,可以用于背景基因型的鉴定。
[0132]
(4)利用ptma扩增的read对水稻进行全基因组基因型检测
[0133]
提取了蜀恢498的fbi-seq数据,如数据分析步骤(3)所述的read,以水稻品种日本晴的基因组序列为参考,得到了蜀恢498的全基因组snp。为了验证该基因型分析结果的准确性,对蜀恢498进行了约50
×
的全基因组测序,并根据全基因组测序的结果,以日本晴的基因组序列为参考,得到了蜀恢498的全基因组snp。两者比较的结果显示,fbi-seq得到的25,258个snp中,有25,232个(99.9%)与全基因组测序的结果是一致的。
[0134]
(5)利用随机扩增的read对水稻进行全基因组基因型检测
[0135]
将全基因组覆盖度低于或等于3的read,以水稻品种日本晴的基因组序列为参考,得到了蜀恢498的全基因组snp,并将其与根据全基因组测序得到的snp进行了比较,两者比较的结果显示,fbi-seq数据中根据这样的方法得到的49,495个snp中,有49,445个(99.9%)与全基因组测序的结果是一致的。
[0136]
(6)ptma和随机扩增的read对水稻进行全基因组基因型检测的结果可以互相验证,提高检测结果的准确性。
[0137]
综上,fbi-seq文库中的ptpa扩增的read可以对前景标记进行直接检测;同时,其ptma扩增的read和随机扩增的read都可以对全基因组背景进行独立检测,此时,ptma扩增的read可以对一个遗传群体中不同个体的相同位点进行检测,其检测结果相当于芯片、靶向富集、简化基因组测序或多重pcr的结果,而随机扩增的read的检测结果本质上是全基因组低覆盖度测序。ptma的扩增本质上是lm-pcr扩增;而随机扩增的本质是全基因组重测序文库扩增,虽然两者在同一个反应中进行,但两者是相互独立的,两者的结果可以互相验证;利用根据背景检测结果做出来的bin map也可以验证前景标记检测的结果,提高前景检测的准确性(见实施例六)。因此,fbi-seq技术通过一次文库制备,实现了对前景标记和背景标记的同时检测,且相当于对前景标记和背景标记都检测了两次,不仅提高了检测的效
率,也提高了检测的准确性。
[0138]
实施例二不同引物都具有利用ptma引发扩增的能力
[0139]
实施例一中,利用引物fbi-pi2-1在fbi-seq中的ptpa和ptma引发的扩增,成功实现了对前景标记和背景标记的同时检测,且相当于对前景标记和背景标记都检测了两次。
[0140]
为了验证fbi-seq中ptma引发的扩增能力是否是不同引物都具有的能力,根据水稻品种蜀恢498基因qsh1、alk、qgl3序列,分别设计了3条用于fbi-seq的引物,它们是fbi-qsh1、fbi-alk、fbi-qgl3,参照实施例一的操作流程进行fbi-seq文库构建、测序和生物信息学分析。
[0141]
fbi-qsh1引物序列(seq id no.5):
[0142]
fbi-alk引物序列(seq id no.6):
[0143]
fbi-qgl3引物序列(seq id no.7):no.7):
[0144]
实验结果显示:利用这些引物进行fbi-seq时,它们都具有ptpa和ptma引发扩增的能力。分析测序数据发现,在500mb数据中,通过引物fbi-qsh1、fbi-alk、fbi-qgl3的ptpa产生的reads数分别为:86,155,74条(图5中左侧为三个引物的ptpa扩增read在基因组浏览器上的分布图);通过这些引物的ptma产生的read数分别478,421、287,980、597,539条(图5中右侧为三个前景的ptma扩增read在基因组浏览器上的分布图)。
[0145]
实施例二中,利用3种不同的引物在fbi-seq中的皆可引发ptpa和ptma的扩增,成功实现了不同引物对前景标记和背景标记的同时检测,说明不同引物都具有利用ptma引发扩增的能力。这样,本发明开发的fbi-seq仅需更换一条引物,就可以实现对不同基因的前景和全基因组背景检测,而同类技术则需要对芯片、靶向富集探针和多重pcr的引物进行重新设计、生产和优化。
[0146]
实施例三改变pcr扩增条件提高ptma扩增几率
[0147]
为了优化pcr扩增条件,提高ptma的扩增效率,根据水稻品种蜀恢498的基因序列,我们重新设计了fbi-gw5和fbi-pstol1两种前景目标引物,利用这两个前景引物来优化扩增的条件。参照实施例一的操作流程框架进行pcr扩增实验。
[0148]
fbi-gw5引物序列(seq id no.8):no.8):
[0149]
fbi-pstol1引物序列(seq id no.9):no.9):
[0150]
将第一轮pcr中退火温度65℃设置为5个循环,退火温度60℃设置两个梯度:10,15个循环,结果显示,5个65℃退火+10个60℃退火的循环可以扩增出1008.0ng的pcr产物,而5个65℃退火+15个60℃退火的循环仅能扩增出777.0ng的pcr产物,pcr产物总量没有随循环数的增加而增加,说明循环数设置过多,已经超过了pcr扩增过程的指数扩增时期。同时,1000ng的pcr产物超过了需要的量,而且,过度扩增会影响文库构建的质量。
[0151]
为了更进一步优化pcr反应条件,将第一轮pcr中退火温度65℃设置为5个循环,退
ssp.sesquipedalis)两份样品进行了三次技术重复的fbi-seq检测。
[0164]
结果显示,这2条根据水稻的基因组序列设计的引物都可以应用于茄子和长豇豆的全基因组基因型检测。如图9所示,是fbi-pi2-3引物在茄子dna上的三次技术重复结果,都有大量的ptma产生的tag。且三次技术重复存在相同位点的ptma。分析结果还显示,fbi-waxy引物在茄子样品的三次重复中产生的tag数量分别为43,314、43,383、59,310,长虹豆分别产生53,100、53,546、60,016个。
[0165]
通过实施例四的结果确定了fbi-seq可以利用任意一条引物即可实现对不同物种的全基因组检测,产生的ptma可以用于背景基因组的检测。
[0166]
实施例五同时检测两个前景基因标记和其它背景标记
[0167]
有时,育种家需要检测多个目标基因(前景标记),实现多个前景基因与背景基因一起筛选。利用实施例三中设计的fbi-gw5和fbi-pstol1两个引物,进行两引物的共同筛选实验。利用实施例三中优化得到的fbi-seq实验方法,完成两个前景基因标记的文库构建并测序。通过相同数据分析方法,发现两个前景位点皆得到大量的富集(图10)。
[0168]
进一步统计了ptma的tag数量,如下表7所示,展示了不同测序数据量下,两引物的ptma标签的数量。
[0169]
表7不同数据量下的tag数
[0170][0171]
通过实施例五的结果,确定了本发明提供的fbi-seq可以用于同时检测两个前景基因以及上万个背景位点。
[0172]
实施例六ptma扩增在遗传育种中的应用
[0173]
为了进一步说明fbi-seq可以对育种样品进行前景和全基因组背景检测,以一个水稻回交群体为例,说明了fbi-seq可以对育种样本进行前景和全基因组背景检测。
[0174]
利用实施例三中优化的fbi-seq实验条件,使用两个回交的bc2f4水稻群体(wyg33
×
ve6219和cng1
×
ve6219,wyg33和cng1均易感稻瘟病,而ve6219在6号染色体上含有水稻抗稻瘟病基因pi2)来测试利用fbi-seq同时进行前景和背景基因检测的能力。
[0175]
我们利用抗病基因pi2的序列设计了fbi-pi2-2引物(seq id no.12)利用fbi-seq对9个单株进行了pi2前景基因的筛选和背景筛选,最终得到导入片段较小、背景回复率高的育种株系。
[0176]
我们通过对得到的亲本和子代数据call snp,利用bin map判断子代株系的重组断点和背景信息,结果显示,fbi-seq可以成功地对每个单株进行前景和背景基因型检测(图11)。并且,对于前景基因,fbi-pi2-2的ptpa扩增得到的read可以直接检测pi2基因的基因型,此外,根据ptma扩增得到的read而绘制的bin map图也可以进一步判断pi2基因位点所在的区域是来自供体亲本还是受体亲本,相当于对pi2基因进行了两次检测,可以提高检测的准确度。
[0177]
通过实施例六的实验结果表明,fbi-seq方法可以对育种样本进行前景和全基因组背景的检测,高效完成育种工作。
[0178]
实施例七 同时检测六个前景基因标记和背景标记
[0179]
有时,育种家需要同时检测更多的前景基因,例如控制产量、抗病性、食味品质、抗倒伏等。测试了在fbi-seq中利用两条引物同时进行两个前景基因的检测之后,将前景基因的数量提高到了6个,期望达到同时检测更多前景基因的目的。pcr体系中,多个引物存在时会互相产生干扰,导致扩增效率过低,所以本实施例中尝试了降低每条引物的浓度,设置了100nm和400nm两种引物终浓度试验,同样的采用q-pcr对两轮产物进行检测,计算第一轮和第二轮pcr产物中,前景基因片段的富集程度。
[0180]
为了降低工作量,只随机从6个前景基因中挑选了3个,进行富集倍数检测。实验结果显示,在第一轮pcr时,100nm的引物浓度得到的pcr产物总量大约是400nm的3倍,说明引物浓度高时,并没有得到更多的pcr产物,反而由于引物之间的互相干扰,影响了pcr扩增。
[0181]
q-pcr的结果显示,引物浓度为100nm和400nm时,前景基因片段都有不同程度的富集(图12),但是,两者相比,引物浓度为400nm的时候,前景基因片段的富集程度更高。和实施例五中两引物实验相比,当有6个前景引物时,实验中不论是什么浓度,整体的富集效率均低于两引物的情况,但是前景仍有明显的富集,并且可以满足后续的分析要求,因此,我们最终确定在做6个前景基因的检测时,引物终浓度保持在400nm。
[0182]
测序结果也显示,6个前景基因的片段得到了富集。并且,本实施例统计了6个前景的由不同浓度的引物分别扩出的ptma的read数量,如下表8所示。
[0183]
表8 6个前景的ptma的read情况
[0184][0185]
基于以上的所有实验结果,我们确定了fbi-seq可以完成多个前景的共同富集,并且产生ptpa和ptma引发的扩增,完成了对fbi-seq方法的优化及总结。
[0186]
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1