一种简便、高效且通用的植物叶绿体基因组测序方法与流程

文档序号:12645094阅读:9137来源:国知局
一种简便、高效且通用的植物叶绿体基因组测序方法与流程

本发明涉及生物科学领域,具体涉及一种简便、高效且通用的植物叶绿体基因组测序方法。



背景技术:

叶绿体是绿色植物细胞内所特有的细胞器,是细胞进行光合作用的场所,是一切能量的最初来源。叶绿体拥有自身的DNA和遗传体系,与生物进化与及细胞起源有很密切关系,叶绿体基因组是分子进化、系统发育和分子标记领域的重要研究对象,而获得目的生物的叶绿体基因组全序列,则成为该领域研究人员的首要目标。传统的植物叶绿体基因组测序通常采用通用引物长链PCR或是叶绿体基因组文库的叶绿体基因组测序策略,一般都要求大量新鲜材料、提取较高纯度的叶绿体DNA,操作步骤多,流程复杂,周期长,而且分离高纯度的叶绿体DNA需要根据不同植物物种的特性优化体系,难度较大,通用性差,往往成为叶绿体基因组测序的限制因素。



技术实现要素:

为解决上述问题,本发明提供了一种简便、高效且通用的植物叶绿体基因组测序方法。

为实现上述目的,本发明采取的技术方案为:

一种简便、高效且通用的植物叶绿体基因组测序方法,包括如下步骤:

S1、直接分离、纯化植物叶片的基因组DNA

为保证基因组DNA有足够的叶绿体DNA,将植株在强光下曝光2天后,选择较深绿色的叶片100mg,利用常规微量DNA提取方法(如CTAB)提取叶片的基因组DNA(不用预先分离叶绿体,再提取叶绿体DNA等繁琐的实验步骤),保存于低温备用;

S2、基因组DNA的高通量文库构建及测序

取上述提取的基因组DNA 5ug,采用超声波进行物理随机打断或者dsDNA水解酶进行酶切,然后用MinEITte PCR回收试剂盒(Qiagen,德国)回收片段化的叶绿体DNA,再将片段化的DNA末端补齐,并加上测序接头,用MinElute PCR回收试剂盒回收加上接头的DNA,电泳并利用胶回收试剂盒(Tiangen,China)回收200-500bp的片段,PCR扩增回收片段构建测序文库;测序文库构建和测序反应采用IIITmina公司的标准程序(IIIumina,USA),测序平台为IIIumina Hiseq4000,文库大小为300bp,测序策略为PE150(测序平台和策略可随意调整,适用于任意高通量测序平台);

S3、测序数据的预处理

测序后采用IIIumina HCS 1.1软件进行测序图像的转换及质量值计算,将图像信息转变为序列信息,然后去除载体序列、低质量序列获得可用于候选分析的测序数据;然后从NCBI下载其所收录的所有植物叶绿体基因组序列(ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plastid)作为参考序列,将获得的测序数据利用botwie软件进行基因组映射,具体命令为bowtie2--al-conc alconc--un-conc unconc--un unpaired--al aligned-x all_plant_chloroplast_sequence-1 clean_data_P1-2 clean_data_P2-sout.sam,将能比对上参考基因组的左右两端序列分别放入到mapped_reads_p1和mapped_reads_p2文件中,用于候选的叶绿体基因组组装(数据分析标准化);

S4、叶绿体基因组的组装和拼接

对上述步骤得到mapped reads数据集,利用soapdenovo软件对得到的reads进行从头拼装得到序列contigs,然后利用Pair-end关系对contigs进行连接,再用gapcloser进行补洞,得到scaffold序列,然后再用所有mapped reads映射(mapping)所有scaffold,再一次填补空缺(gap)位置;同时,选择与目标物种近缘关系最近的已测序的叶绿体为参考,利用MAQ软件将mapped reads对参考基因组进行映射(mapping),得到一条一致序列(Consensus sequence)。然后利用blat工具将拼接得到的scaffold序列按照参考基因组进行排序,空缺区域用consensus序列对应位置填补,得到叶绿体基因组的草图;最后,再用所有mapped reads映射(mapping)草图,补可能的空缺位置,最终得到叶绿体基因组精细图;(采用高通量测序可以十分经济的方式获得超高深度覆盖度的测序结果,拼接操作十分简单而且准确度高)。

S5、叶绿体基因组的验证和评估

首先,将组装获得的叶绿体基因组与多个近缘或者同一科的不同叶绿体基因组进行多序列比对,鉴定基因组的变异热点区域,判断可能出现拼接错误的位置;然后,根据拼接得到的叶绿体基因组,随机选择4-5处序列设计引物,重点针对可能出现错误的位置,PCR扩增后sanger测序,然后利用ClustalW软件将测序结果与拼接的叶绿体基因组序列进行比对,根据比对结果验证拼接的准确性和可靠性;

S6、叶绿体基因组的利用

利用在线分析软件DOGMA

(http://phylocluster.biosci.Ttexas.edu/dogma/)进行叶绿体的注释;利用MAUVE软件分析叶绿体基因组的结构差异,利用采用mVISTA工具对分析不同叶绿体全基因组的序列差异并寻找潜在的候选分子进化分析的位点;采用MEGA和PAML进行系统进化和分子选择分析。

与现有技术相比,本发明具有以下有益效果:

提供了简便、快速、高效、经济且通用的植物叶绿体基因组测序方法,为大规模开展植物叶绿体基因组测序奠定了基础,将极大地加速植物叶绿体的相关研究工作;不用分离、纯化叶绿体DNA而直接采用普通方法提取的基因组DNA作为模板,大大提高了方法的效率和通用性;不用复杂的PCR产物测序及克隆片段的拼接组装,直接利用高覆盖度测序后得到的reads从头拼装,大大改善了组装效果,减少了试验步骤,简化了试验流程,简便、快捷、准确且高效。

附图说明

图1为本发明实施例的流程图。

图2为本发明实施例中紫茎泽兰基因组DNA的分离纯化图;

图中:1,2为紫茎泽兰基因组DNA;M为分子量标准。

具体实施方式

为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明实施例提供了一种简便、高效且通用的植物叶绿体基因组测序方法,包括如下步骤:

S1、直接分离、纯化植物叶片的基因组DNA

为保证基因组DNA有足够的叶绿体DNA,将植株在强光下曝光2天后,选择较深绿色的叶片100mg,利用常规微量DNA提取方法(如CTAB)提取叶片的基因组DNA,保存于低温备用;

S2、基因组DNA的高通量文库构建及测序

取上述提取的基因组DNA 5ug,采用超声波进行物理随机打断或者dsDNA水解酶进行酶切,然后用MinEITte PCR回收试剂盒(Qiagen,德国)回收片段化的叶绿体DNA,再将片段化的DNA末端补齐,并加上测序接头,用MinElute PCR回收试剂盒回收加上接头的DNA,电泳并利用胶回收试剂盒(Tiangen,China)回收200-500bp的片段,PCR扩增回收片段构建测序文库;测序文库构建和测序反应采用IIITmina公司的标准程序(IIIumina,USA),测序平台为IIIumina Hiseq4000,文库大小为300bp,测序策略为PE150;

S3、测序数据的预处理

测序后采用IIIumina HCS 1.1软件进行测序图像的转换及质量值计算,将图像信息转变为序列信息,然后去除载体序列、低质量序列获得可用于候选分析的测序数据;然后从NCBI下载其所收录的所有植物叶绿体基因组序列(ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plastid)作为参考序列,将获得的测序数据利用botwie软件进行基因组映射,具体命令为bowtie2--al-conc alconc--un-conc unconc--un unpaired--al aligned-x all_plant_chloroplast_sequence-1 clean_data_P1-2 clean_data_P2-sout.sam,将能比对上参考基因组的左右两端序列分别放入到mapped_reads_p1和mapped_reads_p2文件中,用于候选的叶绿体基因组组装;

S4、叶绿体基因组的组装和拼接

对上述步骤得到mapped reads数据集,利用soapdenovo软件对得到的reads进行从头拼装得到序列contigs,然后利用Pair-end关系对contigs进行连接,再用gapcloser进行补洞,得到scaffold序列,然后再用所有mapped reads映射(mapping)所有scaffold,再一次填补空缺(gap)位置;同时,选择与目标物种近缘关系最近的已测序的叶绿体为参考,利用MAQ软件将mapped reads对参考基因组进行映射(mapping),得到一条一致序列(Consensus sequence)。然后利用blat工具将拼接得到的scaffold序列按照参考基因组进行排序,空缺区域用consensus序列对应位置填补,得到叶绿体基因组的草图;最后,再用所有mapped reads映射(mapping)草图,补可能的空缺位置,最终得到叶绿体基因组精细图;

S5、叶绿体基因组的验证和评估

首先,将组装获得的叶绿体基因组与多个近缘或者同一科的不同叶绿体基因组进行多序列比对,鉴定基因组的变异热点区域,判断可能出现拼接错误的位置;然后,根据拼接得到的叶绿体基因组,随机选择4-5处序列设计引物,重点针对可能出现错误的位置,PCR扩增后sanger测序,然后利用ClustalW软件将测序结果与拼接的叶绿体基因组序列进行比对,根据比对结果验证拼接的准确性和可靠性;

S6、叶绿体基因组的利用

利用在线分析软件DOGMA

(http://phylocluster.biosci.Ttexas.edu/dogma/)进行叶绿体的注释;利用MAUVE软件分析叶绿体基因组的结构差异,利用采用mVISTA工具对分析不同叶绿体全基因组的序列差异并寻找潜在的候选分子进化分析的位点;采用MEGA和PAML进行系统进化和分子选择分析。

实施例

紫茎泽兰叶绿体基因组的测序

紫茎泽兰基因组大小约为1.6g,我们以强光下曝光2-3天的紫茎泽兰深绿色的叶片提取基因组DNA,然后去提取的DNA 5ug构建Solexa测序文库,然后采用Hiseq2000测序平台,PE100进行测序,测序数据10G;然后从NCBI下载其所收录的所有植物叶绿体基因组序列(ftp://ftp.ncbi.nlm.nih.gov/refseq/release/plastid)作为参考序列,然后将高通量测序获得的数据,利用botwie软件进行映射(mapping),将能够mapping上的reads放入一个新的文件中,最终得到mapped reads数据集,P1和P2共计约800Mb的数据,然后利用soapdenovo软件对得到的reads进行从头拼装得到序列contigs,共得到3条scaffold和13条contigs,最长的序列长度达到了80853bp;同时,以紫茎泽兰的菊科近缘种向日葵叶绿体基因组(NC007977)为参考,利用MAQ软件进行比对,得到长度为151104bp的consensus序列;将上述得到的scaffold和contigs,利用blat工具将其与参考基因组进行对比,并根据参考基因组的对比位置将拼接片段排序,最终获得的获得目标叶绿体的草图;再用原始测序数据对叶绿体草图进行Mapping,进一步补平空缺片段,得到基因组完成图,长度为150698bp;最后,据拼接得到的叶绿体基因组,随机选择4处序列设计引物,然后PCR扩增后测序,然后将上述测序结果与拼接的叶绿体基因组草图序列进行比对,发现测序结果与组装结果完全一致,表明了拼装的准确性和可靠性。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1