利用高通量测序精确测定线粒体dna高频和低频突变的方法

文档序号:523912阅读:1182来源:国知局
利用高通量测序精确测定线粒体dna高频和低频突变的方法
【专利摘要】本发明属于基因组学【技术领域】,具体为一种利用高通量测序精确测定线粒体DNA高频和低频突变的方法。本发明通过设计一组线粒体DNA特异的引物,采用滚环复制从总DNA中富集线粒体DNA,并通过特定的限制性内切酶进一步富集线粒体DNA,然后构建测序文库并进行高通量测序,并开发特定的数据分析流程,从而达到测定线粒体基因组中高频率及低频率变异的目的。其最低可检测频率低至0.3%的突变位点。
【专利说明】利用高通量测序精确测定线粒体DNA高频和低频突变的方法
【技术领域】
[0001]本发明属于基因组学【技术领域】,具体涉及一种利用高通量测序(下一代测序、第二代测序、深度测序)技术测定真核生物线粒体DNA中高频率及低频率突变的方法。
【背景技术】
[0002]线粒体是细胞中提供能量的重要细胞器,在生物体能量转换和新陈代谢中处于核心地位。人体细胞中线粒体DNA(脱氧核糖核酸)的突变或缺失会引起氧化磷酸化和能量供应的异常,并进而引起近150种人类疾病的发生,比如心血管疾病、糖尿病、耳聋、肿瘤、神经退行性疾病及衰老等。
[0003]线粒体DNA是核外遗传物质,可以独立编码参与线粒体功能的一些重要蛋白。人类线粒体DNA为大小16571碱基的闭合双链分子,编码22种tRNA(转运核糖核酸)、2种rRNA(核糖体RNA)和氧化磷酸化复合物中的13个亚基。线粒体DNA的变异包括大片段的插入或缺失,小片段的插入或缺失,点突变。这些变异既可以出现在编码区,也可以出现在非编码区。体内活性氧(ROS, reactive oxygen species)的异常增多是引起线粒体DNA碱基变异或点突变的主要原因。线粒体DNA上的某些区域由于受到活性氧引起的自由基的持续攻击,产生点突变的频率明显高于其它区域,则称之为突变热点。比如亮氨酸转运RNA基因的点突变就是线粒体DNA的一个病原学突变热点。研究表明,一些编码基因的点突变与某些特定的疾病有明显的相关性。比如,在色素性视网膜炎、一些神经疾病和Leigh综合征中,均检测到ATP合成酶中的亚基6上的点突变。并且,这些疾病的严重程度与该基因的点突变频率密切相关。疾病发生早期线粒体DNA的低频突变已经发生,但目前尚无有效的高通量检测方法。
[0004]线粒体基因组与核基因组在遗传上的重要不同是:在一个细胞中,核基因组只有两个拷贝,一个来自父亲,一个来自母亲;而线粒体基因组几乎完全来自母亲,并且有上千个拷贝(通常一个细胞有1000-2000个线粒体,一个线粒体有2-10个线粒体DNA拷贝)。这种拷贝数的不同也导致了在DNA突变检测上的策略不同。对于基因组上某一位置的点突变只可能出现三种情况:均无突变,有一个拷贝发生突变,或者两个拷贝均发生突变。而对于线粒体DNA来说,情况就要复杂的多,从一个线粒体DNA发生突变,到上千个线粒体DNA均发生突变,其中的突变频率可以是0.1%~100%中的任何一个比例。而要精确检测到这种突变频率的变化,特别是低频率(0.1%~10%)的点突变,用传统的桑格测序(Sangersequencing)是无法进行精确测定的。
[0005]随着高通量测序技术(第二代测序、下一代测序、深度测序)的飞速发展,单个碱基的测序费用迅速下降,测序的覆盖度也得以不断加深,使得之前所不能实现的目标有了新的可能。从理论上讲,要检测较低频率的突变,比如说0.4%,则至少需要250倍的覆盖度,加上每个点突变至少被检测到两次的标准以提高准确性,则至少需要500倍的覆盖度。深度测序的技术正好能够满足这样的覆盖度要求,因此使得检测线粒体DNA的低频突变成为可能。目前已有几个方法测定线粒体的突变,比如从细胞中分离线粒体,再提取线粒体DNA并构建文库进行深度测序。这种方法由于涉及到线粒体细胞器的分离,操作比较复杂繁琐,尤其是在样品多的时候工作量很大。另一种深度测序方法基于聚合酶链式反应(PCR)扩增,针对每个样品需要分10个以上管子进行PCR扩增,纯化后连接再打断,然后再构建高通量测序文库,并进行深度测序。这种方法虽然能从总DNA中扩增线粒体DNA片段,但每个样品需要分别做10个以上的不同引物对的扩增,还需要分别纯化,耗时耗力,并且不同扩增片段之间的效率也不尽相同,因此在线粒体基因组上的覆盖度均一性也较差。
[0006]为了克服以上方法的缺点,本发明提出了一种更简单、更高效的线粒体DNA深度测序方法,并取名为mitoRCA-seq。这种方法通过设计一组线粒体DNA特异的引物,采用滚环复制(Rolling Circle Amplification, RCA)从总DNA中富集线粒体DNA,并通过特定的限制性内切酶进一步富集线粒体DNA,然后构建测序文库并进行高通量测序,并开发特定的数据分析流程,从而达到测定线粒体基因组中高频率及低频率点突变以及其它结构变异的目的。
【发明内容】

[0007]本发明的目的在于提供一种利用高通量测序技术测定真核生物线粒体DNA中高频率及低频率突变的方法。
[0008]本发明提供的测定真核生物线粒体基因组中高频率及低频率变异的方法,采用高通量测序技术。本方法的关键之处在于设计一组(38条,具体序列见序列表)线粒体DNA特异的引物,采用滚环复制从总DNA中富集线粒体DNA,并通过特定的限制性内切酶进一步富集线粒体DNA,然后构建测序文库并进行高通量测序,并开发特定的数据分析流程,从而达到测定线粒体基因组中高频率及低频率变异的目的(见图1)。由于每个样品在接头连接步骤中加入了条形码,因此可以将多个样品混合在一个通道中进行测序,随后在数据分析时可根据条形码将不同样品分开,使得单个样品的费用降低。
[0009]本发明方法为一种线粒体DNA高通量测序文库的构建新方法(简称:mitoRCA-seq)。起始材料为总DNA,终产物为扩增后的双链DNA测序文库。该文库经高通量测序(比如Illumina的GAIIx测序平台或HiSeq2000/HiSeq2500测序平台)后获得线粒体DNA的上百万个短序列基础数据,再经过生物信息学分析获得线粒体DNA高频率及低频率点突变及其它基因组变异等详细信息。采用本发明方法最低可检测频率低至0.3%的突变位点。
[0010]本发明方法的具体步骤如下:
(1)设计线粒体DNA特异性引物SEQID N0.1 - SEQ ID N0.38 ;利用高保真的滚环复制从总DNA中直接扩增线粒体DNA ;
(2)通过特定的限制性内切酶,进一步将扩增的线粒体DNA酶切成2条特异条带,以进一步富集线粒体DNA,这2条条带的长度加在一起为线粒体DNA的全长;
(3)回收此2条条带并片段化;连接接头后进行低循环PCR或无PCR文库构建;构建的文库可以单端测序,也可以双端测序;
(4)该文库经高通量测序获得高质量数据,再经过生物信息学分析获得真核生物线粒体DNA所有位点的点突变频率和其它类型的结构变异。[0011]本发明方法的核心在于通过两步策略富集线粒体DNA,其一为采用多对线粒体DNA特异性引物,其二为通过特定的限制性内切酶将滚环复制扩增的产物切出2条特异条带。本发明在用这种方法对来自果蝇、小鼠、大鼠以及人类的总DNA进行了测试并获得成功。因此这种方法不管从原理上还是实际操作上均可适用于所有含有线粒体的真核生物,这些真核生物包括但不限于人类、猩猩、猕猴、大鼠、小鼠、果蝇、斑马鱼、线虫、拟南芥、水稻、棉花、油菜、酵母及疟原虫。此外,这一技术的核心在于线粒体DNA的富集步骤,而测序步骤既使用于Illumina测序平台(包括GAIIx、HiSeq2000、HiSeq2500、MiSeq),也适用于454测序平台和ABI的ABI S0LiD4、ABI 5500系列测序平台以及1n Torrent和1n Proton测序平台。
[0012]本发明对这一方法的可重复性进行了验证(图2),结果表明三次不同技术重复均表现了很好的重复性。第一次和第二次的低频点突变相关系数达到了 0.998 (RCA1-1 andRCA1-2),而第一次和第三次相关系数也达到了 0.996 (RCA1-1 and RCA2),第二次和第三次相关系数为0.997 (RCA1-2 and RCA2)。我们随后利用/^7貧基因突变小鼠和野生型小鼠对这一方法(mitoRCA-seq)进行了进一步验证。?这一基因编码线粒体DNA聚合酶,/?&基因的突变导致了聚合酶复制修复功能的丧失,因而比野生型有更多的低频点突变。我们利用mitoRCA-seq测定了野生型和突变小鼠的线粒体DNA所有位点的高频和低频突变,获得了很好的覆盖度(图3),并且发现作7^.突变小鼠中确实含有更多的位点发生了低频点突变(图4)。这一结果也被另一个生物学重复实验所证实。以上的实验证实了mitoRCA-seq确实是一种有效并且可靠的方法用于检测线粒体DNA的突变,不管是高频率的,还是低频率的。
【专利附图】

【附图说明】
[0013]图1是mito RCA-seq方法示意图。橙色圆环表示线粒体DNA分子。
[0014]图2是mitoRCA-seq三次用于同一样品的点突变频率的相关性结果。用Polg突变小鼠肝脏样品对mitoRCA-seq的技术可重复性进行了验证,结果显示第一次和第二次的低频点突变相关系数(R)达到了 0.998 (RCA1-1 and RCA1-2),而第一次和第三次相关系数也达到了 0.996 (RCA1-1 and RCA2),第二次和第三次相关系数为0.997 (RCA1-2 andRCA2)。这一结果表明mitoRCA-seq具有很好的技术可重复性。
[0015]图3是野生型小鼠和/^7貧突变小鼠肝脏mitoRCA-seq所测定的测序覆盖度和点突变的位点和频率。从测序覆盖度上可以看出这一方法具有较好的均一性。而不同位点的点突变检测也可以清晰地看出。覆盖度图的纵坐标表示log2转化的测序深度,而点突变频率图中的纵坐标表示0%-100%的频率。野生型小鼠肝脏样品表示野生型小鼠生物学重复I的肝脏,/?&突变小鼠肝脏样品表示突变小鼠生物学重复I的肝脏。小鼠线粒体基因组注释Ensembl在图的最下方。
[0016]图4是野生型小鼠和作7^.突变小鼠大脑和肝脏突变位点数的统计图。野生型小鼠重复I和2指生物学重复。突变小鼠重复I和2亦指生物学重复。左侧为大脑数据,右侧为肝脏数据。每条曲线的具体样品信息按照指示箭头所指。这一结果显示/^7^.突变小鼠中确实含有更多的位点发生了低频点突变。【具体实施方式】
[0017]所有实施例中的有关DNA和RNA基本操作均参考《分子克隆:实验室操作指南》(金冬雁等译,科学出版社,北京(1993))和《精编分子生物学指南》(颜子颖等译,科学出版社,北京(1998))。分子操作中所用的酶和特殊试剂在之后括号中均注明了相应的公司。
[0018]实施例1 --总DNA的提取
总DNA(包括人、猩猩、猕猴、大鼠、小鼠、果蝇、斑马鱼、线虫、拟南芥、水稻、棉花、油菜、酵母及痕原虫)的提取采用Qiagen公司的QIAamp DNA Blood Mini kit试剂盒。不同的细胞或者组织按照Qiagen公司建议的流程来提取。通常来说,组织取样为20毫克,加入200 μ I AL缓冲液。匀浆采用钢珠,在2ml的圆底离心管中进行,采用的仪器为Qiagen公司的TissueLyser匀浆机,参数为每秒50下,共匀浆2分钟。柱子纯化后,洗脱到200 μ I纯水中。采用Nanodrop spectrophotometer测定DNA浓度。IOOng的总DNA用于构建mitoRCA-seq 文库。
[0019]实施例2:采用滚环复制进行线粒体DNA扩增
IOOng总DNA用于滚环扩增。将IOOng总DNA加入50ul反应体系中,该体系中还包括:Ix Phi29 DNA 聚合酶缓冲液(NEB),0.2 μ g/ml BSA, I mM dNTP (NEB) and 25 μ M 线粒体DNA特异性引物(小鼠引物详见序列表)。混匀这一体系并在95° C加热3分钟,然后冷却至室温,随后加入I μ I Phi29 DNA聚合酶(10 unit/μ I, NEB)。混匀后在37° C反应16小时。随后加热至65° C并保持10分钟以灭活该聚合酶。Qiagen公司的REPL1-gMitochondrial DNA kit试剂`盒也可以用于滚环复制。
[0020]实施例3:限制性酶切
不同的物种需要选择不同的限制性内切酶。原则是选择1-2个限制性内切酶能够使得对应的线粒体DNA产生2条可以在琼脂糖凝胶电泳上分离开的条带。我们选择EcoRV (NEB)来产生9.5kb和6.8kb的2条条带。对于果蝇来说,NdeI (NEB)和EcoRV (NEB)可用于产生IOkb和9.8kb的条带。对于人的样品的话,SacI (NEB)可用于产生6.9kb和9.6kb的2个条带。具体的限制性酶切体系按照每个酶的建议用量来实施。
[0021]实施例4:双链DNA的片段化、补平和3端加腺苷酸
我们从0.5%的琼脂糖凝胶电泳上切下实施例3中的2条条带,并采用ZYMO公司的Zymoclean large fragment gel purification kit试剂盒回收条带。片段化米用 CovarisS2机器,根据最终的峰值大小300bp调参数。纯化并补平的DNA用Klenow (exo-) DNA聚合酶(Epicentre)和200 μ M dATP加上3端腺苷酸突出。该反应体系在37°C保持30分钟,然后用ZYMO Research公司的clean & concentrator-5试剂盒纯化并洗脱至7ul纯水中。
[0022]实施例5:接头的连接反应
在实施例4中得到的7ul DNA中加入Iul 10倍T4 DNA连接酶缓冲液、3pmol的Illumina公司接头(或者SOLiD平台接头)和Iul高浓度T4 DNA连接酶(NEB; 2000 units/μ I)。混匀后在室温放置30分钟,随后用ZYMO Research公司的clean & concentrator-5试剂盒纯化并洗脱至20ul纯水中。将20ul连接并纯化后的产物跑2%的琼脂糖凝胶电泳,切出250_450bp片段并用ZYMO Research公司的DNA Recovery试剂盒纯化并洗脱至20ul纯水中。
[0023]实施例6:低循环PCR扩增及无PCR的文库构建连接好接头的双链DNA可在以下的50ulPCR体系中进行扩增:20ul的实施例5中获得的DNA模版、I倍浓度的Finnnzymes公司的HF缓冲液、I nmol dNTP、25 pmol的Illumina正向PCR引物和25 pmol的Illumina反向引物以及0.5 μ I的Phusion高保真DNA聚合酶(Finnzymes)。热循环的参数如下:98。C for 30s; 12 cycles of 98。C for 10s,67 ° C for 30s and 72 ° C for 30s; 72 ° C for 10 min; hold at 10。C。取出20ul PCR产物跑2%琼脂糖凝胶电泳,切出300-500bp产物并用ZYMO Research公司的DNARecovery试剂盒纯化并洗脱至20ul纯水中。用Qubit突光仪(Invitrogen)测定文库的浓度。加入终浓度为0.1%的Tween-20用于测序前的样品保存。用Illumina公司的GAIIx或HiSeq2000/2500或MiSeq进行双端的测序,每端测定50个碱基。454测序文库、ABI SOLiD4文库、ABI 5500文库及ABI 1n Torrent文库采用对应的测序仪测序。文库的构建除接头不同需用对应的PCR引物外,其余均完全一样。对于无PCR步骤的文库构建,可以按照NuGEN公司的Encore Rapid Library Systems试剂盒操作流程来进行。
[0024]实施例7:生物信息学分析
混合样品的原始数据通过构建文库时所用的条形码进行分开。对于来源不同物种的样品,我们用序列比对软件bwa (采用默认参数)将其映射到对应物种的最新线粒体DNA基因组版本上。分析所用到的工具包括samtools, bamtools以及bedtools,均为开放源软件。我们将所有具有唯一映射位 置的短序列用于下游的点突变频率分析和其它类型突变的分析(比如小的插入或缺失)。
【权利要求】
1.一种利用高通量测序精确测定线粒体DNA高频和低频突变的方法,其特征在于具体步骤如下: (1)设计线粒体DNA特异性引物SEQID N0.1 - SEQ ID N0.38 ;利用高保真的滚环复制从总DNA中直接扩增线粒体DNA ; (2)通过特定的限制性内切酶,进一步将扩增的线粒体DNA酶切成2条特异条带,以进一步富集线粒体DNA,这2条条带的长度加在一起为线粒体DNA的全长; (3)回收此2条条带并片段化;连接接头后进行低循环PCR或无PCR文库构建;构建的文库可以单端测序,也可以双端测序; (4)该文库经过高通量测序获得高质量数据,再经过生物信息学分析获得真核生物线粒体DNA所有位点的点突变频率和其它类型的结构变异; 其最低可检测频率低至0.3%的突变位点。
2.根据权利要求1所述的方法,其特征在于总RNA来源于人、猩猩、猕猴、大鼠、小鼠、果蝇、斑马鱼、线虫、拟南芥、水稻、棉花、油菜、酵母或疟原虫。
3.根据权利要求1所述的方法,其特征在于构建的文库进行高通量测序的平台为Illumina GAIIx 平台、Illumina HiSeq2000、Illumina HiSeq2500、Illumina MySeq 平台、454 测序平台、ABI S0LiD4、ABI 5500 系列测序平台及 ABI 1n Torrent。
【文档编号】C12Q1/68GK103602735SQ201310544351
【公开日】2014年2月26日 申请日期:2013年11月6日 优先权日:2013年11月6日
【发明者】倪挺, 朱钧, 魏刚, 谌婷 申请人:复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1