基于长片段DNA环化和三代测序的无创产前单体型构建方法与流程

文档序号:16069531发布日期:2018-11-24 13:02阅读:623来源:国知局
本发明涉及测序
技术领域
,具体涉及一种基于长片段dna环化和三代测序的无创产前单体型构建方法。
背景技术
世界卫生组织2015年出生缺陷报告显示,全球每100个新生儿就有约3个携带出生缺陷相关的基因,每年有320万出生缺陷新生儿诞生,其中27万新生儿死于出生缺陷。研究表明,绝大部分出生缺陷与遗传因素有关,单基因缺陷是重要因素之一,目前对于绝大多数单基因缺陷都没有可根治的措施,只能终生替代治疗,且存活下来的出生缺陷儿多为终生残疾或智力障碍,无法治愈,由此给社会和家庭造成了沉重的经济和心理负担。对高风险孕妇进行产前检测是一种防止出生缺陷发生的有效手段。随着孕妇外周血浆中胎儿游离dna存在的发现,为无创产前检测胎儿基因型提供了可能。避免了由于羊水穿刺、绒毛膜取样和脐带血穿刺等有创取样方式造成流产风险及缩小需进行羊水穿刺的高危妊娠人群。传统单基因缺陷无创产前检测技术并未获得广泛应用,其原因主要是母体血浆母源基因组背景的影响,直接对单点分析所获得的胎儿母源位点遗传信息存在错误可能;血浆胎儿含量定量不准确造成假阴性;对存在假基因无法使用。家系连锁单体型信息分析是目前无创单基因缺陷检测构建父母单体型的主要技术方法。目前构建单体型的方法,多采用检测突变位点和多个与其连锁的短串联重复序列(str)或单核苷酸多态性(snp)来确定突变连锁单体型。str连锁分析存在str连锁标记位点较少的问题,具体案例中可能没有可用str位点,需要大量预实验,且str大多距离缺陷位点较远,无法排除重组带来错诊的可能性。基于单体型分析多采用父母先证者家系基因组捕获测序或snp分型的方法首先获得与缺陷位点关联的单体型,多重pcr操作复杂,家系捕获测序成本较高,推广较难,且需要父母子家系样本同时获得,但是在实际应用中通常会碰上待测夫妇双方子代样本不可获得的情况,比如陆思嘉公开了“一种利用多重pcr技术进行snp-单体型分析的方法”(公开号:cn105385755a)。因此,建立一种不依赖于父母子数据的单体型构建实验方法,对于进一步推广无创单基因缺陷检测技术有很重大的意义。技术实现要素:本发明提供一种基于长片段dna环化和三代测序的无创产前单体型构建方法,实现父母个体单体型构建。本发明通过如下技术方案实现:一种基于长片段dna环化和三代测序的无创产前单体型构建方法,包括:(1)用孕妇和/或其丈夫外周血中的基因组dna构建环化dna分子文库;(2)将上述环化dna分子文库打断成片段;(3)用上述片段构建三代上机测序文库,并进行三代测序以获得测序读长;(4)在上述测序读长上,从目标基因的突变点向两端延伸以寻找杂合的snp位点,其中一条测序读长含有多个snp位点时,该测序读长长度即是一条单体型的长度;(5)不同测序读长重叠区域含有相同的一个或多个snp位点时,该条单体型可成功向两端继续区分,直至出现存在一段区域无测序读长覆盖或测序读长检出的snp位点都是纯合,最终得到与上述突变点连锁的单体型。进一步地,用于构建上述环化dna分子文库的上述基因组dna的量是10μg以上。进一步地,上述构建环化dna分子文库包括如下步骤:(1a)将上述基因组dna打断成主峰为10k附近的dna片段;(1b)用磁珠纯化打断后的dna片段;(1c)对上述dna片段进行末端修复;(1d)对上述末端修复的dna片段进行环化;(1e)消化未环化的线性dna分子,得到上述环化dna分子文库。进一步地,上述步骤(1e)使用核酸外切酶i消化未环化的线性dna分子。进一步地,上述环化的效率为8%以上。进一步地,上述步骤(2)将上述环化dna分子文库打断成3k至5k的片段。进一步地,上述构建三代上机测序文库包括如下步骤:(3a)对所捕获的片段进行dna损伤修复;(3b)对所捕获的片段进行末端修复和纯化;(3c)对纯化产物进行三代测序接头连接;(3d)消化未连接的dna片段和三代测序接头;(3e)纯化连接产物,得到上述三代上机测序文库。进一步地,上述步骤(3d)使用核酸外切酶iii和核酸外切酶vii消化未连接的dna片段和三代测序接头。进一步地,上述三代测序的平均测序深度10×以上。进一步地,上述三代测序采用三代单分子测序仪pacbiorsii实现。本发明的无创产前单体型构建方法,通过长片段dna分子环化和三代测序技术,通过生物信息学分析可成功构建父母个体的突变位点连锁的单体型信息。该方法的应用能够极大地促进无创产前检测技术的推广,避免目前基于家系单体型分析的无创产前单基因突变检测技术由于无法获得先证者样本而无法大面积推广的问题,三代测序读长较长,同一个片段包含多个snp位点可能性大,构建父母单体型准确度相对家系分析的方法更准确,避免因重组事件对检测结果的影响。长片段环化技术依靠环化读长两端的snp将父母两条单体型成功区分,尤其适用于目标基因同源性高、基因杂合snp少的父母个体单体型构建。附图说明图1为本发明的无创产前单体型构建方法的一个实施方案的流程和原理示意图;图2为本发明的无创产前单体型构建方法的一个实施例中cyp21a2基因父亲单体型结果图;图3为本发明的无创产前单体型构建方法的一个实施例中cyp21a2基因母亲单体型结果图。具体实施方式下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本发明相关的一些操作并没有在说明书中显示或者描述,这是为了避免本发明的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。图1示出了本发明的无创产前单体型构建方法的一个实施方案的流程和原理示意图。具体而言,包括如下步骤:(1)用孕妇和/或其丈夫外周血中的基因组dna构建环化dna分子文库。具体而言:(a)从孕妇和/或孕妇丈夫外周血中抽提基因组dna,并使用电泳及od检测对获得的dna进行质量检测,要求dna无明显降解,总量在10μg以上。(b)10kdna分子环化:首先将提取的父母个体的基因组dna打断(例如采用hydroshearplus打断仪)至主峰在10k附近(例如9k至11k),纯化后的打断产物依次经过末端修复、纯化,然后将10kdna分子环化,利用核酸外切酶将线性dna消化。(2)将环化dna分子文库打断成片段(例如打碎至3k至5k左右)。(3)用上一步的片段构建三代上机测序文库,具体包括:dna损伤修复、末端修复和三代接头连接,利用blueppin分选3k至5k的片段,纯化后可获得三代上机测序文库,使用三代单分子测序仪(pacbiorsii)进行测序以获得测序读长。然后进行单体型构建,具体包括:(4)在测序读长上,从目标基因的突变点向两端延伸以寻找杂合的snp位点,其中一条测序读长含有多个snp位点时,该测序读长长度即是一条单体型的长度。(5)不同测序读长重叠区域含有相同的一个或多个snp位点时,该条单体型可成功向两端继续区分,直至出现存在一段区域无测序读长覆盖或测序读长检出的snp位点都是纯合,最终得到与突变点连锁的单体型。本发明的无创产前单体型构建方法,通过长片段dna分子环化和三代测序技术,通过生物信息学分析可成功构建父母个体的突变位点连锁的单体型信息,从而为后续无创产前检测奠定技术基础,后续无创产前检测可能与胎儿某些性状(例如单双眼皮、身高、体重等)相关。以下通过实施例详细说明本发明的技术方案和效果,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。实施例一在本实施例中,招募1例生育先天性肾上腺皮质增生cyp21a2基因突变的母亲和父亲进行无创产前单体型构建。父亲为cyp21a2基因c.1451_1452delgginsc杂合突变,母亲为cyp21a2真基因杂合缺失,曾生育一个孩子为cyp21a2c.1451_1452delgginsc复合真基因杂合缺失突变,先证者样本无法获得,家属有想生育二胎的想法,遗传咨询和知情同意均已签署,抽取父亲和母亲外周血,提取基因组dna,而后构建10k环化大片段三代文库和pacbio测序,对父母单体型进行分析。(一)基因组dna提取和打断用盐析法提取标本10μg父母样本基因组dna,片段无明显降解,在恒温混合器中37℃温浴30min后,14000rpm离心15min。将上清转移至50ml离心管中,采用hydroshearplus打断仪,设置打断参数体积:150;循环数:12;速度码:5,取2μl打断后的样品进行电泳检测,主峰在9k至11k左右为宜,使用1倍ampurexp磁珠,最终用77μl洗脱缓冲液回溶。(二)末端修复配置表1所示的反应体系:表1将配置好的反应液充分混匀,反应程序:20℃孵育30min,结束后,使用1倍ampurexp磁珠纯化,最终用71μl洗脱缓冲液回溶。(三)dna环化配置表2所示的反应体系:表2试剂名称体积(μl)末端修复的dna3000ng10×t4dna连接酶缓冲液(enzymatics)40超纯水补足10×t4dna连接酶(enzymatics)2025mmatp(enzymatics)5总体积400将配置好的反应液充分混匀,反应程序:16℃孵育20h,结束后立即进入下一步。(四)线性dna分子消化配置表3所示的反应体系:表3将配置好的反应液充分混匀,反应程序:37℃孵育30min;75℃孵育20min。用qiaquickpcrpurificationkit对消化产物进行纯化,最后将样品溶于65μl洗脱缓冲液。(五)环化dna分子破碎使用生物打断仪打断环化的dna主峰在5k左右,打断功率:l;打断频率:打30s,停30s;打断时间:3min。用quant-ittmhigh-sensitivednaassaykit检测样品的浓度,并计算环化效率,环化效率≥8%是比较理想的状况。(六)dna损伤修复(试剂盒来自pacbio)配置表4所示的反应体系:表4试剂名称体积(μl)10×dna损伤修复缓冲液5100×nad+(辅酶ⅰ)0.510mmatp510mmdntps0.5dna损伤修复酶混合液2.0破碎的dna1μg水加至50μl将配置好的反应液震荡混匀,反应条件:37℃,20min;4℃保持。(七)末端修复和纯化(试剂盒来自pacbio)配置表5所示的反应体系:表5试剂名称体积(μl)20×末端修复混合液50损伤修复后dna2.5总体积52.5将配置好的反应液震荡混匀,反应条件:25℃,5min;4℃保持。使用23μlampurepb磁珠进行产物纯化,回收的dna溶于32μl(其中2μl为损耗)水中。(八)接头连接配置表6所示的反应体系:表6将配置好的反应液震荡混匀,反应条件:25℃,24h;65℃,10min;4℃保持。(九)消化连接失败的dna和接头序列配置表7所示的反应体系:表7试剂名称体积(μl)连接的dna40exoiii1exovii1将配置好的反应液震荡混匀,反应条件:37℃,1h;4℃保持。纯化:使用19μlampurepb磁珠进行产物纯化,回收的dna溶于31μl洗脱缓冲液;使用bluepippin进行片段选择要求主峰在5k左右,使用1倍ampurepb磁珠进行产物纯化,10μl洗脱缓冲液回溶纯化后dna,用于后续上机。(十)上机测序使用三代单分子测序仪(pacbiorsii),采用pacbiorsii室(cell)/单样本程序对获得的样品文库进行测序。单个文库一个测序室(cell),使得目标区域平均测序深度达到10×以上。(十一)结果分析原始下机序列的质控按照pacificbiosciences公司的标准流程rsdashboard完成;利用pacificsmrtportal软件进行数据基本过滤:最小读长长度(minimumsubreadlength)<50;最小聚合酶读长质量(minimumpolymerasereadquality)<75;最小聚合酶读长长度(minimumpolymerasereadlength)<50;利用rs_readsofinsert_mappingprotocol软件将序列定位到人类基因组数据相应的位置上,比对参数:a.最小全通过(minimumfullpasses):0;b.最小预测精度(minimumpredictedaccuracy):75;统计测序序列数和测序质量。使用pacificbiosciences公司的targeted-phasing-consensus软件进行snp调取(calling),然后进行单体型构建;利用各个测序序列关联的snp,用targeted-phasing-consensus和perlr脚本输出父母单体型结果。并明确与目标基因突变位点相连锁遗传的snp信息。单体型构建方法如下:(1)在pacbio测序读长(reads)上检出目标基因突变点,从目标基因的突变点向两端延伸以寻找杂合的snp位点,包括(snv和indel等),一条测序读长含有多个snp位点时,该测序读长长度即是一条单体型的长度。(2)不同pacbio测序读长重叠区域含有相同的一个或多个snp位点时,该条单体型可成功向两端继续区分,直至出现存在一段区域无测序读长覆盖或测序读长检出的snp位点都是纯合,表明该区域单体型无法区分,最终得到与所述突变点连锁的单体型。(a)数据产出情况如表8所示,所测样品平均测序深度均在10×左右。表8文库捕获测序数据产出情况(b)父母个体单体型构建结果cyp21a2基因父亲单体型的构建结果如图2所示,其中,hap0和hap1表示父亲个体的两个单体型,hap0表示与突变位点关联的单体型,hap1表示正常的单体型,点表示杂合snp用于单体型判断,横坐标表示cyp21a2基因及上下游500k区域。cyp21a2基因母亲单体型的构建结果如图3所示,其中,hap0和hap1表示母亲个体的两个单体型,hap0表示与突变位点关联的单体型,hap1表示正常的单体型,点表示杂合snp用于单体型判断,横坐标表示cyp21a2基因及上下游500k区域。以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属
技术领域
的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1