无创检测母体和胚胎遗传异常的装置的制作方法

文档序号:15933157发布日期:2018-11-14 01:57阅读:216来源:国知局

本发明属于生物基因技术领域,具体涉及一种使用全外显子测序技术实现无创胚胎染色体非整倍体及其他胚胎遗传异常的方法。

背景技术

随着基因检测技术的提高,数据的增多以及统计学的发展,通过对孕妇血浆游离dna(cfdna)检测数据的分析,能有效地解决目前无创产前胚胎dna检测方法无法检测到的异常,为存在风险的孕妇提供准确有效的检测。

目前已知,存在因染色体不正常引起的各种表象,这类人群的细胞染色体都具有一定的数目异常或结构异常。

随着孕妇外周血中存在游离的胚胎dna的发现,可以通过孕妇血浆中的dna分子进行全基因组低深度高通量的测序,通过生物信息比对的方法将测得的dna序列定位到相应的染色体上。母体外周血浆中存在胚胎游离dna(来自于胎盘滋养层细胞)。在怀孕后5周就可检测到,怀孕10周后,胚胎游离dna占外周血游离dna3%~13%,并随着孕周的增长而增加,直到分娩后2小时消失。现有技术中利用孕妇外周血游离dna进行的无创产前胚胎染色体非整倍体检测技术(nipt):判断胚胎21-三体性、18-三体性、13-三体性已经实现。

但现有技术无法通过孕妇外周血游离dna检测胚胎其他遗传异常,除了胚胎染色体非整倍体。还没有检测技术是结合全基因外显子测序技术与孕妇外周血游离dna的。单独做无创产前胚胎染色体非整倍体检测与母体遗传异常dna检测成本都较高。



技术实现要素:

本发明所要解决的技术问题是克服现有技术检测胚胎方法不全面的缺陷,提供一种通过孕妇外周血游离dna无创检测母体和胚胎的遗传异常的装置和方法。

为解决上述技术问题,本发明提供一种通过孕妇外周血游离dna无创检测母体和胚胎的遗传异常的装置,所述装置包括:

检测模块:对来源母体的血浆游离dna用全外显子高深度测序,测序深度为平均100x~1000x;优选为500x;

计算模块:从母体血浆游离dna含量计算胚胎dna含量;

具体为,检测母体血浆dna中的所有dna变异,计算每个变异的变异丰度,设胚胎的dna含量为u,母体dna含量为1-u,用f(x|θ)=a1n(0,σ12)+a2n(u/2,σ22)+a3n(u,σ32)+a4n(1-u/2,σ42)+a5n((1-u)/2,σ52)+a6n((1+u)/2,σ62),∑ai=1,0<=ai<=1,拟合常染色体变异丰度的分布,计算出最优拟合的参数,即得到胚胎dna含量;

u:孕妇血浆中胎儿dna含量;a1:假阳性的基因变异所占比例;a2:胎儿来自父亲的基因变异所占的比例;a3:胎儿与父母不同的纯合基因变异所占的比例;a4:母亲纯合且胎儿杂合的基因变异所占的比例;a5:母亲未遗传给胎儿的杂合基因变异所占的比例;a6:母亲遗传给胎儿的杂合基因变异所占的比例;1~σ6:每个分布模型的标准差;该公式中n是正态分布,也可以将正态分布换为二项分布或泊松分布,因为正态分布与泊松分布可以作为是二项分布的近似,如果是泊松分布,公式中n(u,σi2)对应换为p(u)即可;

对比模块一:使用计算模块得到dna数据对比染色体非整倍体性,由于检测数据中同时含有胚胎dna与母体dna,对每条染色体上的dna片段数量计数,如果胚胎有染色体非整倍体异常,则观察到相应染色体上dna片段计数多于其他染色体;

判断模块一:从母体血浆游离dna中识别胚胎单基因dna上的异常;母体血浆游离dna中混合了母体自己的dna与胚胎dna,从检测中我们无法分离他们,但是因母体与胚胎dna的浓度存在差异,把所有检测的dna数据比对到人类参考基因组hg19或者hg38,找到检测所得dna片段在参考基因组上的位置及与参考基因组不匹配的碱基,检测所有dna变异,记录每个变异的位置、碱基变化与变异丰度,根据计算模块计算所得的参数,记胚胎纯合变异丰度的分布x~n(u,σ32),母体的杂合变异丰度的分布y~n((1-u)/2,σ52),如果一个变异的丰度为x,计算p(x>x)与p(y<x),如果p(x>x)>p(y<x)则可判定该变异来源于胚胎;

u:孕妇血浆中胎儿dna含量;x:胎儿纯合变异丰度,σ3:胎儿纯合变异丰度的分布的标准差,y:母体的杂合变异丰度的分布,σ5:母体未遗传给胎儿的杂合变异丰度的分布的标准差,n:正态分布,p:概率;

判断模块二:从母体血浆游离dna中识别母体单基因dna上的异常,和判断模块一相似,如果p(x>x)<p(y<x),则可判定该变异来源于母体。

优选地,因母体血浆游离dna中含有胚胎dna,而胚胎的基因与母体的基因是有差异的,计算模块。

优选地,对比模块一具体包括如下步骤:

a)将检测得到的dna序列与人的参考基因组hg19或hg38比较,找准每条序列对应基因组上的位置;

b)与refseq基因注释数据库比较,在基因组上划分外显子区域与非外显子区域;

c)计数每个外显子区域上检测到的dna片段的数量a=(a1,a2,a3,…),计数人基因组上由外显子分割的每个非外显子区域上检测到的dna片段的数量b=(b1,b2,b3,…);

d)计算每个外显子区域检测到的dna数量占全部外显子上dna片段数量的比例x=a/(a*1t),同理非外显子y=a/(a*1t);其中,a:外显子上检测到的dna片段的数量的向量;b:非外显子区域上检测到的dna片段的数量的向量;1t:由1组成的列向量;

e)对于第n条染色体,选取待测样本该染色体上的检测值(xn,yn)与多个对照参考样品的均值(xnc,ync)做比较,做成对的假设检验,如果(xn,yn)与(xnc,ync)有显著差异,显著性的阈值为p<0.05,则该待测样本的染色体n可能异常。

优选地,在对比模块一之后还包括对比模块二:使用样本的血浆游离dna数据检测染色体非整倍体性,由计算模块从母体血浆游离dna含量计算整体胚胎dna含量,同理算每条染色体上胚胎dna的含量,然后比较每条染色体上胚胎dna含量与总胚胎dna含量的比例,找出胚胎dna含量约为整体胚胎dna含量1.5倍的染色体,如果存在这样的染色体,则该染色体异常且可判断多余的染色体来自于父本。

优选地,检测模块中对来源母体的血浆游离dna提取后,建立dna文库,并富集dna文库中的人外显子序列。

优选地,对富集后的dna序列测定20g~30g碱基的数据,优选测定30g碱基的数据,dna外显子序列长度为单端或双端75bp~150bp长度,优选富集dna外显子序列长度双端150bp。

优选地,所述母体为怀孕母体受试者,更优选地,所述母体为怀孕女性。

在对比模块一或对比模块二后有一个判断:如果对比模块一结果为染色体n异常,或对比模块二的结果为染色体n的胚胎dna含量为总胚胎dna含量的1.5倍,则多余的染色体来自于父本;如果对比模块一结果为染色体n异常,或对比模块二的结果为染色体n的胚胎dna含量与总胚胎dna含量一致,则多余的染色体来自于母本.

优选地,通过母体外周血游离dna无创检测母体和胚胎的遗传异常的装置,所述装置包括:

检测模块:对来源母体的血浆游离dna用全外显子高深度测序,测序深度为平均500x;

计算模块:从母体血浆游离dna含量计算胚胎dna含量,检测母体血浆dna中的所有dna变异,计算每个变异的变异丰度;

对比模块一:使用检测模块得到dna数据检测染色体非整倍体性,检测数据中同时含有胚胎dna与母体dna,对每条染色体上的dna片段数量计数,如果胚胎患有染色体非整倍体异常,则可以观察到相应染色体上dna片段计数多于其他染色体;

对比模块二:使用样本的血浆游离dna数据检测染色体非整倍体性,由计算模块一:从母体血浆游离dna含量计算整体胚胎dna含量,同理我们可以计算每条染色体上胚胎dna的含量,然后比较每条染色体上胚胎dna含量与总胚胎dna含量的比例,找出胚胎dna含量约为整体胚胎dna含量1.5倍的染色体,如果存在这样的染色体,则该染色体异常;

判断模块一:从母体血浆游离dna中识别胚胎单基因dna上的异常;母体血浆游离dna中混合了母体自己的dna与胚胎dna,从检测中我们无法分离他们,但是因母体与胚胎dna的浓度存在差异,把所有检测的dna数据比对到人类参考基因组hg19或者hg38,找到检测所得dna片段在参考基因组上的位置及与参考基因组不匹配的碱基,检测所有dna变异,记录每个变异的位置、碱基变化与变异丰度,根据计算模块计算所得的参数,记胚胎纯合变异丰度的分布x~n(u,σ32),母体的杂合变异丰度的分布y~n((1-u)/2,σ52),如果一个变异的丰度为x,计算p(x>x)与p(y<x),如果p(x>x)>p(y<x)则可判定该变异来源于胚胎;

判断模块二:从母体血浆游离dna中识别母体单基因dna上的异常,同前判断模块一,如果p(x>x)<p(y<x),则可判定该变异来源于母体。

本发明实现了胚胎遗传异常的无创检测,可以同时无创检测胚胎染色体非整倍性;可同时无创检测母体的染色体遗传异常。本发明相对于目前普遍使用的无创产前胚胎染色体非整倍体检测增加了新的检测功能,但是不增加检测费用,大量节约成本。

具体实施方式

以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。

介绍和概述

本发明通过举例而非给出限制的方式来进行说明。应注意的是,在本公开文件中所述的“一”或“一种”实施方式未必是指同一种具体实施方式,而是指至少有一种。样品来源苏州市立医院。

实施例一:

(1)用streck公司的cell-freednabct试管按照对应器材使用说明书采集孕12周孕妇的血液5ml;

(2)使用凯杰公司的qiaampcirculatingnucleicacidkit试剂盒按照对应的试剂盒使用说明书提取血浆中的游离dna,

(3)使用kapa生物系统公司的kapahyperprepkit试剂盒按照对应的试剂盒使用说明书对提取出的血浆游离dna建文库,

(4)使用nimblegen公司的seqcapezhumanexomeprobesv3.0dna捕获试剂盒按照对应的试剂盒使用说明书富集dna文库中的人外显子序列,

(5)使用illumina公司的nextseq500型号高通量测序仪器对富集后的dna序列测定32g碱基的数据,dna序列长度为双端150长度,

(6)从测序数据中检测到70647个变异,每一个变异的变异丰度在0~1之间。使用这些数据和混合正态分布模型公式,计算出u=0.074,即胎儿dna在母体血液游离dna中所占比例为7.4%。

(7)用bwa软件将检测得到的dna序列与人类参考序列hg19比较,

(8)对该检测数据的人每条染色体上的每个外显子、内含子、基因间区dna序列数量计数,按照本发明所述方法(3),将所得数据与已备好的其他多个样本的参考数据比较,发现本次检测样本的21号染色体上所有dna片段数量所占比例为1.2373%,而其他多个染色体正常样本组成的参考基线的21号染色体所占比例为1.1931%,且该样本21号染色体上外显子、内含子、基因间区上的相对dna数量都显著大于其他多个样本组成的参考基线,显著性p-value=0.0032,判断为该胚胎21号染色体三体缺陷.

(9)按照本发明所述方法(4)使用每条染色体上变异计算胎儿dna含量,计算所得21号染色体胚胎dna含量为u=0.11,总体胚胎dna含量为u=0.74,其他染色体胚胎dna含量都在0.73左右,21号染色体上胚胎dna含量显著大于总体胚胎dna含量,且大约为1.5倍。

(10)按照本发明所述方法(5),该样本21号染色体异常,且21号染色体胚胎dna含量为总胚胎dna含量1.5倍,判断为胚胎携带21号染色体三体缺陷,且多余的染色体来自父本。

(11)按照本发明所述方法(1)(3)(4)(5)的判断结果,输出3份检测结果:a.使用所有母亲的基因变异,产生母亲的检测报告;b.使用所有胚胎而基因变异,产生胚胎的检测报告;c.产生胚胎是否存在染色体异常的报告。

实施例二:

(1)对于实施例一的dna序列数据,使用本发明所述方法(4)计算胚胎dna含量,计算所得胚胎dna含量为3%,母体dna含量97%,胚胎dna含量在人群平均值合理范围内。

(2)对此次检测所得dna序列数据计算变异,发现dna中存在90余个缺陷变异,这些变异的丰度大多数分布在1.5%与50%附近,通过本发明所述方法(3)、(6)、(7)计算,其中30余个缺陷变异来源于胚胎,60余个来源于母体。

以上所述具体实施例仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进或替换,这些改进或替换也应当视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1