一种判断胎儿基因型的方法

文档序号:6625519阅读:2111来源:国知局
一种判断胎儿基因型的方法
【专利摘要】本发明涉及一种判断胎儿基因型的方法,包括以下具体步骤:A.提取孕妇外周血DNA样本,进行外显子测序,得到原始数据;B.对原始数据进行质控,与参考序列比对,检测SNP,注释并统计;C.基于孕妇和胎儿的基因型的四种组合方式,用最大期望值算法计算得到四种组合方式的SNP位点的最小等位基因频率的混合高斯模型;D.计算得到混合高斯模型的三个临界值;E.通过比较各SNP位点的最小等位基因频率与三个临界值之间的大小关系判断胎儿基因型。本发明的判断胎儿基因型的方法仅凭孕妇的外周血可推测胎儿基因突变位点,精确且安全,不需要来自父亲的DNA,测序深度更深,更节省成本,经济实用。
【专利说明】一种判断胎儿基因型的方法

【技术领域】
[0001]本发明涉及一种基于特定的算法推断基因型的方法,属于生物【技术领域】。

【背景技术】
[0002]基因型又称遗传型,是某一生物个体全部基因组合的总称。它反映生物体的遗传构成,即从双亲获得的全部基因的总和。据估计,人类的结构基因约有5万对。因此,整个生物的基因型是无法表示的,遗传学中具体使用的基因型,往往是指某一性状的基因型。在人类染色体中,决定遗传性状的是来自父母的一对染色体上对应的基因,因为人体有各来自父母的俩套染色体,所以又称为二倍体。
[0003]基因型的判断结果可以作为中间结果,为学术研究、遗传性疾病的预防、个体化用药,遗传性疾病的诊断提供数据信息。目前,常见的基因型检测技术有荧光定量PCR技术、高通量测序技术、基因芯片技术等,这些技术各有优缺点,中国专利文献CN100482806C公开了一种基因型分型方法,改良的多重聚合酶链式反应包括一个同步聚合酶链式反应以及一个特异性聚合酶链式反应,而且这两个扩增步骤皆可以递减策略来进行,其中宽松的递减策略是以低于最佳退火温度的温度来使用,而严谨的递减策略是以高于最佳退火温度的温度来使用,这是典型的PCR技术。
[0004]通过上述技术检测基因型都需要先取得生物的DNA样本,然后进行检测。但是在判断胎儿基因型时就存在诸多的问题。检测胎儿的基因型时,如果通过侵入性实验(如羊水穿刺)来获得胎盘物质,从而进行基因分型,会增加孕妇的流产风险;如果对父母的基因型进行单倍体测序,实验繁琐,周期很长,花费很多。


【发明内容】

[0005]本发明的目的是提供一种仅凭孕妇的外周血,精确且安全的判断胎儿基因型的方法。
[0006]实现本发明目的的一个技术方案是一种判断胎儿基因型的方法,不用于疾病的诊断和治疗,包括以下具体步骤:
A.提取孕妇外周血DNA样本,进行外显子测序,得到原始数据;
B.对原始数据进行质控,与参考序列比对,检测SNP,注释并统计;
C.基于孕妇和胎儿的基因型的四种组合方式,用最大期望值算法计算得到四种组合方式的SNP位点的最小等位基因频率的混合高斯模型;
所述四种组合方式分别是孕妇和胎儿都是纯合子时的第一组合方式,胎儿是杂合子且孕妇是纯合子的第二组合方式,胎儿是纯合子且孕妇是杂合子的第三组合方式和孕妇,以及胎儿都是杂合子的第四组合方式;
D.计算得到混合高斯模型的三个临界值;
所述三个临界值从小到大分别是第一临界值、第二临界值和第三临界值;所述第一临界值是所述第一组合方式的混合高斯模型与第二组合方式的混合高斯模型的交点,所述第二临界值是所述第二组合方式的混合高斯模型与第三组合方式的混合高斯模型的交点,所述第三临界值是所述第三组合方式的混合高斯模型与第四组合方式的混合高斯模型的交占.E.通过比较各SNP位点的最小等位基因频率与三个临界值之间的大小关系判断胎儿基因型;
当SNP位点的最小等位基因频率小于或等于第一临界值时,孕妇和胎儿都是纯合子;当SNP位点的最小等位基因频率小于或等于第二临界值且大于第一临界值时,胎儿是杂合子且孕妇是纯合子;当SNP位点的最小等位基因频率小于或等于第三临界值且大于第二临界值时,胎儿是纯合子且孕妇是杂合子;当SNP位点的最小等位基因频率大于第三临界值时,孕妇和胎儿都是杂合子。
[0007]上述混合高斯模型的定义为

【权利要求】
1.一种判断胎儿基因型的方法,其特征在于,包括以下具体步骤: A.提取孕妇外周血DNA样本,进行外显子测序,得到原始数据; B.对原始数据进行质控,与参考序列比对,检测SNP,注释并统计; C.基于孕妇和胎儿的基因型的四种组合方式,用最大期望值算法计算得到四种组合方式的SNP位点的最小等位基因频率的混合高斯模型; 所述四种组合方式分别是孕妇和胎儿都是纯合子时的第一组合方式,胎儿是杂合子且孕妇是纯合子的第二组合方式,胎儿是纯合子且孕妇是杂合子的第三组合方式和孕妇,以及胎儿都是杂合子的第四组合方式; D.计算得到混合高斯模型的三个临界值; 所述三个临界值从小到大分别是第一临界值、第二临界值和第三临界值;所述第一临界值是所述第一组合方式的混合高斯模型与第二组合方式的混合高斯模型的交点,所述第二临界值是所述第二组合方式的混合高斯模型与第三组合方式的混合高斯模型的交点,所述第三临界值是所述第三组合方式的混合高斯模型与第四组合方式的混合高斯模型的交占.E.通过比较各SNP位点的最小等位基因频率与三个临界值之间的大小关系判断胎儿基因型; 当SNP位点的最小等位基因频率小于或等于第一临界值时,孕妇和胎儿都是纯合子;当SNP位点的最小等位基因频率小于或等于第二临界值且大于第一临界值时,胎儿是杂合子且孕妇是纯合子;当SNP位点的最小等位基因频率小于或等于第三临界值且大于第二临界值时,胎儿是纯合子且孕妇是杂合子;当SNP位点的最小等位基因频率大于第三临界值时,孕妇和胎儿都是杂合子。
2.根据权利要求1所述的判断胎儿基因型的方法,其特征在于:所述混合高斯模型的定义为
其中,K是高斯分布模型的个数,K=4,Jik是第k个高斯分布的概率密度函数,yk是第k个高斯分布的均值,Sk是第k个高斯分布的方差。
3.根据权利要求2所述的判断胎儿基因型的方法,其特征在于,所述最大期望值算法计算得到混合高斯模型的具体步骤是: 步骤一,假设nk、Uk和Sk的初始值已知,估计每个高斯模型的权重Y (i,k),计算公式为
其中,i是所有最小等位基因频率数据的数位是高斯分布模型的数位;步骤二,基于估计的每个高斯模型的权重,确定n k、S k,计算公式为
其中,n是所有最小等位基因频率数据的个数; 步骤三,将第二步确定的nk、口15和Sk代入目标函数
步骤四,重复步骤二和步骤三直至目标函数收敛,计算结束。
4.根据权利要求3所述的判断胎儿基因型的方法,其特征在于:所述外显子测序是利用外显子捕获扩增,然后采用现有的二代基因测序技术,对该样品建库后上机测序。
【文档编号】G06F19/18GK104182655SQ201410439489
【公开日】2014年12月3日 申请日期:2014年9月1日 优先权日:2014年9月1日
【发明者】陈昌岳, 王璇, 任一, 张祥林 申请人:上海美吉生物医药科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1