特定突变位点的检测方法、检测装置、存储介质及处理器与流程

文档序号:14827921发布日期:2018-06-30 09:13阅读:来源:国知局
特定突变位点的检测方法、检测装置、存储介质及处理器与流程

技术特征:

1.一种特定突变位点的检测方法,其特征在于,所述检测方法包括:

根据人群中特定突变位点的特定单倍型,判断待测个体中所述特定突变位点的基因型。

2.根据权利要求1所述的检测方法,其特征在于,根据人群中特定突变位点的特定单倍型,判断待测个体中所述特定突变位点的基因型之前,所述检测方法还包括构建所述人群中特定突变位点的单倍型的步骤。

3.根据权利要求2所述的检测方法,其特征在于,构建所述人群中特定突变位点的特定单倍型的步骤包括:

获取人群中来源于不同家系样本的包含所述特定突变位点的测序数据,其中,每个家系样本包括父本、母本及先证者;

统计各所述测序数据中的SNP位点的基因型,得到每个样本的SNP位点信息;

去除每个所述样本的SNP位点信息中的INDEL位点以及偏离孟德尔遗传定律的SNP位点,得到每个所述样本的有效SNP位点;

对每个所述样本的有效SNP位点进行单倍体分型,得到每个所述样本的两条单倍型;

比较所有家系中所述先证者的两条单倍型中在所述特定突变位点为突变型碱基时所对应的单倍型,找出所有与所述特定突变位点的突变型碱基连锁遗传的SNP位点,从而构成所述人群中特定突变位点的特定单倍型;

优选地,所述获取人群中来源于不同家系样本的包含所述特定突变位点的测序数据的步骤包括:

设计并合成包含所述特定突变位点的文库杂交探针;

获取所述人群中来源于不同家系样本的基因组DNA文库;

将所述基因组DNA文库与所述文库杂交探针进行杂交捕获反应,得到捕获文库;

对所述捕获文库进行测序,得到所述人群中来源于不同家系样本的包含所述特定突变位点的测序数据。

4.根据权利要求3所述的检测方法,其特征在于,所述设计并合成包含所述特定突变位点的文库杂交探针的步骤包括:

从HAPMAP数据库中选择所述特定突变位点所在基因上下游各1M区域的AF在0.05-0.95之间的SNP,且在所述基因的上下游的区域每间隔2000~4000bp挑选一个SNP,共计挑选900~1200个SNP位点,若挑选的SNP位点不足900~1200个SNP位点,则从1000genomes中CHB选择补足;

从挑选的所述900~1200个SNP位点中过滤掉位于重复区域和CNV区域的位点,剩余的SNP位点作为用于单倍型分析的SNP位点;

设计并合成包含所述用于单倍型分析的SNP位点的DNA探针,所述DNA探针的两端添加有通用接头序列;

将所述DNA探针依次进行扩增和转录,得到带有生物素标记的RNA探针,所述带有生物素标记的RNA探针即为所述文库杂交探针。

5.根据权利要求3所述的检测方法,其特征在于,所述每个样本的SNP位点信息以vcf文件形式存在,去除每个所述样本的SNP位点信息中的INDEL位点以及偏离孟德尔遗传定律的SNP位点,得到每个所述样本的有效SNP位点的步骤包括:

从所述vcf文件中去除每个所述样本的SNP位点信息中的INDEL位点;

将所有样本的vcf文件进行合并,将合并后的vcf文件转化成plink格式的文件;

将所述plink格式的文件转化为Beagle格式的文件,去除Beagle格式文件中偏离孟德尔遗传定律的SNP位点,得到每个所述样本的有效SNP位点。

6.根据权利要求5所述的检测方法,其特征在于,输入Beagle对每个所述样本的有效SNP位点进行单倍体分型,得到每个所述样本的两条单倍型。

7.根据权利要求1至6中任一项所述的检测方法,其特征在于,所述待测个体为胎儿,根据人群中特定突变位点的特定单倍型,判断待测个体中所述特定突变位点的基因型的步骤包括:

获取父亲基因组DNA和母亲基因组DNA的所述特定单倍型中各SNP位点的基因型信息,并获取母亲血浆游离DNA的所述特定单倍型中各SNP位点的碱基类型的频率;

挑选在所述母亲基因组DNA中的基因型为杂合而在所述父亲基因组DNA中的基因型为纯合的SNP位点,记为第一类SNP位点,并根据所述母亲血浆游离DNA中对应的所述第一类SNP位点的突变碱基的频率,判断胎儿遗传了来源于母亲野生型的单倍型还是突变型的单倍型;

挑选在所述母亲基因组DNA中的基因型为纯合而在所述父亲基因组DNA的基因型为杂合的SNP位点,记为第二类SNP位点,并根据所述母亲血浆游离DNA中对应的所述第二类SNP位点的突变碱基的频率,判断胎儿遗传了来源于父亲野生型的单倍型还是突变型的单倍型;

将所述胎儿的来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型进行比较,根据比较结果确定所述胎儿在所述突变位点的基因型。

8.根据权利要求7所述的检测方法,其特征在于,根据所述母亲血浆游离DNA中对应的所述第一类SNP位点的突变碱基的频率,判断胎儿遗传了来源于母亲野生型的单倍型还是突变型的单倍型的步骤包括:

当所述突变碱基的频率小于50%时,则确定所述胎儿遗传了来源于母亲野生型的单倍型,当所述突变碱基的频率大于50%时,则确定所述胎儿遗传了来源于母亲突变型的单倍型。

9.根据权利要求7所述的检测方法,其特征在于,根据所述母亲血浆游离DNA中对应的所述第二类SNP位点的突变碱基的频率,判断胎儿遗传了来源于父亲野生型的单倍型还是突变型的单倍型的步骤包括:

当母亲在所述第二类SNP位点的基因型为野生型纯合时,若检测到突变型频率,则所述确定胎儿遗传了来源于父亲的突变型的单倍型;

当母亲在所述第二类SNP位点的基因型为突变型纯合时,若检测到野生型频率,则确定胎儿遗传了来源于父亲的野生型的单倍型。

10.根据权利要求7所述的检测方法,其特征在于,根据比较结果确定所述胎儿在所述突变位点的基因型的步骤包括:

若来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型的比较结果均一致,则确定所述胎儿在所述特定突变位点的基因型为纯合突变;

若来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型的比较结果之一为一致,则确定所述胎儿在所述特定突变位点的基因型为杂合突变;

若来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型的比较结果均不一致,则确定所述胎儿在所述特定突变位点的基因型为野生型。

11.一种特定突变位点的检测装置,其特征在于,所述检测装置包括:

判断单元,用于根据人群中特定突变位点的特定单倍型,判断待测个体中所述特定突变位点的基因型。

12.根据权利要求11所述的检测装置,其特征在于,所述判断单元在根据人群中特定突变位点的特定单倍型,判断待测个体中所述特定突变位点的基因型之前,所述检测装置还包括特定突变位点的单倍型构建单元,所述特定突变位点的单倍型构建单元用于构建所述人群中特定突变位点的单倍型。

13.根据权利要求12所述的检测装置,其特征在于,所述特定突变位点的单倍型构建单元包括:

第一获取模块,用于获取人群中来源于不同家系样本的包含所述特定突变位点的测序数据,其中,每个家系样本包括父本、母本及先证者;

统计模块,用于统计各所述测序数据中的SNP位点的基因型,得到每个样本的SNP位点信息;

过滤模块,用于去除每个所述样本的SNP位点信息中的INDEL位点以及偏离孟德尔遗传定律的SNP位点,得到每个所述样本的有效SNP位点;

单倍体分型模块,用于对每个所述样本的有效SNP位点进行单倍体分型,得到每个所述样本的两条单倍型;以及

比较构建模块,用于比较所有家系中所述先证者的两条单倍型中在所述特定突变位点为突变型碱基时所对应的单倍型,找出所有与所述特定突变位点的突变型碱基连锁遗传的SNP位点,从而构成所述人群中特定突变位点的特定单倍型;

优选地,所述第一获取模块包括:

设计合成子模块,用于设计并合成包含所述特定突变位点的文库杂交探针;

文库获取子模块,用于获取所述人群中来源于不同家系样本的基因组DNA文库;

捕获子模块,用于将所述基因组DNA文库与所述文库杂交探针进行杂交捕获反应,得到捕获文库;以及

测序子模块,用于对所述捕获文库进行测序,得到所述人群中来源于不同家系样本的包含所述特定突变位点的测序数据。

14.根据权利要求13所述的检测装置,其特征在于,所述设计合成子模块包括:

SNP挑选元件,用于从HAPMAP数据库中选择所述特定突变位点所在基因上下游各1M区域的AF在0.05-0.95之间的SNP,且在所述基因上下游的区域每间隔2000~4000bp挑选一个SNP,共计挑选900~1200个SNP位点,若挑选的SNP位点不足900~1200个,则从1000genomes中CHB选择补足;

过滤元件,用于从挑选的所述900~1200个SNP位点中过滤掉位于重复区域和CNV区域的位点,剩余的SNP位点作为用于单倍型分析的SNP位点;

DNA探针元件,用于设计并合成包含所述用于单倍型分析的SNP位点的DNA探针,所述DNA探针的两端添加有通用接头序列;

RNA探针元件,用于将所述DNA探针依次进行扩增和转录,得到带有生物素标记的RNA探针,所述带有生物素标记的RNA探针即为所述文库杂交探针。

15.根据权利要求13所述的检测装置,其特征在于,所述统计模块中所述每个样本的SNP位点信息以vcf文件形式存在,所述过滤模块包括:

第一去除元件,用于从所述vcf文件中去除每个所述样本的SNP位点信息中的INDEL位点;

格式转换元件,用于将所有样本的vcf文件进行合并,将合并后的vcf文件转化成plink格式的文件;

第二去除元件,用于将所述plink格式的文件转化为Beagle格式的文件,去除Beagle格式文件中偏离孟德尔遗传定律的SNP位点,得到每个所述样本的有效SNP位点。

16.根据权利要求15所述的检测装置,其特征在于,单倍体分型模块为Beagle模块。

17.根据权利要求11至16中任一项所述的检测装置,其特征在于,所述待测个体为胎儿,所述判断单元包括:

第二获取模块,用于获取父亲基因组DNA和母亲基因组DNA的所述特定单倍型中各SNP位点的基因型信息,并获取母亲血浆游离DNA的所述特定单倍型中各SNP位点的碱基类型的频率;

第一筛选模块,用于挑选在所述母亲基因组DNA中的基因型为杂合而在所述父亲基因组DNA中的基因型为纯合的SNP位点,记为第一类SNP位点;

来源于母亲的单倍型判断模块,用于根据所述母亲血浆游离DNA中对应的所述第一类SNP位点的突变碱基的频率,判断胎儿遗传了来源于母亲野生型的单倍型还是突变型的单倍型;

第二筛选模块,用于挑选在所述母亲基因组DNA中的基因型为纯合而在所述父亲基因组DNA的基因型为杂合的SNP位点,记为第二类SNP位点;

来源于父亲的单倍型判断模块,用于根据所述母亲血浆游离DNA中对应的所述第二类SNP位点的突变碱基的频率,判断胎儿遗传了来源于父亲野生型的单倍型还是突变型的单倍型;

胎儿单倍型比对模块,用于将所述胎儿的来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型进行比较;

胎儿基因型确定模块,用于根据比较结果确定所述胎儿在所述突变位点的基因型。

18.根据权利要求17所述的检测装置,其特征在于,所述来源于母亲的单倍型判断模块包括:

第一单倍型子模块,用于当所述突变碱基的频率小于50%时,则确定所述胎儿遗传了来源于母亲野生型的单倍型;

第二单倍型子模块,用于当所述突变碱基的频率大于50%时,则确定所述胎儿遗传了来源于母亲突变型的单倍型。

19.根据权利要求17所述的检测装置,其特征在于,所述来源于父亲的单倍型判断模块包括:

第三单倍型子模块,用于当母亲在所述第二类SNP位点的基因型为野生型纯合时,若检测到突变型频率,则所述确定胎儿遗传了来源于父亲的突变型的单倍型;

第四单倍型子模块,用于当母亲在所述第二类SNP位点的基因型为突变型纯合时,若果检测到野生型频率,则确定胎儿遗传了来源于父亲的野生型的单倍型。

20.根据权利要求17所述的检测装置,其特征在于,所述胎儿基因型确定模块包括:

第一胎儿基因型确定子模块,用于当来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型的比较结果均一致时,确定所述胎儿在所述特定突变位点的基因型为纯合突变;

第二胎儿基因型确定子模块,用于当来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型的比较结果之一为一致时,确定所述胎儿在所述特定突变位点的基因型为杂合突变;

第三胎儿基因型确定子模块,用于当来源于母亲的单倍型与来源于父亲的单倍型分别与所述人群中特定突变位点的特定单倍型的比较结果均不一致时,确定所述胎儿在所述特定突变位点的基因型为野生型。

21.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行权利要求1至10中任意一项所述的检测方法。

22.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至10中任意一项所述的检测方法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1