一种基于22个cSNP遗传标记的复合检测体系及其应用

文档序号:36892256发布日期:2024-02-02 21:24阅读:36来源:国知局
一种基于22个cSNP遗传标记的复合检测体系及其应用

本发明涉及分子生物,具体涉及到一种基于22个csnp遗传标记的复合检测体系及其应用。


背景技术:

1、随着测序技术的不断发展,二代测序技术(next generation sequencing,ngs)已经频繁用于传统使用基因检测的医学实践中,而全外显子组测序(whole exomesequencing,wes)技术也已在临床工作中广泛开展。wes分析整个实验部分步骤多、流程长,涉及多次样本转移,因此发生人为失误所导致的样本标记错误、样本互换或交叉污染的概率较高。对wes样本进行个人识别和亲权鉴定,有助于提高wes检测的准确性、可靠性,从而实现其样本在检测全程中的有效追踪溯源,进而提高wes检测的可信度水平。

2、样本的个人识别或同一认定、受检样本间亲权关系的鉴定,是法医遗传学实践中的常见工作内容。目前用于法医遗传学个人识别及亲权鉴定的多态性遗传标记主要包括:短串联重复序列(short tandem repeat,str)、单核苷酸多态性(single nucleotidepolymorphism,snp)、插入/缺失多态性(insertion/deletion polymorphism,indel)等。现阶段法医遗传学用于个人识别及亲权鉴定的主流遗传标记为str,常用str检测试剂盒主要以下列位点为核心:(1)联合dna索引系统(combined dna index system,codis),包括csf1po、fga、th01、tpox、vwa、d3s1358、d5s818、d7s820、d8s1179、d13s317、d16s539、d18s51、d21s11等13个位点,其累积随机匹配概率为2.0028×10-15;(2)扩展美国核心位点(expanded u.s.core loci),包括13个codis位点,及d1s1656、d2s441、d2s1338、d10s1248、d12s391、d19s433、d22s1045共20个位点,其累积随机匹配概率为2.022×10-22。其中,包含13个str位点的codis系统效能就可以满足基本的个人识别及亲权关系认定需求。而法医现有个人识别试剂盒中所包含的遗传标记无论以str为主、还是以snp或indel为主,位点的检测目标区域均未限定只位于外显子区、且基本都位于相应基因的内含子区或基因间区,样本此类位点的基因型难以从其wes数据中全部获取,因此限制了这些试剂盒在wes个人识别及亲权关系认定中的应用。部分临床分子实验室在进行wes样本分析检测过程中,增加了对每个受检样本进行独立的荧光定量pcr(quantitative fluorescent polymerase chainreaction,qf-pcr)检测以辅助工作人员进行样本的个人识别和亲权关系判断,该检测原本主要用于样本的13、18、21号染色体及性染色体的非整倍体分析,包含的str位点的检测区域几乎均位于基因间区或基因内含子区。qf-pcr检测体系与前述法医个人识别试剂盒类似,通过其获得的分型结果同样无法与wes测序结果进行比对。

3、综合分析发现,编码区str与编码区多态性较高的snp(等位基因频率≥0.3且等位基因数≥3)的数量相近,然而由于ngs数据自身的限制,若通过wes获得str位点序列信息,可能存在以下分析困难:(1)侧翼序列高度重复会导致str比对质量低下;(2)高gc含量的序列在pcr过程中容易发生扩增偏倚,引起测序覆盖度发生偏差;(3)str片段长度越长,各方面的误差明显增加等问题。此外,由于str位点序列信息的复杂性,对ngs数据中的str位点进行分析处理的软件还在研究发展当中,对于部分str而言,使用ngs可能无法获得其可靠基因分型。snp属于单个碱基的变化,其通过ngs检测获得的基因分型可靠性优于str。因此,利用外显子区编码snp(coding snp,csnp)构建个人识别体系对wes样本进行个人识别和trio样本亲权关系认定,同时对wes测序数据中相应csnp位点基因分型进行获取比对从而确定检测样本的同一性,优于利用str。

4、通过对相关文献分析发现,已有研究在处理wes样本的个人识别及亲权关系确认问题方面存在局限性:

5、1.(1)pengelly等从csnp入手,通过分析不同外显子捕获试剂盒中共有csnp位点,并结合1000genomes project和uk10k project数据库中样本数据进行验证评估,最终筛选出22个二等位基因csnp位点,但作者并未对此部分csnp位点建立相应的检测方法,只期为各实验室自行建立样本识别方法提供遗传标记参考依据。该研究中的22个csnp理想累积随机匹配概率接近3.0243×10-9(20个maf为0.5的二等位基因csnp),其识别效能远不及codis,无法满足基本的个人识别及亲权关系确认需求;各实验室自行建立csnp位点检测方法可能存在时间和成本上的浪费、以及操作上的困难。

6、(2)helsmoortel等根据上述22个csnp位点,利用高分辨率熔解曲线(highresolution melting,hrm)方法,建立了包含其中21个csnp、共8次反应的复合检测体系,该方法具有通量高、检测时效快等优点。该研究所建立的检测方法,完成一例样本的分型需要检测8个体系,实验操作和结果整合步骤相对较多,增加了人为失误的风险;同样,21个二等位基因csnp的识别效能,无法满足如今数量日益增长的wes检测样本基本的个人识别和亲权关系确认需求。

7、2.(1)du等基于常用snp芯片,结合生物信息学方法组建了一个包含74个全基因组范围的snp panel,同时建立了一个界面友好的在线验证工具,即使是非专业遗传工作者使用该工具也能清楚判断两个测序数据的一致性情况。然而,74个snp来源于全基因组,只有部分位于外显子区,无法直接应用于wes数据分析;对单个样本wes检测而言,需要获得样本的两次独立测序结果后抓取两组snp分型,继而进行相互比对才能完成样本的同一性认定,用于二代测序的时间成本和试剂成本相应增加。

8、(2)lee等构建的样本一致性验证软件-ngscheckmate,可实现对样本同种测序数据、同种测序不同数据类型(fastq、bam等)以及不同测序(全基因组测序whole genomesequencing,wgs;wes;rna测序rna-sequencing,rna-seq等)同种数据类型中对应筛选的11696个snp分型进行分析;wesrphal等在人类基因组中筛选了6000个snp,并开发了一个贝叶斯框架-smash,可对不同二代测序数据集对应样本是否匹配进行有效识别;javed等基于连锁不平衡(linkage disequilibrium,ld)原理,使用约六万个snp建立了能够检测不同类型二代测序数据间样本是否存在互换的工具-crosscheckfingerprints(crosscheck)。此三类方法从不同角度出发,均可解决同一样本不同测序数据之间的样本的同一性比对问题,然而仍存在需两次独立测序获得两组相应snp分型后才能进行分析比对的缺点,此外数量庞大的snp在trio样本的亲权关系分析中可能存在一定困难。


技术实现思路

1、针对现有技术中的上述不足,本发明提供了一种基于22个csnp遗传标记的复合检测体系,有效解决了wes样本个人识别、亲权鉴定及溯源的问题。

2、为实现上述目的,本发明解决其技术问题所采用的技术方案是:提供一种基于22个csnp遗传标记的复合检测体系,包括用于扩增22个csnp遗传标记的普通复合pcr引物混合物和用于延伸22个csnp遗传标记的普通复合pcr产物的单碱基延伸引物混合物。

3、上述22个csnp遗传标记为rs1051614、rs12990557、rs2279819、rs231399、rs2304035、rs3734557、rs12179、rs6559167、rs2297079、rs12221474、rs3741097、rs4758686、rs5960、rs3737171、rs3743399、rs8048410、rs6503070、rs3744877、rs1128925、rs6061243、rs2249057和rs9620123。

4、上述用于扩增22个csnp遗传标记的普通复合pcr引物混合物所包含的44条pcr引物序列如seq id no.1~44所示。

5、上述用于延伸22个csnp遗传标记的普通复合pcr产物的单碱基延伸引物混合物所包含的22条单碱基延伸引物序列如seq id no.45~66所示。

6、本发明还提供了采用上述基于22个csnp遗传标记的复合检测体系的dna分型检测的方法,包括以下步骤:

7、s1、待检测样本dna在第一pcr扩增反应体系中扩增,得扩增产物;

8、s2、将步骤s1所得扩增产物在酶处理反应体系一中进行孵育,得孵育产物一;

9、s3、将步骤s2所得孵育产物在第二单碱基延伸反应体系中延伸,得延伸产物;

10、s4、将步骤s3所得延伸产物在酶处理反应体系二中进行孵育,得孵育产物二;

11、s5、将步骤s4所得孵育产物二进行毛细管电泳及数据分析。

12、进一步,步骤s1中,第一pcr扩增反应体系包括taq reaction mix、普通复合pcr引物混合物、dna模板和去离子水。

13、进一步,上述taq reaction mix、普通复合pcr引物混合物、dna模板和去离子水的体积比为4~6:1~3:0.5~1.5:1~3。

14、进一步,taq reaction mix为5μl,普通复合pcr引物混合物为2μl,dna模板为1μl,去离子水为2μl。

15、进一步,扩增条件为95℃,15min;30个循环,94℃,30s,58.5℃,90s,72℃,60s;60℃,30min。

16、进一步,步骤s2中,酶处理反应体一系包括1u虾碱性磷酸酶、2.4u外切酶i和步骤s1所得扩增产物。

17、进一步,上述1u虾碱性磷酸酶、2.4u外切酶i和步骤s1所得扩增产物的体积比为0.5~1.5:0.5~1:2~3。

18、进一步,1u虾碱性磷酸酶为1μl,2.4u外切酶i为0.6μl,步骤s1所得扩增产物为2.5μl。

19、进一步,孵育条件为37℃,1h,80℃,12min。

20、进一步,步骤s3中,第二单碱基延伸反应体系包括snapshot ready reactionmix、单碱基延伸引物混合物、步骤s2所得孵育产物和去离子水。

21、进一步,上述snapshot ready reaction mix、单碱基延伸引物混合物、步骤s2所得孵育产物和去离子水的体积比为1~2:1~2:1~2:0.5~1。

22、进一步,snapshot ready reaction mix为1.5μl、单碱基延伸引物混合物为1.3μl,步骤s2所得孵育产物为1.5μl,去离子水为0.7μl。

23、进一步,延伸条件为25个循环,95℃,10s,53℃,5s,60℃,30s。

24、进一步,步骤s4中,酶处理反应体系二包括1u虾碱性磷酸酶和步骤s3所得扩增产物二。

25、进一步,上述1u虾碱性磷酸酶和步骤s3所得延伸产物的体积比为0.5~1.5:4~6。

26、进一步,1u虾碱性磷酸酶为1μl,步骤s3所得延伸产物为5μl。

27、进一步,孵育条件为37℃,1h,80℃,12min。

28、进一步,上述基于22个csnp遗传标记的复合检测体系在wes样本溯源、个人识别、同一性认定和亲子鉴定中的应用。

29、进一步,采用上述基于22个csnp遗传标记的复合检测体系的dna分型检测的方法在wes样本溯源、个人识别、同一性认定和亲子鉴定中的应用。

30、综上所述,本发明具有以下有益效果:

31、1、本发明从下载自exac数据库(目前该数据库已整合至gnomad数据库)中的外显子序列数据(版本号为r1)中筛选了22个csnp遗传标记、利用snapshot技术方法建立了一个复合检测体系,可一次性快速、准确地获得wes样本的22个csnp遗传标记的分型,同时可直接从样本的wes数据中提取此22个csnp遗传标记的分型,从而用于wes样本的同一认定和亲权关系分析。

32、2、本发明实现了同时满足wes样本及wes数据的同一认定和亲权鉴定对个人识别复合检测体系的需求。snapshot技术方法是利用高效毛细管电泳(ce)平台检测snp遗传标记的成熟方法,而ce平台是医学遗传学实验室或分子检验实验室常配检测平台,本发明检测体系可直接应用,无需增加新的仪器设备,缩短实验时间,降低实验成本,可推广程度高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1