一种基于高通量测序的STR基因座的检测试剂盒及检测方法与流程

文档序号:11613205阅读:493来源:国知局
一种基于高通量测序的STR基因座的检测试剂盒及检测方法与流程
本发明属于法医遗传学领域,涉及检测人类基因组中具有良好法医学应用价值的str遗传标记,具体涉及一种基于高通量测序的34个str基因座的检测试剂盒及其应用和检测方法。
背景技术
:str基因座又称微卫星dna,广泛存在于原核及真核基因组中,约占整个基因组的3%,是一类由2~6个核苷酸为重复单位组成的长达几十个核苷酸的重复序列。str基因座的多态性主要源自核心序列重复次数在个体间的差异,并且这种差异在遗传过程中遵循孟德尔遗传规律。因此,str检测技术被广泛用于法医学个体识别和亲缘鉴定。基于毛细管电泳技术(capillaryelectrophoresis,ce)的pcr-str复合荧光扩增检测是目前str分型的主要技术手段,依托的技术平台是以3100型、3130型和3500型为代表的遗传分析仪,目前这一技术平台主要是五色荧光标记,其中四个颜色用于标记检测的基因座,一个颜色用于标记分子量内标。为了避免各str基因座的排列拥挤、某一基因座稀有等位基因型的出现可能造成与相邻基因座等位基因的交错从而引起分型错误等可能隐患,目前市场上广泛应用的五色荧光str检测试剂盒仍以20个左右的基因座位为主。但是,近年来随着dna鉴定的应用越来越广泛,特别是在司法鉴定领域涉及的缺少参照样本的复杂亲缘关系鉴定中,客观上要求检测更多的多态性str基因座以提供更丰富的遗传信息。另外,毛细管电泳技术依据片段大小对str检测结果进行分型,它仅检测长度多态性,无法提供str内部的序列多态性信息,降低了系统效能。高通量并行测序技术(massivelyparallelsequencing,mps),为解决这一问题提供了方法学上的前景。与传统的ce技术相比:第一,对于同一str基因座的等位基因,高通量测序技术可以在检测str重复基序(motif)数量的同时获取motif序列结构和侧翼序列变异信息;第二,mps技术对文库构建的要求相对宽泛,可以设定为80-600bp,且不限制文库片段大小的均一性。传统ce技术是根据pcr产物大小来排列各基因座位置,要求产物片段大小分布呈现阶梯状,同一荧光素标记的基因座片段大小无重叠。因而,对于法医学常见的降解检材,前者更具技术优势;第三,mps技术目前可以对多达上千个遗传标记完成并行检测。因此,基于高通量测序平台开发str基因座的检测试剂盒对于提升法医dna的鉴定能力具有重要意义。技术实现要素:本发明的目的在于克服现有技术中的缺陷,提供一种基于高通量测序平台的可并行检测人类常染色体34个str基因座的检测试剂盒,提高了dna的鉴定能力。为实现上述目的,本发明采用如下技术方案:一方面,本发明提供一种str基因座的引物组合物,其包括34个str基因座的引物对和1个性别基因座的引物对;其中,所述34个str基因座包括d1s1677、d1s1656、tpox、d2s441、d2s1776、d2s1338、d3s1358、d3s4529、d4s2408、fga、d5s818、csf1po、d6s1043、d6s474、d7s820、d8s1179、d9s1122、d10s1248、th01、vwa、d12s391、d12ata63、d13s317、d14s1434、pentae、d16s539、d17s1301、d18s51、d19s433、d20s482、d21s11、pentad、d22s1045、d5s2500;所述1个性别基因座为amelogenin。优选地,该引物组合物的序列如seqidno:1-seqidno:70所示。本发明所述的基因座及其对应的扩增引物序列如表1所示。表1:34个常染色体str基因座和1个性别基因座及其对应的扩增引物序列另一方面,本发明还提供一种含有上述引物组合物的基于高通量测序的str基因座的检测试剂盒,其用于扩增上述的34个str基因座和1个性别基因座。为了进一步优化上述技术方案,本发明所采取的技术措施还包括:优选地,所述试剂盒还包括自行编写的bed文件,所述bed文件用于str基因座的结果分析。bed文件采用人类基因组grch38序列信息及国际法医遗传学会isfg对于高通量测序的统一命名原则,核定34个str基因座motif结构位置及序列信息,可用于高通量测序仪测序软件(或插件)使用,或采用自行编写插件进行str基因座的分型。该bed文件如下:另一方面,本发明提供一种上述str基因座的检测试剂盒在三联体亲子鉴定、二联体亲子鉴定、祖孙鉴定、同胞鉴定以及个体识别司法鉴定领域中的应用。最后,本发明还提供一种上述str基因座的检测试剂盒的检测方法,包括如下步骤:步骤1)取样本dna于pcr扩增体系中,采用聚合酶链式反应进行文库的构建;步骤2)对步骤1)中构建的文库进行纯化和定量;步骤3)对步骤2)定量后的文库进行接头和测序引物的连接;步骤4)对步骤3)制备的文库在高通量测序平台完成测序;步骤5)采集测序信号,采用自行编写的bed文件对步骤4)获取的测序文件进行质控及结果分析。为了进一步优化上述技术方案,本发明所采取的技术措施还包括:优选地,所述样本dna采集于血液(斑)、唾液(斑)、精液(斑)、毛发、组织等人体生物检材;或者,可选的,所述样本dna为标准品dna,如女性标准品dna9947a、男性标准品dna9948等。优选地,所述步骤1)中pcr扩增体系包括pcr反应缓冲液、如seqidno:1-seqidno:70所示序列的引物组合物、taq聚合酶以及去离子水。优选地,所述步骤1)中聚合酶链式反应的扩增程序为:95℃预变性11min;94℃30s,60℃60s,70℃60s,22个循环;60℃延伸30min。优选地,所述步骤2)中的纯化采用ampure磁珠完成,所述步骤2)中的定量可采用qubit或qpcr方式。优选地,所述步骤4)中的高通量测序平台包括iontorrent或者miseq。优选地,所述步骤5)中的结果分析为针对fasta格式测序信息采用自行编写插件进行34个常染色体str基因座和1个性别基因座进行结果分型。与现有技术相比,本发明具有以下有益效果:本发明提供了一种基于高通量测序技术对人类34个常染色体str基因座和1个性别基因座进行并行检测的试剂盒,包括文库构建、测序质控及结果分析等。本发明利用了高通量测序技术对str基因座进行并行测序,在读取等位基因分型信息的同时可以获取序列内部及侧翼序列的变异信息;单次测序可以获取多达384个样本在34个str基因座的序列信息,节约dna样本量及检测时间;片段文库集中于150-300bp,对于降解检材可以获取更为丰富的信息量。附图说明图1为分析插件后台bed文件示意图;图2为d8s1179基因座采用高通量测序后等位基因13及stutter峰12的序列结构信息;图3为d2s1776基因座在不同男女混合比例下的测序分型结果。具体实施方式本发明所述的str基因座的检测试剂盒的主要成分包括:pcr扩增体系和样本dna(可为标准品dna9947a、标准品dna9948),pcr扩增体系具体包括2.5×pcr反应缓冲液ⅱ(ris-hcl、kcl、mgcl2、dntp)、5×引物组合物(34个str基因座和性别基因座的文库构建引物对(序列为seqidno:1-seqidno:70)、taq聚合酶(具有热稳定性的dna聚合酶)以及去离子水。文库构建体系包含5μl2.5×pcr反应缓冲液ⅱ、2μl5×引物组合物,2utaq聚合酶,10ng-1ng的样本dna(可为1μl标准品dna9947a(10ng/μl)或1μl标准品dna9948(10ng/μl))以及11μl去离子水。其中,34个常染色体str基因座包括d1s1677、d1s1656、tpox、d2s441、d2s1776、d2s1338、d3s1358、d3s4529、d4s2408、fga、d5s818、csf1po、d6s1043、d6s474、d7s820、d8s1179、d9s1122、d10s1248、th01、vwa、d12s391、d12ata63、d13s317、d14s1434、pentae、d16s539、d17s1301、d18s51、d19s433、d20s482、d21s11、pentad、d22s1045、d5s2500(ac008791)以及1个性别基因座为amelogenin,各基因座的扩增引物序列信息如上述表1所示。采用本发明所述的str基因座的检测试剂盒的检测方法包括如下步骤:步骤1)取1ng~10ng样本dna(可为1μl标准品dna9947a(10ng/μl)或1μl标准品dna9948(10ng/μl))进行文库构建,pcr体系为20μl,其中含5μl2.5×pcr反应缓冲液ⅱ,2μl5×引物混合物,1μltaq聚合酶(2u),1μl样本dna及11μl去离子水。文库构建的pcr条件:95℃预变性11min;94℃30s,60℃60s,70℃60s,22个循环;60℃延伸30min;步骤2)对步骤1)构建的文库进行纯化和定量。纯化采用ampure磁珠完成,定量可采用qubit或qpcr方式。本次采用qpcr完成文库定量;步骤3)对步骤2)定量后文库进行接头和测序引物的连接;步骤4)对步骤3)制备的文库在高通量测序平台(美国thermofisherscientific公司的iontorrent或美国illumina公司的miseq)完成测序;步骤5)采集测序信号,采用自行编写的bed文件对步骤4)获取的测序文件进行质控及结果分析,其具体为针对fasta格式测序信息采用自行编写插件进行34个常染色体str基因座和1个性别基因座的结果分型。分析插件后台bed文件示意图如图1所示。下面结合附图和实施例,对本发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。实施例1本实施例为d8s1179基因座采用本试剂盒在200名无关个体中获取的等位基因及序列结构。无关个体血斑:由志愿者提供。样本dna提取:采用硅珠法或其他提取方法获得基因组dna。样本检测结果:d8s1179基因座采用本试剂盒在200名无关个体中获取的等位基因及序列结构见下表:基因座等位基因核心序列结构d8s11797[tcta]7d8s11798[tcta]8d8s11799[tcta]9d8s117910[tcta]10d8s117911[tcta]11d8s117912[tcta]1[tctg]1[tcta]10d8s117912[tcta]12d8s117913[tcta]1[tctg]1[tcta]11d8s117913[tcta]13d8s117913[tcta]1[tctg]1[tcta]11d8s117914[tcta]1[tctg]1[tcta]12基因座等位基因核心序列结构d8s117914[tcta]2[tctg]1[tcta]11d8s117915[tcta]2[tctg]1[tcta]12d8s117916[tcta]2[tctg]1[tcta]13d8s117917[tcta]2[tctg]1[tcta]14d8s117918[tcta]2[tctg]1[tcta]15本实施例结果表明,d8s1179基因座在等位基因12、13、14均检测到两种(或两种以上)序列结构,这一信息采用ce检测技术无法获知。例如,一样本采用ce技术检测后分型结果为13,采用本次试剂盒及高通量测序后结果如图2所示,纯合子13存在2种不同的等位基因序列结构,分别为[tcta]1[tctg]1[tcta]11和[tcta]13,stutter峰序列结构为[tcta]12。在所检测的200名无关个体中,采用ce技术获得的等位基因范围为7-18,共12种;采用本试剂盒测序,发现等位基因数目增加至16种。高通量测序技术显然为str基因座的分析提供了更为科学及全面的一种检测手段。这种测序结果的获得对于常见亲权鉴定案件中的突变现象及复杂疑难案件提供了更多的遗传证据。实施例2本实施例为采用上述试剂盒在三联体亲缘鉴定疑似突变现象中的应用。一例三联体亲缘检测案件,涉及生母-孩子(女)-可疑父。基于ce技术的str检测结果:采用常规pcr-ce检测试剂盒goldeye20a(北京基点认知生物有限公司)对19个常染色体str基因座进行检测,发现生母与孩子在19个str基因座上完全符合孟德尔遗传定律,可疑父与孩子在2个str基因座(vwa和fga)发生一步突变。通过计算,累积亲权指数cpi为378.361,根据三联体亲子鉴定标准,无法判断可疑父与孩子之间存在亲子关系。经过对案件当事人的背景调查,发现本例案件中孩子生母坚称可疑父即为孩子生父,且可疑父无兄弟叔伯,孩子生母与可疑父的父亲也未曾有过任何实质性的接触。该案件之前在全国多地均进行过检验,无法给出合理解释。基于本试剂盒的检测结果:采用本试剂盒对上述涉案样本进行及高通量测序检测,结果表明,所检测的34个str基因座除了vwa、fga、d3s4529外,均符合孟德尔遗传规律。经计算,累积亲权指数cpi达10000以上,根据三联体亲子鉴定标准,可认定可疑父与孩子之间存在亲子关系。发生突变基因座vwa、fga和d3s4529的序列结构见下表,vwa和fga测序结果从结构多态性角度再次证实了突变的存在。实施例3本实施例为上述试剂盒在混合样本个体识别中的应用。采用本试剂盒对已知混合比例为100:1,50:1,10:1和1:1的男-女混合样本进行检测。结果表明:两者比例相差50倍时,对于等位基因次要成分依可以检出;当混合比例提高至100:1时,无法对等位基因次要成分信息进行有效提取(无法检出,或检出比例过低,或与stutter峰难以区分)。以d2s1776基因座为例,如图3所示,女性样本基因分型为9-11,男性样本基因分型为10-11,二者共享一个相同的等位基因,混合样本在50:1时的基因型分型结果为9/11/[10],并且可以根据高通量测序读深(reads)进行比例的衡量。另外,发现两个贡献者为同一个等位基因分型但不同序列结构时,混合物检测中显示为一种等位基因,2种序列结构信息,这是传统ce技术所无法提供的信息,可进一步帮助混合样本检测分析。以上对本发明的具体实施例进行了详细描述,但其只作为范例,本发明并不限制于以上描述的具体实施例。对于本领域技术人员而言,任何对该实用进行的等同修改和替代也都在本发明的范畴之中。因此,在不脱离本发明的精神和范围下所作的均等变换和修改,都应涵盖在本发明的范围内。sequencelisting<110>司法部司法鉴定科学技术研究所<120>一种基于高通量测序的str基因座的检测试剂盒及检测方法<160>70<170>patentinversion3.5<210>1<211>22<212>dna<213>artificialsequence<220><223>d1s1677上游引物<400>1gtcaggagctttactggaagca22<210>2<211>30<212>dna<213>artificialsequence<220><223>d1s1677下游引物<400>2caaagtacaggtcaaaactcatcaatagtt30<210>3<211>23<212>dna<213>artificialsequence<220><223>d1s1656上游引物<400>3tctgcctttcaggcatttcagag23<210>4<211>25<212>dna<213>artificialsequence<220><223>d1s1656下游引物<400>4cccatataagttcaagcctgtgttg25<210>5<211>23<212>dna<213>artificialsequence<220><223>tpox上游引物<400>5ccaccttcctctgcttcactttt23<210>6<211>29<212>dna<213>artificialsequence<220><223>tpox下游序列<400>6aagagattcatccaaaattgaactcctca29<210>7<211>22<212>dna<213>artificialsequence<220><223>d2s441上游引物<400>7acggccagaaagttgggtaaag22<210>8<211>26<212>dna<213>artificialsequence<220><223>d2s441下游引物<400>8caccacacccagccataaataacata26<210>9<211>27<212>dna<213>artificialsequence<220><223>d2s1776上游引物<400>9tatggaggaagagaaaaccgaatgaac27<210>10<211>25<212>dna<213>artificialsequence<220><223>d2s1776下游引物<400>10ttggttcagctacttcttcaaggag25<210>11<211>22<212>dna<213>artificialsequence<220><223>d2s1338上游引物<400>11cccttttcctaccagaatgcca22<210>12<211>22<212>dna<213>artificialsequence<220><223>d2s1338下游引物<400>12gtggaggtgcctaaagacttca22<210>13<211>30<212>dna<213>artificialsequence<220><223>d3s1358上游引物<400>13ctcttatactcatgaaatcaacagaggctt30<210>14<211>27<212>dna<213>artificialsequence<220><223>d3s1358下游引物<400>14acttaaaagcctctgctgtaatctcag27<210>15<211>26<212>dna<213>artificialsequence<220><223>d3s4529上游引物<400>15gtctgcctttttagggaatacagtgt26<210>16<211>25<212>dna<213>artificialsequence<220><223>d3s4529下游引物<400>16ggaagaagaaattctccctgacact25<210>17<211>30<212>dna<213>artificialsequence<220><223>d4s2408上游引物<400>17gttatttcatctgattaggagtcacactga30<210>18<211>30<212>dna<213>artificialsequence<220><223>d4s2408下游引物<400>18agtgcttggcatatattaagacactgtaaa30<210>19<211>23<212>dna<213>artificialsequence<220><223>fga上游引物<400>19tttgcgcttcaggacttcaattc23<210>20<211>30<212>dna<213>artificialsequence<220><223>fga下游引物<400>20ctaattgctattaggacatcttaactggca30<210>21<211>27<212>dna<213>artificialsequence<220><223>d5s818上游引物<400>21tttctaaacctctcccatctggatagt27<210>22<211>29<212>dna<213>artificialsequence<220><223>d5s818下游引物<400>22tactgagacatgcatatgcttttaaagct29<210>23<211>23<212>dna<213>artificialsequence<220><223>csf1po上游引物<400>23gccagactgagccttctcagata23<210>24<211>23<212>dna<213>artificialsequence<220><223>csf1po下游引物<400>24cagattgtacagaggaggcactt23<210>25<211>26<212>dna<213>artificialsequence<220><223>d6s1043上游引物<400>25ctaccatgttttgaaggctttgactt26<210>26<211>26<212>dna<213>artificialsequence<220><223>d6s1043下游引物<400>26tcttttcctcccacttctaaaacacc26<210>27<211>26<212>dna<213>artificialsequence<220><223>d6s474上游引物<400>27gtcattttaagcatcatgtcctgcat26<210>28<211>26<212>dna<213>artificialsequence<220><223>d6s474下游引物<400>28ttacatcaccatcttccttggttctg26<210>29<211>30<212>dna<213>artificialsequence<220><223>d7s820上游引物<400>29aagccttatgagataattgtgaggtcttaa30<210>30<211>22<212>dna<213>artificialsequence<220><223>d7s820下游引物<400>30gttggtcaggctgactatggag22<210>31<211>30<212>dna<213>artificialsequence<220><223>d8s1179上游引物<400>31agctgagtctgaagtaagtaaaacattgtt30<210>32<211>30<212>dna<213>artificialsequence<220><223>d8s1179下游引物<400>32tccagtttcttttaccaaattgtgttcatg30<210>33<211>22<212>dna<213>artificialsequence<220><223>d9s1122上游引物<400>33gcttcgcaccaagactccattt22<210>34<211>29<212>dna<213>artificialsequence<220><223>d9s1122下游引物<400>34ggcatttattatttcttgtctgagagctt29<210>35<211>30<212>dna<213>artificialsequence<220><223>d10s1248上游引物<400>35taactcactgccttgaacataattattgct30<210>36<211>25<212>dna<213>artificialsequence<220><223>d10s1248下游引物<400>36caggtattcctcaggaataagtgca25<210>37<211>22<212>dna<213>artificialsequence<220><223>th01上游引物<400>37gtccctgagaaggtacctggaa22<210>38<211>22<212>dna<213>artificialsequence<220><223>th01下游引物<400>38cattggcctgttcctcccttat22<210>39<211>32<212>dna<213>artificialsequence<220><223>vwa上游引物<400>39acacaggttagatagattagacagacagatag32<210>40<211>23<212>dna<213>artificialsequence<220><223>vwa下游引物<400>40gatgtgaaagccctagtggatga23<210>41<211>28<212>dna<213>artificialsequence<220><223>d12s391上游引物<400>41tgtgatagtagtttcttctggtgaagga28<210>42<211>28<212>dna<213>artificialsequence<220><223>d12s391下游引物<400>42ataattacaccatcagtttccctggttt28<210>43<211>30<212>dna<213>artificialsequence<220><223>d12ata63上游引物<400>43taagcatttgtttttggagtaaatgatgca30<210>44<211>22<212>dna<213>artificialsequence<220><223>d12ata63下游引物<400>44gtggcagtgagctgtaacagta22<210>45<211>24<212>dna<213>artificialsequence<220><223>d13s317上游引物<400>45tggtaattctgcctacagccaatg24<210>46<211>29<212>dna<213>artificialsequence<220><223>d13s317下游引物<400>46tcacagataacagtctgaaagtacaagtg29<210>47<211>22<212>dna<213>artificialsequence<220><223>d14s1434上游引物<400>47ctgatttccaccactgggttct22<210>48<211>26<212>dna<213>artificialsequence<220><223>d14s1434下游引物<400>48gcaaatgcacacagatttctgcttac26<210>49<211>29<212>dna<213>artificialsequence<220><223>pentae上游引物<400>49ttacataacatacatgtgtgtaaagtgct29<210>50<211>26<212>dna<213>artificialsequence<220><223>pentae下游引物<400>50gtattacctgagctcaggagatcaag26<210>51<211>26<212>dna<213>artificialsequence<220><223>d16s539上游引物<400>51gtgcacaaatctaaatgcagaaaagc26<210>52<211>30<212>dna<213>artificialsequence<220><223>d16s539下游引物<400>52gccatagacttaaaaacctaatgacacagt30<210>53<211>30<212>dna<213>artificialsequence<220><223>d17s1301上游引物<400>53agatgaaattgccatgtaaaaatacatgca30<210>54<211>30<212>dna<213>artificialsequence<220><223>d17s1301下游引物<400>54ggtaggtacatgtgtcattttctttttgtt30<210>55<211>26<212>dna<213>artificialsequence<220><223>d18s51上游引物<400>55gcacttcactctgagtgacaaattga26<210>56<211>27<212>dna<213>artificialsequence<220><223>d18s51下游引物<400>56tggtgtgtggagatgtcttacaataac27<210>57<211>26<212>dna<213>artificialsequence<220><223>d19s433上游引物<400>57gggttctaggaatcaatcttccttct26<210>58<211>28<212>dna<213>artificialsequence<220><223>d19s433下游引物<400>58gttgaggctgcaaaaagctataattgta28<210>59<211>28<212>dna<213>artificialsequence<220><223>d20s482上游引物<400>59gggaaattccttgctgttattgtttctt28<210>60<211>25<212>dna<213>artificialsequence<220><223>d20s482下游引物<400>60tctcagattgggagatacactgtca25<210>61<211>26<212>dna<213>artificialsequence<220><223>d21s11上游引物<400>61cctgattcttcagcttgtagatggtc26<210>62<211>30<212>dna<213>artificialsequence<220><223>d21s11下游引物<400>62gagaagggagaaacactgtaaggttttata30<210>63<211>23<212>dna<213>artificialsequence<220><223>pentad上游引物<400>63catggtgaggctgaagtaggatc23<210>64<211>30<212>dna<213>artificialsequence<220><223>pentad下游引物<400>64aaatatttgcctaacctatggtcataacga30<210>65<211>22<212>dna<213>artificialsequence<220><223>d22s1045上游引物<400>65cgtccctctggtctgcataaga22<210>66<211>27<212>dna<213>artificialsequence<220><223>d22s1045下游引物<400>66gtctcctcagctgtagaatggaaatag27<210>67<211>22<212>dna<213>artificialsequence<220><223>d5s2500上游引物<400>67cctgtagacctgcacacctgta22<210>68<211>23<212>dna<213>artificialsequence<220><223>d5s2500下游引物<400>68cccagagttccacaccataaact23<210>69<211>29<212>dna<213>artificialsequence<220><223>amelogenin上游引物<400>69acttacagccatatttaggaggaaagagt29<210>70<211>25<212>dna<213>artificialsequence<220><223>amelogenin下游引物<400>70tactctctcttcccttccttcacac25当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1