本发明涉及一种个体识别的方法和系统,尤其涉及一种对未知检材进行个体识别的方法和系统。
背景技术:
插入-缺失多态性(insertion-deletion,InDel),是一段DNA片段的插入或者缺失所形成的特殊类型的二等位基因多态性。相对于STR与SNP,InDel有以下几个特点:(1)广泛的分布在整个基因组中;(2)缘于单突变事件,并且发生频率低,发生后较稳定,不易复发突变;(3)可以成为始祖信息位点,判断地域来源;(4)InDel可以在较小的扩增子中扩增,适用于降解DNA的检测;(5)InDel可以利用法医DNA实验室现有的仪器设备进行基因分型;(6)InDel同时可以适用于自动化和高通量的技术。
因此,InDel受到国内外学者的关注,并且已有多位学者建立了适用于对本民族多态性研究的复合体系。但由于中国人群中各民族等位基因多样,如何建立了一套基于InDel基因座的、适用于广泛的中国人群的法医DNA鉴定的复合扩增体系,使之成为替代STR检测体系分析DNA样本的另一有力手段,成为有待解决的问题。
技术实现要素:
本发明提供了一种对未知检材进行个体识别的方法,能获得未知检材包括30个InDel基因座与1个性别鉴定基因座在内共31个基因座的分型结果,从而实现对未知检材的个体识别。
本发明还提供一种对未知检材进行个体识别的系统,通过该系统可以实现对未知检材针对上述31个基因座的准确分型,从而对未知检材进行个体识别。
本发明还提供了一种复合检测体系,所述检测体系能准确获得未知检材包括30个InDel基因座与1个性别鉴定基因座在内共31个基因座的分型结果。
本发明还提供了一种检测试剂盒,包括所述的复合检测体系。
本发明提供的一种对未知检材进行个体识别的方法,该方法包括:
1)提取未知检材的DNA;
2)获得所述DNA包括30个InDel基因座与1个性别鉴定基因座Amelogenin在内共31个基因座的分型结果,所述30个InDel基因座为rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;
3)根据未知检材31个基因座的基因型进行个体识别。
在本发明的方案中,所述31个基因座是申请人通过对中国人群的生活环境、种族起源等进行综合分析,考察各地区民族人口的表型特征差异,包括外形特征,生理指标等,针对这些差异进行文献和网络数据库调研,在已有研究的基础上获得的能进行个体识别和亲权鉴定的特异性基因座的组合。所述未知检材可以为来自人体的血样、脱落细胞、骨头、牙齿、精斑和口腔拭子等样本,这些样本的个体来源未知。
在本发明的一个具体实施方式中,所述2)包括采用与所述31个基因座一一对应的31对扩增引物对其进行扩增以获得扩增产物的步骤;所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
在本发明的另一个具体实施方式中,其中2)还包括在获得扩增产物后,使用遗传分析仪分析该扩增产物,以获得所述31个基因座的基因型的步骤。在本发明的方案中,所述遗传分析仪可以是本领域技术人员常规使用的遗传分析仪,例如ABI3130或ABI3500型遗传分析仪,通过ID-X软件或其他GeneMapper软件等分析该PCR扩增产物中所述31个基因座的基因型。
本发明提供的一种对未知检材进行个体识别的系统,所述系统包括DNA提取体系,复合检测体系,以及推断体系;所述DNA提取体系用于提取未知检材的DNA;所述复合检测体系用于获得所述DNA包括30个InDel基因座与1个性别鉴定基因座Amelogenin在内共31个基因座的分型结果,所述30个InDel基因座为rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;
所述推断体系用于根据未知检材31个基因座的基因型进行个体识别。
在本发明的一个具体实施方式中,所述复合检测体系用于采用与所述31个基因座一一对应的31对扩增引物对其进行扩增以获得扩增产物,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
更进一步的,所述复合检测体系还用于在获得扩增产物后,使用遗传分析仪分析该扩增产物,以获得所述31个基因座的基因型。
本发明提供的一种复合检测体系,所述体系包括未知检材DNA,31个基因座,以及扩增引物,所述复合检测体系用于获得所述DNA包括30个InDel基因座与1个性别鉴定基因座Amelogenin在内共31个基因座的分型结果,所述30个InDel基因座为rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;所述扩增引物由与所述31个基因座一一对应的31对扩增引物组成,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
在本发明的方案中,所述DNA聚合酶可以是Fast Start DNA聚合酶、Taq DNA聚合酶、Hotstart DNA聚合酶中的一种或多种。
本发明还提供了一种检测试剂盒,包括所述的复合检测体系。
在本发明的方案中,本发明利用所述复合检测体系进行31个基因座的分型的方法,包括:1)将提取的未知检材DNA作为模板;2)使用所述扩增引物对作为模板的未知检材DNA进行多重PCR扩增反应以得到扩增产物;3)将所述扩增产物利用遗传分析仪进行分析,以获得31个基因座的分型结果。
本发明方案具有以下的优点:
1、本发明的方法和系统采用特定的31个基因座进行个体识别,这些基因座在汉族、哈萨克族、傣族、苗族与瑶族五个民族的遗传多态性调查中,累积个人识别率分别为0.999999999957、0.999999999990、0.999999999974、0.999999999875及0.999999999966,具有较高的累积个体识别率。
2、本发明的方法和系统适用于广泛的中国人群,可以为法庭科学实验室检测降解检材提供有效的技术支持,同时降低检测成本,成为替代STR检测体系进行DNA样本分析的另一有力手段。
3、本发明提供的方案能有效从基因水平实现对未知检材来源的推断,为中国人群个体识别及亲权关系鉴定等提供准确的科学依据。
附图说明
图1利用复合扩增体系检验标准DNA9947样品的分型图谱。
具体实施方式
以下实施例中使用的421份无关个体的新鲜外周静脉血样,其中北京汉族94份,云南傣族97份,新疆哈萨克族95份,广西苗族69份,广西瑶族66份,由公安部物证鉴定中心提供。
以下实施例中使用的dNTP(10mM)、10×PCR buffer(15mM Mg2+)、10×PCR buffer(15mM Mg2+)、快速启动酶Hotstar Taq plus(5U/μl)、人类标准品(9947,1ng/μl)、分子量内标Typer500均购自公安部物证鉴定中心,POP7电泳凝胶、去离子甲酰胺均购自美国AB公司,荧光标记PCR引物由上海生工合成。9700型PCR仪,3130XL遗传分析仪为美国AB公司。
实施例1、对本发明的对未知检材进行个体识别的方法和系统准确性的验证
在本实施例中,所述未知检材为421份无关个体的新鲜外周静脉血样,其中北京汉族94份,云南傣族97份,新疆哈萨克族95份,广西苗族69份,广西瑶族66份,已知其个体来源,但在本申请实施例1的实施过程中设定其个体来源未知,采用本申请方法和系统对其进行个体识别,包括:
1)利用本发明的系统中的DNA提取体系提取未知检材的DNA,2)利用本发明的系统中的复合检测体系获得所述DNA包括30个InDel基因座与1个性别鉴定基因座Amelogenin在内共31个基因座的分型结果,3)利用本发明的系统中所述推断体系,根据未知检材31个基因座的基因型进行个体识别。
本实施例中,所述复合检测体系包括未知检材DNA,31个基因座,以及扩增引物,所述复合检测体系用于获得所述DNA包括30个InDel基因座与1个性别鉴定基因座在内共31个基因座的分型结果,所述30个InDel基因座为rs10629077、rs2308026、rs361519、rs2307652、rs16671、rs33948716、rs8190507、rs1610937、rs2307689、rs2307976、rs1305056、rs2067353、rs1610963、rs2307632、rs17878444、rs140847、rs2307554、rs2308020、rs1610902、rs2307839、rs2307708、rs2308115、rs3047269、rs2067294、rs2307553、rs16438、rs2307981、rs4646006、rs2308072和rs140864;所述扩增引物由与所述31个基因座一一对应的31对扩增引物组成,所述扩增引物为序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列。
1、提取待检测样本的DNA作为模板
按照DNA Blood Midi Kit说明书(Qiagen,德国)提取血样DNA。所有DNA均经Nanodrop2000c(Thermo Scientific,美国)定量后,用超纯水稀释为0.5ng/μl-1ng/μl使用。
2、利用所述复合检测体系进行31个基因座的分型,包括:将提取的未知检材DNA作为模板;使用所述扩增引物对提取的DNA模板进行多重PCR扩增反应,以获得扩增产物;将扩增产物利用遗传分析仪确定31个基因座的分型结果。
具体过程如下:
2.1、引物池配置
扩增引物池的配置,其中所述扩增引物中为所述31个基因座一一对应的31对扩增引物,本实施例中,优选的,所述31个基因座的扩增引物为序列表中SEQ ID No.1至SEQ ID No.62的核苷酸序列;本发明提供的各种引物序列由上海生工生物工程技术服务有限公司合成。
将合成好的引物用1×TE缓冲液稀释到100μM,将31个基因座的上下游引物按照以下体积和浓度进行混合作为31重PCR引物池(即PrimerMix)。
2.2、多重PCR反应
本实施例使用9700型PCR扩增仪进行多重PCR反应。
(1)配置PCR mix(10μL体系),如下表5所示。
表5
(2)扩增程序
PCR扩增过程的热循环参数为:95℃11min;94℃30s,60℃120s,72℃90s,共30个循环;60℃延伸60min。
2.3、PCR产物分型
取1μL PCR产物与9.5μL去离子甲酰胺、Typer500内标混匀,95℃3min后立即冰浴5min。对扩增产物采用ABI 3130XL型遗传分析仪通过ID v3.2软件进行分析,获得所述31个基因座的基因型。
2.4、结果分析
为了验证分型结果的准确性,从421份DNA样品中随机抽取50份DNA样品,对31个基因座进行测序(北京迈奥德恩生物科技有限公司测序),采用本实施例的复合检测体系获得的所有的分型结果与测序结果均一致,一致性达到100%,此结果证本发明复合检测体系分型结果准确。
同时使用标准DNA9947为模板使用本发明的系统进行PCR扩增,并对其31个基因座进行分型,分型结果见图1所示,与DNA9947测序结果一致。
3、根据未知检材31个基因座的基因型进行个体识别
由本实施例方法获得的上述421份检材的个体来源结果,与其已知的个体来源结果一致,说明本发明方法可以对未知检材进行个体识别。
实施例2本发明检测系统中30个InDel基因座在不同民族的平衡检验
采用本发明系统按照实施例1所述方法获得421例人的无关个体的分型结果,并基于30个基因座在各民族中的个体识别率(DP值,见表6),计算30个常染色体InDel基因座在汉族、哈萨克族、傣族、苗族与瑶族五个民族的累积个体识别率(TDP)。
表6
累积个体识别率计算公式为:
TDP=1-(1-DP1)(1-DP2)(1-DP3)…(1-DPK),其中DPK为第k个基因座的DP值。
本申请的检测系统大大提高了对个体的累积个体识别率,在汉族、哈萨克族、傣族、苗族与瑶族五个民族的遗传多态性调查中,累积个人识别率分别为0.999999999957、0.999999999990、0.999999999974、0.999999999875及0.999999999966,具有较高的遗传多态性和累积个体识别率。
序列表
<110> 公安部物证鉴定中心
<120> 一种对未知检材进行个体识别的方法和系统
<130> 165944GF
<160> 62
<170> PatentIn version 3.5
<210> 1
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 1
aatctactct cttgtgccca ctt 23
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 2
aaggcaggaa tgatgagcaa 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 3
aagctgcagg aatcaccaag 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 4
cacggtctag gctcctttca 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
tcatgttgca cacaaatact 20
<210> 6
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
actttgcttt cttggttgt 19
<210> 7
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
gccatgctcc tggttcact 19
<210> 8
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
aatacagcaa ccctgctcca 20
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
ctttcagagg ctaaacagac 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
agatcatgga ctcatcaagt 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
ggaaaagggg aatcaggaaa 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
tcgcaccatt ccagtaacaa 20
<210> 13
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
actggctact ttggcgtctg 20
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
agcccgcctt aaacagagag 20
<210> 15
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
ccaaatagga tgtacagcag gtc 23
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
ctgcagaaaa tgggtcatgt 20
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
ccaaacctcc tccctcagaa 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
agcagccgga tattgggtat 20
<210> 19
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
ggaaacggca cttatgactt c 21
<210> 20
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 20
ccgcagatat tagcctgacc 20
<210> 21
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
tggcagagac tgaaggatga a 21
<210> 22
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
ctgcctcaga acaaaactga a 21
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
attaaggttt ccggcctcac 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
gggaagatga gaaagcaggt 20
<210> 25
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
cctccaagta agcattagc 19
<210> 26
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
gctcactgaa ctgacataa 19
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 27
taggcagaag gaattgagtg 20
<210> 28
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 28
cctaatttgg ccatctgact 20
<210> 29
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 29
gccaaggaac aaactcctca 20
<210> 30
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 30
ttacctgact tacttgccca aa 22
<210> 31
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
gaaaaaaatt gaatcgtgat atc 23
<210> 32
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
ttgatattac caggatagca ttca 24
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 33
aggttttgag aggtggagga 20
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
cgccaggaat tttctatcca t 21
<210> 35
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
gagcacatca caaattcagt cag 23
<210> 36
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 36
tgtgctgtaa atgtagccat gt 22
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 37
agagccagtt agagggagga 20
<210> 38
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
catcccagag gacttgagg 19
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
ggcatcattc gtggtgatta 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 40
agtgcttctc cagctcctca 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 41
atgccctttg actaaatatg 20
<210> 42
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 42
ggctcatatt atacagcagt t 21
<210> 43
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 43
cactactgag atgctttcac caa 23
<210> 44
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 44
cctttcctgt acgtgcttct tt 22
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 45
gagacaggca caccagcat 19
<210> 46
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 46
tgccaaacct tccttgtatc t 21
<210> 47
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 47
ctatgctatc ccggcaattc 20
<210> 48
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 48
cgaggagtga acaagaagca 20
<210> 49
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 49
atacctgcaa agtgggcatt 20
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 50
ccagcaaaca gaacacaagg 20
<210> 51
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 51
gtatggcctc ctccacagag 20
<210> 52
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 52
acagcccacc agagcactac 20
<210> 53
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 53
accgggtgtg cattctacat 20
<210> 54
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 54
gtgcctggcc aagaaaatta 20
<210> 55
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 55
cagatcagca aaggctggta 20
<210> 56
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 56
gtttggaaag aaaggcagga 20
<210> 57
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 57
gcacccagcc ttctccttat 20
<210> 58
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 58
gtggttcatt tcagactaca actca 25
<210> 59
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 59
accacaggca aatcctgaag 20
<210> 60
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 60
gggttaggga ggttggttga 20
<210> 61
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 61
ccctgggctc tgtaaagaa 19
<210> 62
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 62
gagcttaaac tgggaagctg 20