本发明属于法医学检测试剂盒领域,具体涉及一种基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒。
背景技术
y染色体是男性特有的染色体。y染色体dna全长约60mb,两端约占y染色体的5%区域为拟常染区(pseudoautosomalregion,par),在减数分裂过程中,拟常染区可与x染色体相应区段发生重组和交换,其余的95%的区域为非重组区域(non-recombiningy,nry),不会与任何染色体区段发生重组。y染色体只能由父亲传向儿子,在忽略突变的情况下,同一家系的后代拥有完全相同的y染色体非重组区。因此y染色体不仅决定了性别,还具有与其他染色体不同的遗传特征,即父系遗传、单倍体遗传和有效群体数量小等。y染色体的这些特征对其结构、突变过程以及族群内部和族群之间的多样性具有显著影响。y染色体遗传标记不仅在法医亲缘关系鉴定及个人识别中具有重要意义,在样本族源推断研究中也展现出很大的优势。近年来,随着千人基因组计划完成及大规模平行测序技术的发展,大量y染色体遗传标记,包括单核苷酸多态性(snp)、插入/缺失多态性(indel)和alu序列被发现。这些遗传标记按照一定的时间顺序逐一发生突变,可以清晰地记录群体的起源分化事件以及群体间亲缘关系远近,据此可构建人类y染色体系统进化树,研究人类进化和群体结构。法医学工作者和人类学家注意到,由于不同人群和不同地区间单倍群的分布存在一定的特征,通过对检案中未知来源的男性样本进行单倍群划分,可以推断其种族来源或地理来源,从而辅助案件侦查。划分的单倍群分辨率直接影响着推断的准确度和得到的信息量。因此,构建高分辨率y染色体系统进化树具有重要的法医学意义。目前已经构建的y染色体snp遗传标记检测体系中,大部分是基于全球人类y染色体进化树中定义的单倍型类群特异的snp,主要用于区分来源于不同大陆的主要人群,分辨率较低。中国是一个拥有56个民族的国家,根据各个群体和地区的男性y染色体遗传结构特点,构建一个稳定且分辨率高的y染色体系统进化树,为法医检案中推断未知来源男性检材的族源提供依据,具有重要的现实意义。
单核苷酸多态性(singlenucleotidepolymorphisms,snps)是指基因组中特定位置单个碱基的变异,是人类基因组中含量最丰富的dna序列多态性。snp具有以下特点:snp大多为二等位基因遗传标记,易于分型和确定基因频率;snp的突变率远低于str遗传标记,具有较高的遗传稳定性;snp在人类基因组中分布广泛,总数约有300万个;snp的扩增产物可小于200bp,适用于法医实际检案中常见的降解、微量检材的分析等。第22届国际法医遗传学大会将snp划分为四种。一为个体识别的snps(individualidentificationsnps,iisnps),近年来随着二代测序技术的推广和应用,使用较多的snp位点进行个人识别,尤其是降解检材已成为法医研究热点;二位祖先信息snps(ancestryinformativesnps,aisnps),可以用于推断样本的祖先来源。snps定义稳定的单体型,称为单倍群(haplogroups),并利用单倍群构建稳健的系统进化树,用于人类起源进化的研究,并推断样本的祖先来源;三为系谱信息snps(lineageinformativesnps,lisnps),紧密连锁的snp位点,可以应用于亲缘关系鉴定;四为表型信息snps(phenotypeinformativesnps,pisnps),可用于鉴别人类表型特征的snp位点,如单双眼睑、瞳孔颜色、头发的颜色等,作为一种辅助案件侦查的手段。
关于snp检测技术有单碱基延伸反应、大规模平行测序、sanger测序和snp芯片技术。大规模平行测序可以发现更多的snp位点,但成本较高,且其准确率受测序深度及宽度的影响。sanger测序成本高、耗时长、对待测样本dna的量依赖性很强,不适合应用于实际检案当中。在法医学领域,单碱基延伸反应技术已被广泛应用于snp遗传标记的分型。与sanger测序相比,该技术能够一次性复合检测多个snp位点,具有所需dna模板量少、扩增片段小(小于200bp)等优点,特别适用于骨骼、毛发样本、降解检材和微量检材的检测。与大规模平行测序相比,其具有成本低、操作简单、假阳性率低的优点。该技术可借助于法医学遗传实验室广泛使用平台-毛细管电泳平台进行检测,易于推广因此,法医研究人员多采用单碱基延伸反应技术建立可同时分型多个snp位点的法医学检测体系。
中国常见的y单倍群包括o、d、c、n、g、h、j、r等,其中o、d、c和n是最主要的四个y单倍群。目前,已有研究开发了基于55个y染色体snp遗传标记的法医学复合检测试剂盒和基于56个y染色体snp遗传标记的法医学复合检测试剂盒,这些试剂盒可将中国男性个体样本正确归属至高分辨率的y染色体系统进化树细枝上,包括y单倍群o、c、n、g、h、j、和r,从而推断未知男性检材的族源。然而,单倍群d作为中国最主要的四个y单倍群之一,且其亚单倍群的分布具有非常好的群体特异性和地理特异性,现有的y染色体高分辨率系统进化树却没有这一单倍群的细枝,从而不能准确的将样本正确归属至高分辨率的y染色体的d单倍群细枝上,分辨率还有待提高。
技术实现要素:
本发明要解决的技术问题是:现有的检测试剂盒只能准确的将样本归属到y染色体上,无法更准确的将其归属至单倍群d细枝上的问题。
本发明解决上述技术问题的技术方案为:提供了一种基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒,包括分离包装的复合扩增引物混合物,多重单碱基延伸反应引物混合物和标准dna;所述的复合扩增引物与多重单碱基延伸反应引物的snp位点如下表1所示:
表1复合扩增引物与多重单碱基延伸反应引物的snp位点
进一步的,上述基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒中,所述的复合扩增引物混合物包括40条,各引物的核苷酸序列如表2所示:
表2复合扩增引物混合物序列
进一步的,上述基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒中,所述的多重单碱基延伸反应引物混合物包括40条,各引物的核苷酸序列如表3所示:
表3单碱基延伸引物混合物序列
上表中,“-”符号前为加尾序列。
进一步的,上述基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒中,所述的法医学复合检测试剂盒包括标准dna,所述标准dna为2800m标准dna。
本发明还提供了一种上述基于20个y染色体单倍群d的snp遗传标记法医学复合检测试剂盒在将样本细分至高分辨率y染色体系统进化树单倍群d的细枝上的用途。
本发明还提供了一种基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒的使用方法,包括以下步骤:
a、提取待检测样本的dna,作为扩增模板;
b、采用复合扩增引物混合物和复合扩增反应混合液对步骤a提取的dna进行两个体系复合扩增;
c、纯化步骤b的复合扩增产物,并以它为模板,利用多重单碱基延伸引物混合物和单碱基延伸反应混合液进行两个体系的多重单碱基延伸反应;
d、用虾碱性磷酸酶纯化步骤c的产物,再进行毛细管电泳分析,根据电泳结果获得样本的基因分型结果。
其中,上述基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒的使用方法中,步骤b所述的复合扩增pcr的反应的循环参数为:95℃,15分钟;94℃,30秒,66℃-60℃,90秒,72℃,30秒,12个循环的降落扩增;94℃,30秒,60℃,90秒,72℃,30秒,17个循环;然后72℃,10分钟;4℃保存。
其中,上述基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒的使用方法中,步骤c所述多重单碱基延伸反应的循环参数为:94℃,10秒,50℃,5秒,60℃,30秒,26个循环后4℃保存。
本发明的有益效果为:
本发明试剂盒包含y染色体单倍群d中的20个y染色体单倍群d的snp遗传标记,这些snp标记定义的单倍群d亚单倍群涵盖了中国男性主要的单倍群d亚单倍群,并且具有很好的群体特异性以及地理特异性,可将中国男性样本划分至d单倍群的细枝上。本试剂盒应用了单管内复合扩增和多重单碱基延伸技术,可以一次性获得生物检材20个y染色体单倍群d的snp遗传标记的基因分型,简单快速进行法医学生物检材来源推断。该试剂盒包括标准dna2800m,确保分型结果的准确可靠。该试剂盒复合扩增产物长度最短仅80bp,最长不超过220bp,在法医实际检案中常见的降解检材检测中具有优势;本试剂盒以法医遗传实验室通用的毛细管电泳为检测平台,具有广泛应用和推广价值。
附图说明
图1所示为实施例2所检测的20个y染色体单倍群d的snp遗传标记所构成的单倍群d高分辨率系统进化树,其中进化树分枝上的位点定义对应的单倍群d亚单倍群,从图中可以看出本发明包含了中国人群单倍群d的大部分亚单倍群,构建了一个高分辨率的检测体系;
图2所示为实施例2基于20个y染色体单倍群d的snp遗传标记法医学复合检测试剂盒的电泳分型结果。a为标准dna2800m的分型结果;b和c分别是粗分为单倍群d的127和131样本的分型结果。图中的横坐标数值提示dna链长度,纵坐标数值表示荧光强度,各等位基因峰的上方标示了该峰代表的snp遗传标记。图中可以清晰地观察到标准dna以及两个样本20个y染色体单倍群d的snp遗传标记分型结果,证明本发明开发的20个y染色体单倍群d的snp遗传标记法医学复合检测试剂盒准确有效。
具体实施方式
本发明提供了一种基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒,包括分离包装的复合扩增引物混合物,多重单碱基延伸反应引物混合物和标准dna;所述的复合扩增引物与多重单碱基延伸反应引物的snp位点如表1所示,复合扩增引物混合物和多重单碱基延伸反应引物混合物的各引物核苷酸序列分别如表2和表2所示。
本发明系y染色体snp遗传标记的法医学复合检测试剂盒,是基于筛选得到的20个从属于单倍群d亚单倍群,并与中国人群密切相关的y染色体snp遗传标记,通过毛细管电泳检测平台,利用复合pcr扩增、单碱基延伸技术,构建y染色体snp遗传标记复合检测体系。
该试剂盒的工作原理为:首先通过复合扩增引物混合物和复合扩增反应混合液,对待测样本进行pcr扩增,获得含有20个y染色体单倍群d的snp遗传标记的dna片段。然后以扩增产物,即20个dna片段为模板,利用单碱基延伸反应混合液和相应单碱基延伸反应引物混合液进行多重单碱基延伸反应,获得待测样本的20个y染色体单倍群d的snp遗传标记的单碱基延伸反应产物。将单碱基延伸产物和含有内标的甲酰胺按一定比例混合后,进行毛细管电泳,利用各snp位点单碱基延伸反应产物的片段长度和snp位点的突变类型,确定分型图谱上各等位基因峰所代表的等位基因,从而得到待测样本20个y染色体单倍群d的snp遗传标记的分型结果。
此外,2800m标准dna作为阳性对照与样本同时进行扩增及延伸反应。可根据标准dna的分型结果是否准确,判断检测结果是否可靠。
在本发明中,20个y染色体snp位点选择是构建复合检测试剂盒的关键部分。如前所述,y染色体具有父系遗传、单倍体遗传、有效群体数量小等特点,在人类进化及人群结构研究中有着重要意义。近年来,随着千人基因组计划完成及大规模平行测序技术的发展,大量y染色体遗传标记,包括单核苷酸多态性(snp)、插入/缺失多态性(indel)和alu序列被发现。这些遗传标记按照一定的时间顺序逐一发生突变,可以清晰地记录群体的起源分化事件以及群体间亲缘关系远近,据此可构建人类y染色体系统进化树,研究人类进化和群体结构。目前,国际遗传谱系学会(isogg,www.isogg.org)提供由38,818个y染色体snp位点构建的系统进化树,这个系统进化树有着极高的分辨率,但由于其所含的位点数量太多,部分位点的位置及稳定性有待验证,因此不适用于法医学实际检案。本发明经过大量的筛选实验,最终选择了20个稳定有效的snp位点,构建复合检测体系,补充和完善y染色体高分辨率系统进化树,进而追溯生物检材的族源或地理来源。
本发明试剂盒中snp位点的选择旨在提高y染色体系统进化树单倍群d分枝在中国群体中的分辨率。因此,通过大量分析和研究,本发明制定了纳入本发明试剂盒中的y染色体snp位点的筛选标准:1)snp位点定义单倍群d的亚单倍群;2)定义的亚单倍群在中国男性群体中具有相对较高频率分布;3)snp位点侧翼序列可设计合适的复合扩增引物和多重单碱基延伸引物;4)可用单碱基延伸技术获得稳定的分型结果。根据上述标准,本发明最后筛选出20个y染色体snp位点。
基于20个y染色体snp遗传标记检测试剂盒中所涉及的20个y染色体snp位点信息如表4。
表420个y染色体snp位点
上表中,核苷酸定位为snp位点在hg19版本中的位置。
本发明试剂盒在y染色体snp的检测中运用了复合pcr扩增技术。复合pcr扩增技术可以在一个反应体系中扩增多个目的dna片段,具有方便、快捷、节约样本和低成本的优点,适应法医学实际检案的需要。其中,复合pcr扩增引物的设计是该技术的关键和难点,在设计引物时,本发明充分考虑了以下因素:1)引物gc比在30-70%范围内;2)所有引物的退火温度接近;3)引物长度范围为18-30个碱基;4)扩增产物长度范围在80bp到220bp之间,以适用于降解检材的检测;5)引物自身、引物与模板之间、引物之间无明显的错配、发卡结构和二聚体结构的形成。根据上述标准,本发明设计了20个y染色体单倍群d的snp遗传标记位点的复合检测体系,首次构建了单倍群d分枝高分辨率系统进化树,用于推断未知男性的族源。
本发明通过千人基因组计划数据库网站(1000genomesproject,https://www.ncbi.nlm.nih.gov/variation/tools/1000genomes/)查找y染色体定义单倍群d分枝的snp位点侧翼序列,利用primerpremier6.0设计复合扩增引物,结合预实验结果,经过反复筛选和优化,得到了表3中所列的20对复合pcr扩增引物。所有pcr扩增引物自身、引物与模板之间、引物之间没有形成明显的错配、发卡结构和二聚体结构。
本发明试剂盒利用上述复合pcr扩增引物,获得20个y染色体单倍群d的snp遗传标记的pcr扩增产物,然后以扩增产物为模板,进行单碱基延伸反应。单碱基延伸反应技术,也称微测序技术,是一种基于四种荧光素标记的双脱氧核糖核苷酸,特异性引物延伸反应。多重单碱基延伸反应可以在一个反应体系中通过多条测序引物同时获得多个snp位点的单碱基延伸产物,实现对多个snp位点的一次性同时检测。其特点:1)通过设计不同长度的单碱基延伸引物,同时分析多个snp位点,即根据单碱基延伸反应产物长度的不同区分不同的snp位点;2)根据不同的双脱氧核糖核苷酸标记的荧光素不同区分snp的不同等位基因。为了实现对多个snp位点同时进行单碱基延伸反应,多重单碱基延伸引物的设计是技术关键,应注意以下因素:1)退火温度需大致相同;2)如果单碱基延伸的碱基不同可以根据颜色判别snp位点,如果颜色相同需通过5’加尾,即引物的5’端添加长度不等的序列gcctcc(tcccc)n,调节引物长度,并根据不同长度dna片段的电泳迁移率将不同snp位点的单碱基延伸产物区别开来;3)引物自身、引物之间、引物与模板之间无明显的错配、发卡结构和二聚体结构。
在本发明试剂盒中,所设计的单碱基延伸引物包括两个部分,第一部分为3’端的特异性序列,可与snp上游序列互补结合;第二部分为5’端的加尾序列,按照gcctcc(tcccc)n的原则进行加尾。加尾序列可使不同snp位点的单碱基延伸引物长度不同,最终使不同位点的单碱基延伸产物之间存在长度差异。考虑到不同长度的dna片段在毛细管电泳中的迁移率不同,我们根据以下原则设计snp基因座的单碱基延伸引物:具有相同等位基因的snp位点40bp以下至少间隔5bp;41-60bp至少间隔4bp;61-80bp至少间隔3bp;80-87bp至少间隔2bp。
需要注意的是,为了保证延伸引物的质量,试剂盒中部分位点设计了反向测序引物(r,reverse),比如y7820位点。此时,y7820位点突变类型为g/a,而实际检测到的等位基因会是突变类型的互补碱基,即c/t。当检测到等位基因c,表示y7820位点等位基因为g;当检测到等位基因t,表示y7820位点等位基因为a。在分析检测结果时需要注意单碱基延伸引物的方向。
最后设计出的所有20个y染色体snp位点复合扩增引物和多重单碱基延伸引物的序列参见表5(各序列的序列号分别在表2和表3中)。
表520个y染色体单倍群d的snp遗传标记复合扩增引物和多重单碱基延伸引物参照表
上表中,“-”之前的ggcctcc(tcccc)n序列代表加尾序列。
本发明试剂盒引入阳性对照作为质量控制,用于准确地分析样本基因型。本发明中提供的阳性对照包括了2800m标准dna的所有20个y染色体单倍群d的snp遗传标记的标准分型结果。对未知样本进行毛细管电泳分析时,通过对2800m标准dna分型结果的比对,评估当次检测结果的准确性和可靠性。
本发明试剂盒的结果检测只需在毛细管电泳平台上进行。毛细管电泳法已在法医遗传学实验室广泛应用。本发明选择复合扩增和多重单碱基延伸技术进行y染色体snp遗传标记的检测,根据单碱基延伸产物长度差异区分具有相同碱基的snp位点,根据荧光染料的颜色不同区分snp的不同等位基因。因此本发明试剂盒可以直接应用于任何一个具有毛细管电泳平台的法医遗传学实验室,具有普适性,并易于推广。
更具体的,本发明试剂盒具体包括的组分可为:
a)复合扩增反应混合液:含有pcr缓冲溶液、mgcl2、dntps、dna聚合酶等常用成分。
b)复合扩增引物混合物:如表2所示的基于20个y染色体单倍群d的snp遗传标记的pcr扩增引物对组成的复合扩增引物混合物;复合扩增反应混合液和复合扩增引物混合物用于获得其相应的20个y染色体单倍群d的snp遗传标记的dna片段。
c)扩增产物纯化试剂:含有核酸外切酶1(exoi)、虾碱性磷酸酶(sap);用于将复合扩增的产物进行纯化,以便于进行下一步操作。
d)多重单碱基延伸反应引物混合物:表3所述的14条常染色体高原适应snp遗传标记多重单碱基延伸反应引物组成的混合物。
e)单碱基延伸反应混合液:包括dna聚合酶、mgcl2、缓冲液、荧光标记双脱氧核糖核酸等成分。
复合扩增反应混合液、扩增产物纯化试剂、单碱基延伸反应混合液可使用商业化的产品。
至于提取待检测样本中的模板dna,可使用目前本领域的各种常规试剂,提取dna模板可以参照现有的生物化学或遗传学常规方法即可进行。
利用本发明所述试剂盒,可以对法医dna样本进行分析。分析方法包括以下步骤;
1)提取待检测样本的dna,作为扩增模板。
2)利用上述复合扩增引物混合物和复合扩增反应混合液对步骤1提取的dna进行两个体系复合扩增。所述复合扩增pcr的反应的循环参数为:95℃,15分钟;94℃,30秒,66℃-60℃,90秒,72℃,30秒,12个循环的降落扩增(touchdown-pcr);94℃,30秒,60℃,90秒,72℃,30秒,17个循环;然后72℃,10分钟;4℃保存。
3)纯化步骤2的复合扩增产物,并以它为模板,利用多重单碱基延伸引物混合物和单碱基延伸反应混合液进行两个体系的多重单碱基延伸反应。所述单碱基延伸反应的循环参数为:94℃,10秒,50℃,5秒,60℃,30秒,26个循环后4℃保存。
4)用sap纯化步骤3的产物后进行毛细管电泳分析,根据电泳结果获得样本的基因分型结果。
进一步的,上述方法步骤4中所述的多重单碱基延伸产物分析包括以下步骤:首先对2800m标准dna分型结果进行分析,标准dna分型结果准确,则继续对待测样本进行分析,获得待测样本基因分型。
下面将通过实施例对本发明的具体实施方式做进一步的解释说明,但不表示将本发明的保护范围限制在实施例所述范围内。
1)基因分析仪3130,abi公司;
2)proflexpcr扩增仪,abi公司;
3)台式高速离心机eppendorf公司;
4)纯水装置millipore公司;
5)移液器eppendorf公司;
6)hi-di甲酰胺abi公司;
7)核酸外切酶1takarabiotechnology公司;
8)虾碱性磷酸酶takarabiotechnology公司;
9)内标(genescantmsizestandardgs-120liz)abi公司。
实施例1本发明试剂盒的制备
用于检测的20个y染色体单倍群d的snp遗传标记复合检测试剂盒可包括分别包装的以下试剂:
a)复合扩增引物混合物。由表2所示的扩增引物混合得到,扩增引物由invitrogen公司合成,将合成好的扩增引物用超纯水配置为100pm/μl,然后按照表6中的比例混合,制成复合扩增引物混合物。
b)复合扩增反应混合液。本实施例中使用qiagen公司的pcr反应混合液multiplexpcrmix。
c)多重单碱基延伸反应引物混合物。由表3所示的单碱基延伸反应引物混合得到,单碱基延伸反应引物均由invitrogen公司合成。将合成好的20条延伸引物(用超纯水配置为50pm/μl)按照下表7中给出的比例配成多重单碱基延伸引物混合物。
d)单碱基延伸反应混合液。本实施例中使用abi公司的产品snapshotreadyreactionmix。
e)标准dna2800m,本实施例中使用abi公司的产品标准dna2800m。
将上述试剂分别按各自常规要求包装后即制得基于y染色体snp遗传标记的法医学复合检测试剂盒,用于后续的实验。
表6复合扩增引物的浓度
表7多重延伸引物的浓度
实施例2使用本发明试剂盒检测200份粗分为单倍群d的无关个体样本
使用上述基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒,对200份粗分为单倍群d的无关个体样本进行检测。具体的检测过程按如下进行:
a、用chelex-100法提取200份样本的dna,作为复合扩增模板;
b、以步骤a中的dna为模板,利用复合扩增引物混合物和复合扩增反应混合液将样本在下述扩增体系中进行复合pcr扩增;复合扩增引物混合物0.3μl,复合扩增反应混合液2.5μl,模板dna0.8μl,加ddh2o至5μl;pcr扩增条件为:95℃,15分钟;94℃,30秒,66℃-60℃,90秒,72℃,30秒,12个循环的降落扩增(touchdown-pcr);94℃,30秒,60℃,90秒,72℃,30秒,17个循环;然后72℃,10分钟;4℃保存。
c、多重pcr产物的纯化;每一个样品扩增产物的纯化体系:exoi(5u/μl)1.0μl,sap(1u/μl)2.5μl,多重pcr产物5μl;扩增产物纯化反应条件:37℃60分钟,80℃10分钟;4℃保存。
d、以上一步纯化得到的产物为模板,利用多重单碱基延伸引物混合物进行单碱基延伸反应;体系:单碱基延伸反应混合液1.5μl,多重单碱基延伸引物混合物0.4μl,纯化后扩增产物1.5μl,加ddh2o至5μl;单碱基延伸反应的热循环参数:96℃10秒,50℃5秒,60℃30秒,循环25次;4℃保存。
e、纯化上一步单碱基延伸反应产物;纯化体系:sap(1u/μl)1.1μl,单碱基延伸反应产物5μl;纯化反应条件:37℃60分钟,80℃10分钟,4℃保存;
f、毛细管电泳:
分别取1μl步骤e中得到的纯化后的单碱基延伸产物,加入10μl的hi-di甲酰胺和0.1μl内标混匀;然后95℃下变性3分钟,4℃下迅速冷却后,用美国abi公司基因分析仪3130进行电泳检测。电泳条件:1500v电压,36cm毛细管,pop7凝胶,电泳18分钟;应用datacollection3.0软件收集数据,genemapperidv3.2软件进行结果分析。
200个粗分为单倍群d的无关个体样本的检测结果见表8。
表8检测结果
本发明实施例2所检测的20个y染色体单倍群d的snp遗传标记所构成的单倍群d高分辨率系统进化树如图1所示。由图可知,通过本研究20个y染色体snp位点的检测,可以得到中国男性群体最常见的12个单倍群d的亚单倍群,这是目前分辨率最高的单倍群d细分体系。进行单倍群划分时,从进化树的根部从左往右分析,若某个节点snp为突变型(即阳性),则可沿这个分枝继续往右分析,若某节点为阴性,则该节点上一个snp位点所定义的单倍群为该样本所在的亚单倍群。
基于20个y染色体单倍群d的snp遗传标记法医学复合检测试剂盒的电泳分型结果如图2所示。图2a为标准dna2800m的分型结果;图2b和c分别是127和131样本的分型结果。图2中可以看到标准dna2800m和粗分为单倍群d的127和131样本均可以清晰地分辨所有20个y染色体snp位点的等位基因。
序列表
<110>四川大学
<120>基于20个单倍群d的y-snp遗传标记的法医学复合检测试剂盒
<130>a180466k(序)
<141>2018-07-10
<160>60
<170>siposequencelisting1.0
<210>1
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>1
gaggctgaggcacgagaatg20
<210>2
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>2
cctaaattatgggaaatcaagctctgt27
<210>3
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>3
gctgatgccaacacacaaagag22
<210>4
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>4
ccatgtcccagggtgaaatcc21
<210>5
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>5
acacaaccaacaacaataaacaatct26
<210>6
<211>28
<212>dna
<213>人工序列(artificialsequence)
<400>6
ccatactatcatgaagaatgaagtccat28
<210>7
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>7
cacccagagttataaatcgtccatc25
<210>8
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>8
caccaatgttagtaaatgctgaacttt27
<210>9
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>9
aggtcacaatccacagcaagtt22
<210>10
<211>29
<212>dna
<213>人工序列(artificialsequence)
<400>10
ctatactcaatttgatgtaaagccaacaa29
<210>11
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>11
aagtgtgtcttatcagagttcctttc26
<210>12
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>12
tatggaggtgtaaagaagatgatttgg27
<210>13
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>13
tgctgacagtgtgcttccatt21
<210>14
<211>28
<212>dna
<213>人工序列(artificialsequence)
<400>14
aacattgccaagagaagtagatataacc28
<210>15
<211>18
<212>dna
<213>人工序列(artificialsequence)
<400>15
gcagcagcaggagccaag18
<210>16
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>16
tctgtactacctaaatgcaagtgtca26
<210>17
<211>29
<212>dna
<213>人工序列(artificialsequence)
<400>17
cagttacaaagaaattagagcaagtagtt29
<210>18
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>18
gccaccctctgccatatagc20
<210>19
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>19
gcttgctttattcttcttcttctcct26
<210>20
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>20
tttacttgtctgttcctaaaggttcac27
<210>21
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>21
acaagcaacaagttacatacattcctc27
<210>22
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>22
gactaacaacaggctgtgagtgatt25
<210>23
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>23
attggactcttgtgctagtggg22
<210>24
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>24
cctgtggttctgctgttattgc22
<210>25
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>25
tgtgtatcactcctgcttccaa22
<210>26
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>26
gcctctctacacctcatccataa23
<210>27
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>27
gagaagatccattattgtgcctgtg25
<210>28
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>28
gtgcccactcttgaggtcct20
<210>29
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>29
gaaagagaggagggtcacttcac23
<210>30
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>30
tcagcacttaggtcatgtttctact25
<210>31
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>31
tttccttccctccttccctttct23
<210>32
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>32
actttgtggcaccgagcattt21
<210>33
<211>27
<212>dna
<213>人工序列(artificialsequence)
<400>33
cttgtatgaaggtactagcacagagat27
<210>34
<211>29
<212>dna
<213>人工序列(artificialsequence)
<400>34
tcctaagagagtgagtttaatttggtttc29
<210>35
<211>25
<212>dna
<213>人工序列(artificialsequence)
<400>35
gttattccattccatgatggttgct25
<210>36
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>36
agactactgaggcgaactactga23
<210>37
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>37
tcaaggcaccacgaagaactc21
<210>38
<211>24
<212>dna
<213>人工序列(artificialsequence)
<400>38
cttatgtgaaaccagtccctgatg24
<210>39
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>39
atcaaggcaaggacatacctctg23
<210>40
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>40
tcaccagggcatcagcaaga20
<210>41
<211>23
<212>dna
<213>人工序列(artificialsequence)
<400>41
gcctctggagatcgcgccactgc23
<210>42
<211>26
<212>dna
<213>人工序列(artificialsequence)
<400>42
gcctagggccaactcataacgtgaag26
<210>43
<211>29
<212>dna
<213>人工序列(artificialsequence)
<400>43
gccataccttgcctctgaaattttcagtt29
<210>44
<211>32
<212>dna
<213>人工序列(artificialsequence)
<400>44
gcaactaacccataaaaaaacaagcaactgta32
<210>45
<211>35
<212>dna
<213>人工序列(artificialsequence)
<400>45
gcctcctcccctccccgctgccaacaggggacaag35
<210>46
<211>40
<212>dna
<213>人工序列(artificialsequence)
<400>46
gcctcctcccctcctcccatgtagtatcaaggaactaaaa40
<210>47
<211>43
<212>dna
<213>人工序列(artificialsequence)
<400>47
gcctcctcccctccatccaaagaattgtttttaatgtctgaat43
<210>48
<211>46
<212>dna
<213>人工序列(artificialsequence)
<400>48
gcctcctcccctcccctccctcttgctgttgttatgatgcactctt46
<210>49
<211>50
<212>dna
<213>人工序列(artificialsequence)
<400>49
gcctcctcccctcccctcccctcccatttgcaaagagagaatctgcaaat50
<210>50
<211>53
<212>dna
<213>人工序列(artificialsequence)
<400>50
gcctcctcccctcccctcccctcccctctctgaaatgaggttgctgaaagatg53
<210>51
<211>55
<212>dna
<213>人工序列(artificialsequence)
<400>51
gcctcctcccctcccctcccctcccctccctatagcacaggcaagagaatatggg55
<210>52
<211>58
<212>dna
<213>人工序列(artificialsequence)
<400>52
gcctcctcccctcccctcccctcccctcccttaaaaaattaatgacaacttagggcca58
<210>53
<211>61
<212>dna
<213>人工序列(artificialsequence)
<400>53
gcctcctcccctcccctcccctcccctcccctcggacaaagccctttctgaatataagaa60
c61
<210>54
<211>64
<212>dna
<213>人工序列(artificialsequence)
<400>54
gcctcctcccctcccctcccctcccctcccctcccctcccctccccggatttggccacag60
gggc64
<210>55
<211>67
<212>dna
<213>人工序列(artificialsequence)
<400>55
gcctcctcccctcccctcccctcccctcccctcccctccctgtggtcacttttatacctt60
ggttttg67
<210>56
<211>70
<212>dna
<213>人工序列(artificialsequence)
<400>56
gcctcctcccctcccctcccctcccctcccctcccctcccctcccctccccgacctaggg60
ggctgaggca70
<210>57
<211>73
<212>dna
<213>人工序列(artificialsequence)
<400>57
gcctcctcccctcccctcccctcccctcccctcccctcccctcccattgaaacagctatt60
taaaaaaatgccc73
<210>58
<211>76
<212>dna
<213>人工序列(artificialsequence)
<400>58
gcctcctcccctcccctcccctcccctcccctcccctcccctcccctcccctgatggttg60
ctgtaaaaatttccca76
<210>59
<211>79
<212>dna
<213>人工序列(artificialsequence)
<400>59
gcctcctcccctcccctcccctcccctcccctcccctcccctcccctcccctccgaagaa60
ctcagacaaaaagcttcag79
<210>60
<211>82
<212>dna
<213>人工序列(artificialsequence)
<400>60
gcctcctcccctcccctcccctcccctcccctcccctcccctcccctcccctcccctccc60
ctcttgcctgggccagtgacta82