高通量检测STR遗传标记的建库试剂盒的制作方法

文档序号:11126227阅读:676来源:国知局
高通量检测STR遗传标记的建库试剂盒的制造方法与工艺
本发明属于法医遗传学领域,涉及一种将高通量测序技术用于法医亲缘关系鉴定,基于NGS测序分析常染色体STR遗传标记的建库试剂盒。
背景技术
:法医DNA检测技术就是通过对遗传物质DNA的序列多态性及长度多态性的检验来进行法医学的个体识别及亲权鉴定。如今,该技术在侦查破案、查找被拐卖儿童和无名尸源、死亡案件个体识别以及证实犯罪等方面发挥了显著作用,已成为法医物证检验的常规技术,为打击违法犯罪提供了强有力的武器。法医DNA检验技术的研究和分析对象主要是生物体内DNA的多态性。人类基因组DNA多态性源于基因组DNA中的碱基突变,变异后的基因遗传给子代,显示出DNA分子水平上的个体差异。一般来说,基因或非编码区的DNA标记在染色体上的位置称为基因座,而位于同一个基因座上不同序列的基因被称为等位基因。DNA多态性就是指作为遗传标记的基因座存在多个等位基因,分析基因座上等位基因的差异就是实现同一认定的生物学基础[1]。DNA多态性包括长度多态性,即一类表现在特定基因座上相关序列长度上的个体差异。长度多态性多存在于基因组DNA中的一类串联重复序列,其串联重复单位(核心序列)数目在人群中存在较大差异,具有高度多态性,称此重复为可变数目串联重复序列(VNTRs);根据重复单位长度,分为二类:重复单位长度为10~70bp,称为小卫星;长度为2~6bp的,称为微卫星,或叫STR。按孟德尔遗传规律,子代DNA的特定序列来自双亲,即在同源染色体中,位于同一位置上的两个等位基因,一个从母亲处继承,另一个从父亲处继承,这两个等位基因可相同也可不同。这种符合孟德尔遗传规律、具有个体特异性的DNA多态性便是进行个体识别和亲子鉴定的理论基础[2]。法医DNA检验技术经历了多位点DNA指纹图分析技术、扩增片段长度多态性分析技术(AMP-FLP)、线粒体DNA检测技术三大技术革命。目前已发展到以荧光标记多基因座STR复合扩增检测技术[3]、线粒体DNA检测技术和SNP分析技术为主导的技术体系。随着DNA检测技术的进一步发展和成熟,目前荧光标记PCR-STR检测方法已成为亲子鉴定的首选技术。该技术首先在扩增引物上附上荧光发光基团,当带有发光基团的DNA片段经过激发光照射区时发出对应波长的荧光,该荧光光谱信息被光电检测器采集后,由电子系统及计算机进行储存并处理。通过比对样品光谱信号与标准比对品(标准比对品是一系列大小不同但长度已知的DNA片段)信号出现时间,计算出相应DNA片段的长度大小,从而得到检测结果。然后,根据荧光的光谱范围,检测结果参照所扩增位点的全等位基因混合物,就能知道所检测到的DNA片段等位基因命名,记录下来就是该样本在该位点下的DNA分型。但是,这种方法也存在着些缺陷。主要有:(1)荧光标记物相互干扰,成像技术的局限性,被分析基因座的数目十分有限。(2)影子带(Stutter峰)干扰,由于PCR反应在引物延伸过程中,引物链或模板链滑脱,导致一个重复单位形成的碱基非配对环,即链滑脱错配机制,最终产生Stutter峰从而影响真实的核心重复序列的重复次数。技术实现要素:本发明的目的在于提供一种高通量检测STR遗传标记的建库试剂盒。利用该试剂盒可以通过一次扩增实现STR基因座扩增子测序文库的构建,简化建库的操作过程,降低建库的时间和成本,同时不影响测序质量。根据本发明的一个方面,提供高通量检测STR遗传标记的建库试剂盒,其中包括多对用于扩增目的STR基因座的融合引物,每对融合引物分别针对DNA模板上的不同STR基因座,每对融合引物从5'端到3'端依次包含测序接头序列和针对STR基因座的特异性引物序列;其中所述不同STR基因座包括选自下述的两种或更多种STR基因座:CSF1PO(GenBankX14720)、FGA(GenBankM64982)、TH01(GenBankD00269)、TPOX(GenBankM68651)、D3S1358(NT_005997positions754983-755121)、D5S818(GenBankAC008512)、D7S820(GenBankAC004848)、D8S1179(GenBankAF216671)、D13S317(GenBankAL353628)、D16S539(GenBankAC024591)、D18S51(GenBankAP001534)、D21S11(GenBankAP000433)、D2S1338(GenBankAC010136)、CD4(GenbankM86525)、D12S391(GenbankM08921)、PLA2A1(GenbankM22970)和FABP(GenbankM18079);其中针对各个STR基因座的的特异性引物序列包括如下所示的特异性正向引物序列和反向引物序列:CSF1PO:正向5'-3':TAGCAGGTTGCTAACCACCC,反向5'-3':TCAGACCCTGTTCTAAGTACTTC;FGA:正向5'-3':CCCATAGGTTTTGAACTCACAG,反向5'-3':GTGATTTGTCTGTAATTGCCAGC;TH01:正向5'-3':GGGCAAAATTCAAAGGGTATCTG,反向5'-3':TGCAGGTCACAGGGAACAC;TPOX:正向5'-3':AGGCACTTAGGGAACCCTC,反向5'-3':TCCTTGTCAGCGTTTATTTGCC;D3S1358:正向5'-3':CAAGACCCTGTCTCATAGATAG,反向5'-3':TCAACAGAGGCTTGCATGTATC;D5S818:正向5'-3':GTGACAAGGGTGATTTTCCTCTT,反向5'-3':GTGATTCCAATCATAGCCACAG;D7S820:正向5'-3':GGTCAGGCTGACTATGGAG,反向5'-3':TCCTCATTGACAGAATTGCACC;D8S1179:正向5'-3':TCTTTTTGCCCACACGGCC,反向5'-3':CTGTAGATTATTTTCACTGTGGGG;D13S317:正向5'-3':ATTTCTTTAGTGGGCATCCGTG,反向5'-3':CCTTCAACTTGGGTTGAGCC;D16S539:正向5'-3':CAGATCCCAAGCTCTTCCTC,反向5'-3':GCATGTATCTATCATCCATCTCTG;D18S51:正向5'-3':CACTTCACTCTGAGTGACAAATTG,反向5'-3':GTGTGGAGATGTCTTACAATAACAG;D21S11:正向5'-3':TCAATTCCCCAAGTGAATTGCC,反向5'-3':TGTTCTCCAGAGACAGACTAATAG;D2S1338:正向5'-3':GTGGATTTGGAAACAGAAATGGC,反向5'-3':GTGGCCCATAATCATGAGTTATTC;CD4:正向5'-3':AGGGGTACTTGTGTTAATTGTTGG,反向5'-3':GCGTTTTCCAGTCTGAAAAAAGTG;D12S391:正向5'-3':GAATCAACAGGATCAATGGATGC,反向5'-3':CCTCCATATCACTTGAGCTAATTC;FABP:正向5'-3':TTGTAAGCTCCATGAGGTTAGAG,反向5'-3':AGCCTCCCTAGGTCAGATAG;PLA2A1:正向5'-3':TAGTATCAGTTTCATAGGGTCACC,反向5'-3':AGTTCGTTTCCATTGTCTGTCC。本发明中,所述“多对融合引物”是指两对、三对、或更多对融合引物。优选在本发明的试剂盒中包括针对上述所有STR基因座的融合引物对。在一些实施方案中,测序接头序列中包含index序列,以标识不同的DNA模板,便于将不同样品混合测序。本发明中融合引物中所包含的测序接头序列可以是:上游引物中5'-CCTCTCTATGGGCAGTCGGTGAT-3',下游引物中5'-CCATCTCATCCCTGCGTGTCTCCGACTCAG-index序列-CGAT-3'。在一些实施方案中,融合引物以一种或多种融合引物混合物的形式被包括在本发明的试剂盒中。每种融合引物混合物中包含两个、三个、四个、五个或更多个融合引物对。在优选的实施方案中,本发明的试剂盒包含五种融合引物混合物,它们分别是:包含针对TPOX基因座的融合引物和针对D18S51基因座的融合引物的混合物;包含针对D8S1179基因座的融合引物和针对D21S11基因座的融合引物的混合物;包含针对CSF1PO基因座的融合引物、针对D3S1358基因座的融合引物、针对D13S317基因座的融合引物和针对D12S391基因座的融合引物的混合物;包含针对FGA基因座的融合引物、针对TH01基因座的融合引物、针对D5S818基因座的融合引物和针对PLA2A1基因座的融合引物的混合物;和包含针对D7S820基因座的融合引物、针对D16S539基因座的融合引物、针对D2S1338基因座的融合引物、针对CD4基因座的融合引物和FABP引物的混合物。在更优选的实施方案中,本发明的试剂盒包含五种融合引物混合物,它们分别是:包含1.5μM针对TPOX基因座的融合引物和3.5μM针对D18S51基因座的融合引物的混合物;包含1.5μM针对D8S1179基因座的融合引物和3.5μM针对D21S11基因座的融合引物的反应体系;包含1μM针对CSF1PO基因座的融合引物、2μM针对D3S1358基因座的融合引物、1μM针对D13S317基因座的融合引物和1μM针对D12S391基因座的融合引物的混合物;包含1μM针对FGA基因座的融合引物、1.5μM针对TH01基因座的融合引物、1.5μM针对D5S818基因座的融合引物和1μM针对PLA2A1基因座的融合引物的混合物;和包含1μM针对D7S820基因座的融合引物、1μM针对D16S539基因座的融合引物、1μM针对D2S1338基因座的融合引物、1μM针对CD4基因座的融合引物和1μMFABP引物的混合物。本发明的试剂盒还可以包括一种或多种高通量检测STR基因座时建库所需的其它成分,这些成分包括但不限于Taq聚合酶、PCR缓冲液、dNTPs、ddH2O、等位基因STR分型标准物中的一种或几种,或其全部。本发明的试剂盒中可以包括PCRbuffermix混合液(例如可以是ThermoFisher,DreamTaqGreenPCRMasterMix2X,货号K1081)、ddH2O、等位基因STR分型标准物。其中,等位基因STR分型标准物由所述17个STR基因座的等位基因分型已知的核型正常的细胞系基因组DNA构成,其中不同STR基因座对应的核心重复序列重复次数各异。本发明试剂盒可用于扩增各个STR基因座的DNA片段,以用于高通量测序,下机数据可用已设计好的程序来分析,最终读取待测样品对应的STR基因座核心重复单位的重复次数值,快速进行下游法医学应用。利用本发明的试剂盒可以实现准确、低成本、高通量地对人类DNA不同的STR基因多态性进行分析,从而确认待测样品的法医学相关信息,可用于身份确立、亲缘关系鉴定、细胞系鉴定、大人群STR信息数据库建立等。本发明的试剂盒可用于亲属间的亲权关系鉴定和混合斑精液等生物样品个体识别;本发明所涉及的STR遗传标记均经证实多态性较好,且相互之间不连锁,从而使系统具有高效能。本发明的试剂盒包括了特有的STR的等位基因分型混合物,确保由于高通量测序过程可能出现的误差从而干扰待测样品STR基因座多态性信息的真实值;该试剂盒复合扩增产物最短160bp,最长339bp,Iontorrent测序读长最短94bp,最长273bp,故本试剂盒对于法医学常见的检材的检测具有优势;由于测序分析每个待测样品的STR基因座多态性的数据量不大,所以一次性测序上机可对几千人的STR基因座多态性信息进行分析,较之传统的荧光标记PCR-STR检测方法,极大地节省了检测成本,也不用担心荧光标记物之间的相互干扰。附图说明图1是实施例1中多重PCR反应产物的琼脂糖凝胶电泳图。图2是实施例1中的文库质检图。图3是实施例1中每个STR的测序数据中不同重复次数的分布图。具体实施方式为了能够更清楚地理解本发明的技术内容,特举以下实施例结合附图详细说明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。实施例中所用到的各种化学试剂和生物制剂,均为市售产品。实施例1:法医亲缘关系鉴定本实施例目的为检测STR中重复序列的重复次数,其中使用NGS测序方案。一、口腔上皮细胞采集与处理(1)用口腔拭子采集管采集人的口腔上皮细胞。(2)用口腔拭子基因组提取试剂盒(DP322)提取口腔上皮细胞DNA。(3)使用Nanodrop2000型分光光度计测定OD260nm和OD280nm,确认其纯度高,并测定其浓度。二、多重PCR反应引物设计(1)引物设计成融合引物,包括目的片段的特异性引物序列和测序接头序列,其中含有index序列。(2)融合引物结构为:上游引物:5’-CCTCTCTATGGGCAGTCGGTGAT-3'+目的片段特异性正向引物;下游引物:5'-CCATCTCATCCCTGCGTGTCTCCGACTCAGCTAAGGTAACGAT-3'+目的片段特异性反向引物;其中下划线序列为index序列。(3)待扩增和测序的STR基因座以及对应的特异性引物见表3。表3STR基因座对应的特异性引物STR基因座正向引物5'-3'反向引物5'-3'CSF1POTAGCAGGTTGCTAACCACCCTCAGACCCTGTTCTAAGTACTTCFGACCCATAGGTTTTGAACTCACAGGTGATTTGTCTGTAATTGCCAGCTH01GGGCAAAATTCAAAGGGTATCTGTGCAGGTCACAGGGAACACTPOXAGGCACTTAGGGAACCCTCTCCTTGTCAGCGTTTATTTGCCD3S1358CAAGACCCTGTCTCATAGATAGTCAACAGAGGCTTGCATGTATCD5S818GTGACAAGGGTGATTTTCCTCTTGTGATTCCAATCATAGCCACAGD7S820GGTCAGGCTGACTATGGAGTCCTCATTGACAGAATTGCACCD8S1179TCTTTTTGCCCACACGGCCCTGTAGATTATTTTCACTGTGGGGD13S317ATTTCTTTAGTGGGCATCCGTGCCTTCAACTTGGGTTGAGCCD16S539CAGATCCCAAGCTCTTCCTCGCATGTATCTATCATCCATCTCTGD18S51CACTTCACTCTGAGTGACAAATTGGTGTGGAGATGTCTTACAATAACAGD21S11TCAATTCCCCAAGTGAATTGCCTGTTCTCCAGAGACAGACTAATAGD2S1338GTGGATTTGGAAACAGAAATGGCGTGGCCCATAATCATGAGTTATTCCD4AGGGGTACTTGTGTTAATTGTTGGGCGTTTTCCAGTCTGAAAAAAGTGD12S391GAATCAACAGGATCAATGGATGCCCTCCATATCACTTGAGCTAATTCFABPTTGTAAGCTCCATGAGGTTAGAGAGCCTCCCTAGGTCAGATAGPLA2A1TAGTATCAGTTTCATAGGGTCACCAGTTCGTTTCCATTGTCTGTCC三、多重PCR反应建库以及核酸琼脂糖凝胶电泳分五组进行多重PCR反应,分组情况以及各种引物浓度如表4所示。表4多重PCR引物分组情况多重PCR所用试剂为DreamTaqGreenPCRMasterMix2X(ThermoFisher,货号K1081),反应体系见表5:表5多重PCR反应体系采用缓慢降温法进行多重PCR反应,反应条件如表6所示。表6多重PCR反应条件对PCR反应产物进行琼脂糖凝胶电泳,电泳的条件设定为:电压120V,电流400mA,时间是30min,胶浓度是1.5%,marker条带标准从下至上依次是:100bp、200bp、300bp、400bp、500bp、700bp、1kb、1600bp、2kb、5kb、8kb、10kb,结果如图1所示,5组多重PCR反应均能扩增出目的条带,而且目的条带出现的位置均在预期的范围内。用SanPrep柱式PCR产物纯化试剂盒(上海生工,货号B518141)纯化预先混合过的五组多重PCR产物,按制造商说明进行纯化,得到用于测序的DNA文库。Nanodrop分光光度计测得纯化后的DNA文库浓度为128.73ng/μl,260/280值为1.944。四、文库质检文库质检由Agilent2100来完成,质检结果如图2所示,由图形可以看出多重PCR扩增效果较为均一,没有扩增差异极大的偏好性,可以直接进行高通量测序。五、大规模测序(1)利用上述制备的DNA测序文库用Iontorrent平台SE400进行高通量测序,测序完成后,结果输出为FASTQ格式文件,测序数据量67M,测得匹配到STR基因座的reads数量为490536。六、测序数据处理(1)截取每个read的前、后20-30个碱基从而定位每个read属于哪个STR基因座,若该read无法定位到目标STR基因座上则弃掉。每种STR匹配到的reads数见表7。表7各STR基因座所定位的reads数目(2)由于多重PCR反应在引物延伸过程中,引物链或模板链滑脱,导致一个重复单位形成的碱基非配对环,即链滑脱错配机制,最终产生影子带(Stutter)。为方便分析影子带的影响,最终以测序数据中每个STR对应reads上分析得到的核心重复单位的重复次数类型为横坐标,以每种类型所对应的reads数的百分比为纵坐标,做直方图,如图3(a-q)所示。(4)测试样品中每个STR基因座重复单位的次数如表8:表8每个STR基因座重复单位的次数当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1